Mô hình ngôn ngữ lớn không đồng nghĩa với trí thông minh

Minh Phú
09:28 - 27/11/2025

Nếu tin vào khoa học về trí tuệ con người và quan sát các hệ thống AI hiện tại, ta thấy mô hình ngôn ngữ lớn không phải là trí thông minh.

ChatGPT, Claude, Gemini, và các sản phẩm AI của Meta đều là các mô hình ngôn ngữ lớn (LLM). Các LLM này thu thập và phân tích lượng lớn dữ liệu ngôn ngữ từ internet, xác định mối tương quan giữa các từ (token), rồi dự đoán đầu ra dựa trên đầu vào. Mặc dù phức tạp, về cơ bản chúng là các mô hình ngôn ngữ.

Ngôn ngữ lớn, không đồng nghĩa với trí thông minh- Ảnh 1.

Mark Zuckerberg dự đoán siêu trí tuệ sắp xuất hiện, mở ra khả năng sáng tạo và khám phá vượt sức tưởng tượng. Dario Amodei (CEO Anthropic) ước tính AI mạnh mẽ có thể thông minh hơn cả người đoạt giải Nobel vào năm 2026, hứa hẹn kéo dài tuổi thọ và thậm chí thoát khỏi cái chết. Sam Altman khẳng định đã tìm ra cách xây dựng AGI, cho rằng AI siêu trí tuệ sẽ thúc đẩy khám phá khoa học vượt xa khả năng của con người.

Cỗ máy thổi phồng AI liên tục khuếch đại ý tưởng về một trí tuệ ngang tầm hoặc vượt trội con người sắp xuất hiện, chỉ cần thu thập dữ liệu khổng lồ, kết hợp với sức mạnh tính toán vượt trội (như chip Nvidia) để cải thiện tương quan thống kê. Tuy nhiên, lý thuyết "mở rộng là tất cả" này thiếu sót nghiêm trọng. LLM chỉ mô phỏng giao tiếp ngôn ngữ, không phải tư duy và lý luận thực sự. Chúng ta dùng ngôn ngữ để suy nghĩ, nhưng ngôn ngữ không phải là tư duy.

Khoa học thần kinh hiện đại cho thấy tư duy phần lớn độc lập với ngôn ngữ. Do đó, không có lý do chính đáng để tin rằng mô hình hóa ngôn ngữ ngày càng tinh vi sẽ tạo ra trí thông minh ngang bằng hoặc vượt trội trí thông minh của con người. Ngôn ngữ dùng để truyền đạt kết quả của tư duy, lý luận, và khái quát hóa, chứ không phải là bản thân tư duy. Hiểu rõ sự khác biệt này rất quan trọng để phân biệt khoa học thực tế với những suy đoán khoa học viễn tưởng từ các CEO cuồng AI.

NGÔN NGỮ CHỦ YẾU LÀ CÔNG CỤ ĐỂ GIAO TIẾP HƠN LÀ ĐỂ SUY NGHĨ

Năm 2024, Evelina Fedorenko (MIT), Steven T. Piantadosi (UCBerkeley) và Edward AF Gibson (MIT) công bố bài bình luận trên tạp chí Nature: "Ngôn ngữ chủ yếu là công cụ để giao tiếp hơn là để suy nghĩ", tóm tắt nhiều thập kỷ nghiên cứu về mối quan hệ giữa ngôn ngữ và tư duy, với hai mục đích chính:

- Phá bỏ quan niệm cho rằng ngôn ngữ tạo ra khả năng suy nghĩ và lý luận 

- Ngôn ngữ phát triển như một công cụ văn hóa để chia sẻ suy nghĩ

Tước bỏ ngôn ngữ, không tước bỏ khả năng tư duy

Đầu tiên, khi suy ngẫm, ta thường cảm thấy tư duy gắn liền với ngôn ngữ. Tuy nhiên, nếu ngôn ngữ là yếu tố thiết yếu, việc mất đi ngôn ngữ sẽ tước đoạt khả năng tư duy. Điều này không đúng. Bằng chứng thực nghiệm cho thấy mất ngôn ngữ không đồng nghĩa với mất tư duy. Chụp cộng hưởng từ chức năng (fMRI) cho thấy các hoạt động nhận thức khác nhau, như giải toán hay thấu hiểu người khác, kích hoạt các vùng não khác biệt với vùng ngôn ngữ, hoạt động như một phần của các mạng lưới riêng biệt.

Ngôn ngữ lớn, không đồng nghĩa với trí thông minh- Ảnh 2.

Kết quả chụp MRI thể hiện các vùng hoạt động nhận thức khác nhau trên não bộ.

Thứ hai, các nghiên cứu về người mất ngôn ngữ do tổn thương não cho thấy rõ ràng rằng mất ngôn ngữ không làm suy giảm đáng kể khả năng tư duy. Fedorenko và cộng sự nhấn mạnh rằng, dù gặp khó khăn về ngôn ngữ, những người này vẫn có thể giải toán, tuân thủ hướng dẫn phi ngôn ngữ, hiểu động cơ người khác và lập luận, bao gồm cả lập luận logic hình thức và nhân quả.

Để tự mình thấy rõ, hãy quan sát một em bé khi đang thức. Bạn sẽ thấy một sinh linh tò mò khám phá thế giới, chơi đùa, tạo âm thanh, bắt chước và học hỏi. Theo nhà khoa học nhận thức Alison Gopnik: "Trẻ em tìm hiểu thế giới như các nhà khoa học - thử nghiệm, phân tích và hình thành các lý thuyết trực quan", sử dụng các công cụ nhận thức ngay cả trước khi biết nói. Dù chưa thể diễn đạt bằng lời, trẻ sơ sinh vẫn tư duy. Niềm vui khi chứng kiến sự phát triển nhận thức của con trẻ là điều mà mọi bậc cha mẹ đều cảm nhận được, ít nhất là cho đến tuổi dậy thì.

Về mặt khoa học, ngôn ngữ chỉ là một phần của tư duy, trí thông minh con người chủ yếu nằm ở năng lực phi ngôn ngữ. Vậy tại sao trực giác của nhiều người lại khác?

Điều này dẫn đến tuyên bố thứ hai của Fedorenko và cộng sự (Nature): Ngôn ngữ chủ yếu là công cụ giao tiếp suy nghĩ, một "mã giao tiếp hiệu quả". Bằng chứng là sự đa dạng ngôn ngữ loài người đều có những đặc điểm chung giúp chúng dễ tạo, dễ học, dễ hiểu, ngắn gọn, hiệu quả và chống nhiễu.

Nếu lấy đi ngôn ngữ khỏi LLM, nó hoàn toàn vô nghĩa

Không đi sâu vào ngôn ngữ học, điều quan trọng là loài người hưởng lợi to lớn từ ngôn ngữ trong việc chia sẻ kiến thức hiện tại và truyền lại qua các thế hệ. Như nhà khoa học nhận thức Cecilia Heyes nhận định, ngôn ngữ cho phép con người học hỏi từ người khác một cách hiệu quả, trung thực và chính xác.

Nhận thức của chúng ta được ngôn ngữ củng cố, nhưng không do ngôn ngữ tạo ra hay định nghĩa.

Mất đi khả năng ngôn ngữ, chúng ta vẫn có thể suy nghĩ, lý luận, tin tưởng, yêu thương và sống cuộc đời mình; phạm vi trải nghiệm và tư duy vẫn rộng lớn.

Ngược lại, lấy đi ngôn ngữ khỏi LLM, nó hoàn toàn vô nghĩa.

Ngôn ngữ lớn, không đồng nghĩa với trí thông minh- Ảnh 3.

Mô phỏng trí thông minh tổng quát AIG từ các nhà nghiên cứu của Trung tâm An toàn AI. Ảnh chụp màn hình

Người đam mê AI có thể cho rằng trí tuệ nhân tạo không nhất thiết phải mô phỏng nhận thức con người. AI đã vượt trội hơn người trong cờ vua bằng các phương pháp khác biệt; do đó, AI có thể đạt siêu trí tuệ bằng cách khai thác tương quan từ dữ liệu.

Điều này có thể xảy ra, nhưng không có bằng chứng thuyết phục nào cho thấy việc đào tạo dựa trên văn bản có thể tạo ra trí tuệ tổng quát (chứ không chỉ cải thiện các tác vụ cụ thể). Kiến thức của con người bao gồm nhiều điều không thể dễ dàng biểu diễn bằng ngôn ngữ, ví dụ như việc đi xe đạp.

Ngôn ngữ lớn, không đồng nghĩa với trí thông minh- Ảnh 4.

Yann LeCun - người được coi là "cha đẻ" của trí tuệ nhân tạo.

Trong cộng đồng nghiên cứu AI, ngày càng có sự đồng thuận rằng các mô hình ngôn ngữ lớn (LLM) không phải là mô hình đầy đủ về trí thông minh con người. Yann LeCun đã rời Meta để thành lập một startup AI phát triển: "mô hình thế giới" - hệ thống hiểu thế giới vật lý, có trí nhớ, suy luận và lập kế hoạch hành động phức tạp. 

Gần đây, Trung tâm An toàn AI, cùng với các nhà khoa học AI và nhà tư tưởng hàng đầu như Yoshua Bengio (người đoạt giải Turing), Eric Schmidt và Gary Marcus, đã đưa ra định nghĩa về AGI: "AI có thể sánh ngang hoặc vượt trội về tính linh hoạt và trình độ nhận thức của một người trưởng thành có học thức". Họ đề xuất một mô hình nhận thức phức tạp, bao gồm nhiều khả năng riêng biệt, thay vì coi trí thông minh là một năng lực đơn khối.

MÔ HÌNH NGÔN NGỮ LỚN VÀ RÀO CẢN TỪ MÔ PHỎNG TƯ DUY CON NGƯỜI ĐẾN KHẢ NĂNG ĐỘT PHÁ

Việc tổng hợp các năng lực nhận thức riêng lẻ của con người để tạo ra "trí thông minh tổng quát" trong AI là một thách thức lớn. Các câu hỏi đặt ra là: Làm thế nào để định lượng và kết hợp các năng lực này? Ta nên coi trọng yếu tố nào hơn? Và làm thế nào để định nghĩa chính xác "kiến thức" hay "tốc độ" trong AI? 

Dù các chuyên gia đều nhận định rằng việc chỉ đơn thuần mở rộng quy mô các mô hình ngôn ngữ hiện có sẽ không đủ để đạt được mục tiêu này, lộ trình cụ thể vẫn còn là một ẩn số. Các đề xuất hiện nay tập trung vào việc xác định mục tiêu cuối cùng hơn là cung cấp một lộ trình rõ ràng để đến đó.

Tuy nhiên, hãy giả sử rằng trong tương lai gần, chúng ta sẽ thành công trong việc xây dựng một hệ thống AI có khả năng thực hiện xuất sắc nhiều nhiệm vụ nhận thức phức tạp. Liệu hệ thống đó có thực sự sở hữu loại trí thông minh có thể dẫn đến những khám phá khoa học mang tính đột phá, như những gì các CEO công nghệ lớn đang hứa hẹn? Câu trả lời có thể là: "Không chắc chắn". Bởi vì vẫn còn một rào cản quan trọng cuối cùng: "Ngay cả việc mô phỏng cách con người hiện đang suy nghĩ cũng không đảm bảo rằng AI có thể đạt được những bước nhảy vọt về nhận thức mà nhân loại đã đạt được trong lịch sử".

Ngôn ngữ lớn, không đồng nghĩa với trí thông minh- Ảnh 5.

Mark Zuckerberg từng chia sẻ mong muốn
mọi người đọc cuốn sách triết học mang tính bước ngoặt này từ những năm 1960 của Thomas Kuhn. Cuốn sách "Cấu trúc của các cuộc cách mạng khoa học" là một trong những cuốn sách học thuật được trích dẫn nhiều nhất mọi thời đại, đưa tác giả trở thành "nhà triết học khoa học có ảnh hưởng nhất" trong thế kỷ 20.

Khái niệm "mô hình khoa học" của Thomas Kuhn trong cuốn "Cấu trúc của các cuộc cách mạng khoa học" có thể làm rõ hơn điều trên. Kuhn cho rằng những mô hình này không thay đổi thông qua thử nghiệm lặp đi lặp lại, mà là khi những câu hỏi và ý tưởng mới không còn phù hợp với các mô tả khoa học hiện có về thế giới. Ví dụ điển hình là thuyết tương đối của Einstein đã được hình thành trước khi có bất kỳ bằng chứng thực nghiệm nào xác nhận nó.

Dựa trên quan điểm này, nhà triết học Richard Rorty lập luận rằng chính sự không hài lòng của các nhà khoa học và nghệ sĩ với các mô hình (hay từ vựng) hiện có đã thúc đẩy họ tạo ra những ẩn dụ mới, từ đó hình thành những mô tả mới về thế giới. Nếu những ý tưởng mới này hữu ích, chúng sẽ trở thành hiểu biết chung của chúng ta về sự thật. 

Theo quan niệm hiện tại, một hệ thống AI được kỳ vọng sẽ dự đoán và sao chép những gì một con người thông minh sẽ làm hoặc nói khi đối mặt với một câu hỏi hoặc tình huống nhất định. Những dự đoán này được đưa ra dựa trên việc tổng hợp và mô hình hóa dữ liệu có sẵn. AI thậm chí có thể kết hợp các mô hình mới vào hệ thống của mình một cách giống con người. Tuy nhiên, vấn đề cốt lõi là: AI không có lý do rõ ràng để "không hài lòng" với dữ liệu mà nó đang được cung cấp. Nói rộng hơn, nó thiếu động lực nội tại để tạo ra những bước nhảy vọt về khoa học và sáng tạo.

Thay vào đó, kết quả rõ ràng nhất của một hệ thống AI như vậy sẽ chỉ là một kho lưu trữ tri thức thông thường. Một hệ thống AI có thể sắp xếp lại, kết hợp và tái chế kiến thức của chúng ta theo những cách thú vị. Nhưng đó là giới hạn của nó. Nó sẽ mãi mãi bị ràng buộc bởi "vốn từ vựng" mà chúng ta đã mã hóa trong dữ liệu và được huấn luyện hoặc nói một cách ví von, mô hình ngôn ngữ lớn là một "cỗ máy ẩn dụ đã chết".

Trong khi đó, con người thực sự là những cá nhân có khả năng tư duy, lý luận và sử dụng ngôn ngữ để truyền đạt ý tưởng của mình - sẽ vẫn là lực lượng dẫn đầu trong việc chuyển đổi nhận thức của chúng ta về thế giới. Khả năng không hài lòng với hiện trạng, khả năng đặt ra những câu hỏi đột phá và khả năng tạo ra những ẩn dụ mới chính là chìa khóa cho sự tiến bộ nhận thức, một điều mà AI, LLM hiện tại vẫn chưa thể đạt được.

Nguồn: The Verge

Link nội dung: https://congdankhuyenhoc.vn/mo-hinh-ngon-ngu-lon-khong-dong-nghia-voi-tri-thong-minh-179251126151305304.htm