LongCat 2.0: Trung Quốc huấn luyện thành công AI nghìn tỷ tham số, không cần chip NVIDIA
Meituan tuyên bố huấn luyện thành công LongCat 2.0 bằng hàng chục nghìn chip nội địa. Đây là lần đầu tiên một doanh nghiệp Trung Quốc công bố đã hoàn thành quá trình huấn luyện một mô hình AI quy mô nghìn tỷ tham số mà không phụ thuộc vào chip AI của Nvidia.
Trong nhiều năm, GPU của Nvidia được xem là "vàng" của ngành trí tuệ nhân tạo. Nhưng tuyên bố mới từ Meituan cho thấy Trung Quốc đang tiến thêm một bước trên con đường tự chủ AI khi lần đầu tiên huấn luyện thành công một mô hình ngôn ngữ lớn (LLM) quy mô nghìn tỷ tham số hoàn toàn bằng hạ tầng chip trong nước.
Meituan không tiết lộ tên nhà sản xuất chip, nhưng khẳng định toàn bộ quá trình huấn luyện đều diễn ra trên hạ tầng nội địa. Nếu được kiểm chứng, đây không chỉ là thành tựu của riêng Meituan mà còn là dấu mốc quan trọng trong nỗ lực giảm phụ thuộc vào công nghệ Mỹ của Trung Quốc.

LongCat-2.0 tự hào có 1,6 nghìn tỷ tham số và cửa sổ ngữ cảnh một triệu token, ngang tầm với mô hình hàng đầu mới nhất của DeepSeek. Ảnh: SCMP
Chip nội địa mới là "nhân vật chính" của LongCat 2.0
Trong làn sóng AI tạo sinh, phần lớn các mô hình hàng đầu như GPT, Gemini hay Claude đều được huấn luyện trên GPU của Nvidia. Chính vì vậy, việc Mỹ liên tục siết chặt các quy định xuất khẩu chip AI sang Trung Quốc từng được xem là một trong những rào cản lớn nhất đối với tham vọng AI của nước này.
Tuy nhiên, thay vì chờ nguồn cung từ nước ngoài, các doanh nghiệp Trung Quốc đã chuyển hướng đầu tư mạnh vào chip nội địa và xây dựng hệ sinh thái phần cứng riêng.
Việc Meituan tuyên bố huấn luyện thành công LongCat 2.0 bằng hàng chục nghìn chip nội địa cho thấy các doanh nghiệp Trung Quốc đang tìm được hướng đi mới. Dù hiệu năng của từng con chip có thể chưa sánh bằng GPU cao cấp của Nvidia, việc mở rộng quy mô cụm tính toán giúp bù đắp phần nào khoảng cách về sức mạnh xử lý.
Theo Reuters, đây là lần đầu tiên một doanh nghiệp Trung Quốc công bố đã hoàn thành quá trình huấn luyện một mô hình AI quy mô nghìn tỷ tham số mà không phụ thuộc vào chip AI của Nvidia.

Giới thiệu mô hình LongCat 2.0 trên Github
LongCat 2.0 được thiết kế cho kỷ nguyên của tác nhân AI
Khác với nhiều mô hình ngôn ngữ lớn tập trung vào vai trò chatbot, Meituan định vị LongCat 2.0 là một mô hình hướng đến tác nhân AI - thế hệ AI có khả năng không chỉ trả lời câu hỏi mà còn tự thực hiện chuỗi tác vụ phức tạp.
Theo công bố của Meituan, LongCat 2.0 được tối ưu cho các nhiệm vụ lập trình, sử dụng công cụ và xử lý quy trình nhiều bước. Mô hình hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, cho phép phân tích lượng lớn tài liệu hoặc mã nguồn trong một lần xử lý.
Việc lựa chọn phát triển tác nhân AI phản ánh xu hướng mới của ngành công nghệ. Thay vì chỉ xây dựng chatbot trò chuyện, các doanh nghiệp đang hướng đến những hệ thống AI có thể thay người dùng hoàn thành công việc, từ viết mã, tìm kiếm thông tin cho đến đặt dịch vụ và xử lý các quy trình kinh doanh.

Ứng dụng Meituan trên điện thoại. Ảnh: Tingshu Wang
Vì sao Meituan - một công ty giao đồ ăn lại đầu tư mạnh vào AI?
Meituan được biết đến nhiều nhất với nền tảng giao đồ ăn, đặt nhà hàng, khách sạn, vé xem phim và nhiều dịch vụ địa phương tại Trung Quốc. Mỗi ngày, nền tảng này xử lý hàng chục triệu giao dịch và phục vụ hàng trăm triệu người dùng.
Chính quy mô đó khiến AI trở thành một khoản đầu tư mang ý nghĩa chiến lược.
Trong tương lai, thay vì người dùng phải tự tìm kiếm nhà hàng, so sánh giá, đặt bàn, thanh toán hay gọi đồ ăn, tác nhân AI có thể thực hiện toàn bộ quy trình chỉ từ một yêu cầu bằng ngôn ngữ tự nhiên. Điều này không chỉ giúp đơn giản hóa trải nghiệm người dùng mà còn gia tăng khả năng giữ chân khách hàng trong hệ sinh thái của Meituan.
LongCat 2.0 vì vậy không được phát triển để cạnh tranh trực tiếp với ChatGPT ở vai trò chatbot phổ thông, mà hướng tới trở thành nền tảng AI cho các dịch vụ thương mại của Meituan.
Sự thay đổi chiến lược của các doanh nghiệp công nghệ tại Trung Quốc
LongCat 2.0 cũng phản ánh sự thay đổi trong chiến lược của các doanh nghiệp công nghệ Trung Quốc.
Nếu giai đoạn đầu của AI tạo sinh tập trung vào việc phát triển các chatbot có khả năng đối thoại, thì hiện nay trọng tâm đã chuyển sang xây dựng AI có thể sử dụng công cụ, tương tác với phần mềm và tự động hóa công việc.
Alibaba với Qwen, ByteDance với Doubao, DeepSeek và nay là Meituan đều đang đầu tư vào các mô hình có khả năng hoạt động như một "trợ lý số" thay vì chỉ trả lời câu hỏi.
Xu hướng này cũng đang diễn ra ở Mỹ khi OpenAI, Google hay Anthropic đều phát triển các tác nhân AI có thể truy cập ứng dụng, sử dụng trình duyệt hoặc hoàn thành các tác vụ nhiều bước.
Việc Meituan công bố LongCat 2.0 không đồng nghĩa Trung Quốc đã vượt qua Nvidia về công nghệ chip AI. Hiệu năng thực tế của mô hình và cụm tính toán này vẫn cần được cộng đồng nghiên cứu đánh giá độc lập.
Tuy nhiên, thông báo từ Meituan cho thấy một xu hướng rõ ràng: Các doanh nghiệp Trung Quốc không còn chờ đợi quyền tiếp cận GPU tiên tiến của Mỹ để tiếp tục phát triển AI.
Trong bối cảnh các biện pháp kiểm soát xuất khẩu công nghệ ngày càng được siết chặt, khả năng xây dựng và vận hành những mô hình AI quy mô lớn bằng hạ tầng nội địa sẽ trở thành một yếu tố quan trọng quyết định năng lực cạnh tranh của mỗi quốc gia trong kỷ nguyên trí tuệ nhân tạo.
LongCat 2.0 vì thế không chỉ là một mô hình AI mới. Nó còn là tín hiệu cho thấy cuộc đua AI toàn cầu đang bước sang giai đoạn cạnh tranh về toàn bộ chuỗi công nghệ - từ chip bán dẫn, hạ tầng tính toán cho đến các mô hình AI và hệ sinh thái ứng dụng.
