Thúc đẩy phát triển mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo Việt Nam

Hồng Ngọc
19:54 - 13/09/2023
Công dân & Khuyến học trên

Dự kiến tháng 12/2023, Bộ Thông tin và Truyền thông sẽ mời một số bộ, ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của mô hình ngôn ngữ lớn (LLM) tiếng Việt và trợ lý ảo phục vụ người Việt.

Mô hình ngôn ngữ lớn Tiếng Việt phải do các doanh nghiệp Việt Nam tạo ra

Bộ Thông tin và Truyền thông mới đây đã tổ chức cuộc họp về việc triển khai thúc đẩy mô hình ngôn ngữ lớn (LLM) Tiếng Việt, phát triển Trợ lý ảo cho cán bộ, công chức, Trợ lý ảo cho người dân và Trợ lý ảo hỗ trợ rà soát văn bản quy phạm pháp luật.

Thúc đẩy phát triển mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo Việt Nam - Ảnh 1.

Cuộc họp triển khai thúc đẩy mô hình ngôn ngữ lớn (LLM) Tiếng Việt và phát triển Trợ lý ảo Việt Nam của Bộ Thông tin và Truyền thông. Ảnh: Bộ Thông tin và Truyền thông

Mô hình ngôn ngữ lớn là một loại mô hình ngôn ngữ được đào tạo bằng cách sử dụng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện các tác vụ xử lý ngôn ngữ tự nhiên khác nhau. Mô hình ngôn ngữ lớn có số lượng tham số rất lớn, có thể từ hàng tỷ đến hàng trăm tỷ. Những mô hình này có thể phát hiện các quy luật phức tạp trong ngôn ngữ và tạo ra các văn bản giống như con người tạo ra.

Tháng 11/2022, Open AI công bố ChatGPT trở thành trợ lý ảo xây dựng trên LLM đã gây ra hiệu ứng toàn cầu, gây ngạc nhiên cho tất cả các quốc gia, gồm cả các cường quốc về công nghệ và trí tuệ nhân tạo (AI) như Trung Quốc, Hàn Quốc, Nga. 

Tính đến hết 10/9/2023, mới chỉ có Baidu của Trung Quốc và Naver của Hàn Quốc công bố các mô hình ngôn ngữ lớn tiếng Trung, tiếng Hàn. Còn lại thế giới chưa có mô hình ngôn ngữ đặc thù nào khác với quy mô trên 100 tỷ tham số.

Theo số liệu gần đây của Viện Thông tin Khoa học và Công nghệ Trung Quốc, Hoa Kỳ và Trung Quốc chiếm hơn 80% lượng phân phối mô hình lớn trên thế giới. Trong đó, Hoa Kỳ dẫn đầu cuộc đua về số lượng và Trung Quốc cũng đang nhanh chóng theo kịp.

Thúc đẩy phát triển mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo Việt Nam - Ảnh 2.

Mô hình ngôn ngữ lớn là trung tâm của cuộc cách mạng trí tuệ nhân tạo. Ảnh: TNLT

Những đột phá trong xu hướng này được giới phân tích dự đoán có thể thúc đẩy 7% tăng trưởng GDP toàn cầu, tương đương gần 7.000 tỷ USD, trong vòng 10 năm tới.

Tại cuộc họp, Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng cho rằng: “Mô hình ngôn ngữ lớn là vấn đề mới, không chỉ đối với cơ quan nhà nước, mà cả đối với các doanh nghiệp công nghệ của Việt Nam”. Hiện nay, một số doanh nghiệp (Tập đoàn Viettel, Tập đoàn CMC, Công ty Cổ phần VNG,...) đã tiên phong thực hiện nhiệm vụ triển khai mô hình ngôn ngữ lớn tiếng Việt và trợ lý ảo phục vụ người Việt.

Theo kế hoạch, dự kiến tháng 12/2023 Bộ Thông tin và Truyền thông sẽ mời một số bộ, ngành, địa phương tham gia vào thử nghiệm những phiên bản đầu tiên của mô hình LLM tiếng Việt và trợ lý ảo phục vụ người Việt. Thông qua việc thử nghiệm này, chính các bộ, ngành, địa phương sẽ là người huấn luyện, đóng góp tri thức cho sự phát triển của LLM tiếng Việt và trợ lý ảo phục vụ người Việt.

Kết luận cuộc họp, Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng nhấn mạnh: “Mô hình LLM tiếng Việt và trợ lý ảo phục vụ người Việt là tác động đến nhận thức, do đó có vai trò cực kỳ quan trọng. Mỗi quốc gia, mỗi triều đại thì dân trí đều là việc quan trọng nhất. Xây dựng được LLM tiếng Việt và trợ lý ảo phục vụ người Việt có ý nghĩa vô cùng lớn trong nhiều mặt”.

Trước đó, theo Tạp chí Thông tin và Truyền thông, Tập đoàn Viettel đã được Bộ Thông tin và Truyền thông phê duyệt là đơn vị nghiên cứu, thử nghiệm phát triển mô hình ngôn ngữ lớn Tiếng Việt và trợ lý ảo cho cán bộ, công chức tại Bộ Thông tin và Truyền thông, bắt đầu thực hiện năm 2023. 

Khi triển khai nhiệm vụ này, mục tiêu chung hướng đến nhằm xây dựng, hình thành, sử dụng bộ dữ liệu chung bằng ngôn ngữ Tiếng Việt có chất lượng tốt, độ phủ rộng để phục vụ huấn luyện khả năng giao tiếp nhuần nhuyễn cho mô hình ngôn ngữ lớn Tiếng Việt.

Đặc biệt, yêu cầu sản phẩm khi tạo ra, sử dụng như nền tảng dịch vụ mô hình LLM tiếng Việt với các thành phần cơ bản bao gồm: công cụ phục vụ thu thập, xử lý, dán nhãn dữ liệu và các giao diện lập trình ứng dụng (API) phục vụ phát triển trợ lý ảo.

Bộ Thông tin và Truyền thông cũng yêu cầu, nền tảng trợ lý ảo cho cán bộ, công chức cần đáp ứng các yêu cầu cơ bản như: cho phép cán bộ viên chức tự bổ sung dữ liệu riêng, cá nhân hóa trên trợ lý ảo thông qua nền tảng mà không cần tới nhân sự kĩ thuật; có kết nối dữ liệu đào tạo tới các cổng dữ liệu lớn của Chính phủ: cổng dữ liệu văn bản hành chính, cổng dữ liệu mua sắm công, cổng dữ liệu công dân…; có kết nối với dữ liệu đào tạo với máy tìm kiếm của doanh nghiệp trong nước để cung cấp thông tin từ Internet (có qua kiểm duyệt); có thể sử dụng trên website và điện thoại thông minh.

Phát biểu tại phiên họp chuyên đề lần thứ hai của Ủy ban Quốc gia về Chuyển đổi số, Bộ trưởng Bộ Thông tin và Truyền thông Nguyễn Mạnh Hùng đã khẳng định, AI cần được phổ cập, thâm nhập vào mọi lĩnh vực, mọi nơi, mọi chốn, mọi công việc hàng ngày, của mọi người, mọi doanh nghiệp, mọi tổ chức.

"Nhanh chóng phổ cập hóa ứng dụng AI, nhưng phải là AI do chúng ta phát triển, do chúng ta “nuôi dạy” (dữ liệu, mục tiêu, lựa chọn thuật toán, huấn luyện là của chúng ta). Muốn phổ cập AI thì phải biến nó thành dịch vụ và cung cấp qua mạng viễn thông đến mọi người dân, doanh nghiệp như là dịch vụ điện thoại di động vậy, và giá cũng phải rẻ. Để AI phát triển lành mạnh thì Chính phủ cũng sẽ sớm ban hành một bộ quy tắc ứng dụng AI, bởi vì AI được coi là tạo ra nguy cơ còn lớn hơn cả năng lượng hạt nhân. Nhưng không phải vì thế mà chúng ta hạn chế ứng dụng AI mà ngược lại, cần đẩy nhanh ứng dụng mặt tích cực của nó. Bộ Thông tin và Truyền thông cũng sẽ trình Chính phủ một chương trình hành động quốc gia về ứng dụng AI trong chuyển đổi số, trong Chính phủ số, kinh tế số và xã hội số. AI sẽ giúp tăng năng suất lao động, giảm giá thành sản phẩm, tạo ra các giá trị mới. AI sẽ đóng vai trò chính trong phát triển kinh tế số" - Bộ trưởng Bộ Thông tin và Truyền thông khẳng định.


Nguồn: Bộ Thông tin và Truyền thông