Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.
Sự xuất hiện của bộ dữ liệu tiếng Việt nhằm giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy kinh tế số.
Theo các chuyên gia công nghệ, đây là bước tiến quan trọng trong việc bản địa hóa trí tuệ nhân tạo (AI) tại Việt Nam.

Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Tập đoàn Meta, NIC và tổ chức “AI for Vietnam”. Trong đó, Trung tâm Đổi mới sáng tạo quốc gia đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam.
Sứ mệnh của dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi, để mở khoá tiềm năng các ứng dụng AI tại Việt Nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao, để đào tạo và đánh giá khả năng của các mô hình AI.
Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam, phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở, phù hợp với bối cảnh địa phương.
Để hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình AI và Dữ liệu vì Lợi ích Cộng đồng của mình, bao gồm thông tin chi tiết về di chuyển, kết nối xã hội và dữ liệu đào tạo từ các bản đồ dân số được hỗ trợ bởi AI.
Giáo sư Yann LeCun, Phó chủ tịch kiêm Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta đã bày tỏ sự kỳ vọng vào dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam.
Nhấn mạnh tầm quan trọng của chương trình, Phó Thủ tướng Chính phủ Nguyễn Chí Dũng khẳng định thách thức Đổi mới sáng tạo Việt Nam là chương trình chiến lược để tìm kiếm các giải pháp đổi mới sáng tạo trên toàn thế giới nhằm giải quyết những thách thức quan trọng tầm quốc gia, hướng đến một Việt Nam phát triển thịnh vượng và bền vững. Để chương trình thành công cần sự hợp tác giữa khu vực công, khu vực tư nhân và các đối tác trong và ngoài nước chung tay hình thành, thử nghiệm và thực thi các sáng kiến đổi mới sáng tạo vì một Việt Nam thịnh vượng.
Theo ông Võ Xuân Hoài, Phó giám đốc Trung tâm Đổi mới sáng tạo quốc gia, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách.
Ông Hoài khẳng định, dự án ViGen phù hợp với Nghị quyết số 57 của Bộ Chính trị nhằm đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Với nỗ lực chung từ các nhà hoạch định chính sách, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu.
Cũng tại họp báo, Meta phối hợp với Deloite đã chọn Việt Nam là quốc gia đầu tiên trong khu vực châu Á-Thái Bình Dương ra mắt cẩm nang “Đổi mới sáng tạo trong khu vực công ở châu Á-Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama”.
Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm: Tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, an ninh công...
Đại diện cho Tổ chức AI For Vietnam đã chính thức tham gia vào Liên minh AI toàn cầu, ông Trần Việt Hùng, Nhà sáng lập, Giám đốc điều hành của AI for Vietnam cho hay Việt Nam được chọn là quốc gia đầu tiên trong khu vực châu Á-Thái Bình Dương ra mắt cẩm nang này. Điều này giúp cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế và an ninh công cộng.
Cẩm nang giới thiệu hai ứng dụng thực tiễn đầy ấn tượng của mô hình Llama tại Việt Nam: Cụ thể, Bộ Khoa học và Công nghệ đã hợp tác cùng MISA để thử nghiệm một trợ lý ảo, giúp giảm 98% thời gian tra cứu thông tin cho cán bộ, từ đó tăng hiệu suất làm việc và tiết kiệm thời gian. Bên cạnh đó, Bộ Tư Pháp phối hợp cùng Viettel tận dụng Llama để triển khai trợ lý pháp lý ảo, giúp rút ngắn thời gian nghiên cứu văn bản pháp luật khoảng 30%.
ViGen đánh dấu năm thứ ba của chương trình trong việc tập trung thúc đẩy phát triển lĩnh vực AI thông qua dữ liệu tiếng Việt mã nguồn mở, một yếu tố then chốt để các mô hình AI hiểu sâu sắc hơn về văn hóa và ngôn ngữ Việt. Chương trình được triển khai từ năm 2022 và thu hút hơn 750 giải pháp từ hơn 20 quốc gia và vùng lãnh thổ, thể hiện sức hút và tầm quan trọng của việc phát triển AI tại Việt Nam. Đặc biệt, trong chuyến thăm của Tổng thống Biden tới Việt Nam năm 2023, Thách thức Đổi mới sáng tạo Việt Nam đã được Cổng thông tin Nhà Trắng (Hoa Kỳ) ca ngợi như một điểm sáng trong hợp tác công nghệ và đổi mới sáng tạo giữa hai quốc gia.
TH