Đó là nhận định trích từ một ghi chép nội bộ của gã khổng lồ tìm kiếm vừa được tiết lộ gần đây. Cũng trong tài liệu này, các giám đốc điều hành Google đã tỏ ý quan ngại sâu sắc về khả năng thất bại trong cuộc đua AI đang diễn ra.
Đại diện Google sau đó đã xác nhận tính xác thực của tài liệu, nói rằng đó chỉ là một ý kiến của một người trong công ty, song thừa nhận họ “không ở vị trí có thể giành chiến thắng trong cuộc đua này và OpenAI cũng vậy”.
Gã khổng lồ tìm kiếm nhận định rằng cộng đồng mã nguồn mở đang đánh bại những công ty AI hàng đầu, mặc dù những sản phẩm của họ có lợi thế hơn một chút về chất lượng nhưng “khoảng cách đang bị thu hẹp nhanh chóng một cách đáng kinh ngạc”.
Quy mô vốn không phải yếu tố cốt lõi
AI tạo ra cơn sốt đối với công chúng kể từ cuối năm 2022 với sự ra mắt của ChatGPT, chatbot dựa trên LLM (các mô hình ngôn ngữ lớn) do OpenAI - startup có liên hệ chặt chẽ với Microsoft phát triển. Thành công của sản phẩm này đã thúc đẩy Google và nhiều công ty công nghệ khác nhảy vào cuộc đua LLM.
Các mô hình LLM được đào tạo từ hàng ngàn tỷ từ lấy trên Internet để tạo ra những đoạn văn bản hay hội thoại giống như con người. Quy trình này mất hàng tháng với chi phí lên đến hàng chục triệu USD, đã dẫn đến lo ngại AI sẽ bị chi phối bởi những doanh nghiệp công nghệ “lắm tiền, nhiều của”.
Song, bản ghi chép nội bộ của Google cho rằng giả định đó là sai lầm. Các nhà nghiên cứu trong cộng đồng mã nguồn mở đang tận dụng nguồn tài nguyên trực tuyến miễn phí và đạt được kết quả có thể so sánh với những mô hình độc quyền lớn nhất hiện nay.
Theo đó, LLM có thể được “tinh chỉnh” thông qua một kỹ thuật gọi là thích ứng cấp thấp, hay LoRa, cho phép tối ưu hoá một LLM sẵn có cho một nhiệm vụ cụ thể nhanh chóng và chi phí rẻ hơn nhiều so với đào tạo LLM từ đầu.
Chẳng hạn, vào tháng 3, LLaMa, mô hình tạo bởi Meta - công ty mẹ Facebook đã bị rò rỉ trực tuyến. Mặc dù nó nhỏ và khá “sơ khai” khi chỉ có 7 tỷ tham số, so với 540 tỷ tham số trong LLM lớn nhất của Google, nhưng LLaMa nhanh chóng được tinh chỉnh để tạo ra kết quả tương đương với phiên bản gốc của ChatGPT trên một số tác vụ.
Điều này có thể gây ra tác động địa chấn cho tương lai phát triển AI khi “những rào cản về đào tạo và thử nghiệm, từ chỗ cần cả một trung tâm nghiên cứu lớn, đã giảm xuống chỉ cần một người, một buổi tối và một chiếc máy tính xách tay cấu hình cao”.
Cuộc chiến gã khổng lồ Goliath và chàng chăn cừu David
Giờ đây một LLM có thể được tinh chỉnh chỉ với 100 USD sau vài giờ. Với mô hình linh hoạt, mang tính kết nối và chi phí thấp, “AI mã nguồn mở có lợi thế đáng kể” mà những công ty lớn như Google không thể sao chép. Bởi vậy, bản ghi chép kết luận Google hay OpenAI dễ bị tổn thương trước những đối thủ cạnh tranh nguồn mở này.
“Tôi không nghĩ mình cần một thứ mạnh mẽ như ChatGPT-4 trong nhiều tác vụ”, Simon Willison, lập trình viên và chuyên gia phân tích công nghệ nói với NBC. “Câu hỏi bây giờ là các mô hình có thể được chia nhỏ tới mức nào mà vẫn hữu dụng? Và đó là điều mà cộng đồng mã nguồn mở đang khám phá rất nhanh”.
Điều này hoàn toàn tương đồng với nhận định của nhiều chuyên gia cho rằng, điểm mạnh nhất cũng là điểm yếu nhất nếu bị khai thác và quan sát đúng đắn, giống như trong câu chuyện gã khổng lồ Goliath bị đánh bại bởi chú bé chăn cừu nhỏ bé David chỉ bằng với chiếc ná thun bắn đá.
Song, với câu chuyện phát triển AI, có thể không phải ai cũng đồng ý với luận điểm này. Thực tế là những phần mềm độc quyền trả tiền vẫn đang tồn tại, chẳng hạn như Adobe Photoshop hay Microsoft Windows và lĩnh vực AI cũng có thể sẽ đi theo con đường phát triển như vậy.)