Ông lớn Google ra mắt mô hình AI 'siêu nhẹ': Khẳng định hiệu suất vượt trội hơn loạt mô hình của DeepSeek, ChatGPT hay Facebook

Theo đó, Google tự tin tuyên bố hiệu suất hoạt động của Gemma 3 vượt trội so với các mô hình AI khác như Llama của Facebook, GPT của OpenAI và đặc biệt là R1 của DeepSeek
Ông lớn Google ra mắt mô hình AI 'siêu nhẹ': Khẳng định hiệu suất vượt trội hơn loạt mô hình của DeepSeek, ChatGPT hay Facebook- Ảnh 1.

Hơn một năm sau khi phát hành 2 phiên bản của mô hình trí tuệ nhân tạo (AI) Gemma, Google vừa tiếp tục phát hành bản nâng cấp của mô hình AI này với phiên bản Gemma 3.

Theo đó, trên trang blog chính thức của mình, Google cho biết Gemma 3 được xây dựng dựa trên mã nguồn mở và được thiết kế siêu nhẹ, cho phép các nhà phát triển có thể tạo ra các ứng dụng AI có thể chạy trên bất kỳ thiết bị nào. 

Thông tin từ Google, đây là tập hợp mô hình nguồn mở nhẹ, hiện đại, được xây dựng từ  cùng một nghiên cứu, công nghệ tương tự Gemini 2.0, Gemma 3 được phát hành hơn một năm sau khi công ty lần đầu công bố mô hình nguồn mở Gemma.

Gemma 3 dành cho các nhà phát triển tạo ứng dụng AI có khả năng chạy phần mềm ở bất kỳ đâu khi cần, trên mọi thứ từ điện thoại đến máy trạm với hỗ trợ cơ bản hơn 35 ngôn ngữ, khả năng phân tích văn bản, hình ảnh và video ngắn.

"Các mô hình nguồn mở mới của chúng tôi cực kỳ hiệu quả, như mô hình 27B lớn nhất chỉ chạy trên một GPU H100. Bạn sẽ cần khả năng tính toán ít nhất gấp 10 lần để có được hiệu suất tương tự từ các mô hình khác", CEO Sundar Pichai của Google viết trên X.

Gemma 3 sẽ có các phiên bản 1B, 4B, 12B và 27B, cho phép người dùng đưa ra lựa chọn hợp nhất với nhu cầu phần cứng và hiệu suất cụ thể của mình.

Ông lớn Google ra mắt mô hình AI 'siêu nhẹ': Khẳng định hiệu suất vượt trội hơn loạt mô hình của DeepSeek, ChatGPT hay Facebook- Ảnh 2.

Mô hình Gemma 3 chỉ thua kém R1 của DeepSeek trong bảng xếp hạng của LMArena. Ảnh: Seekingalpha

"Chúng được thiết kế để chạy nhanh, trực tiếp trên các thiết bị, từ điện thoại và máy tính xách tay đến máy trạm, giúp các nhà phát triển tạo ra các ứng dụng AI", Clement Farabet, Giám đốc Google DeepMind cho biết trong một bài đăng trên blog của công ty.

Google tự tin tuyên bố hiệu suất hoạt động của Gemma 3 vượt trội so với các mô hình AI khác như Llama của Facebook, GPT của OpenAI và đặc biệt là R1 của DeepSeek, mô hình AI đến từ Trung Quốc, nổi tiếng với khả năng hoạt động hiệu quả trên những loại chip AI thế hệ cũ và không đòi hỏi cấu hình quá mạnh.

Sử dụng điểm số đánh giá trên Chatbot Arena, trang web chuyên so sánh khả năng xử lý và trí thông minh của hệ thống AI tạo sinh, Google cho biết Gemma 3 đạt được số điểm tương đương 98% so với điểm số mô hình R1 của DeepSeek.  

Điều này đồng nghĩa với việc R1 của DeepSeek vẫn vượt trội hơn Gemma 3 về khả năng xử lý và tốc độ phản hồi. Tuy nhiên, Google khẳng định rằng DeepSeek phải sử dụng đến 32 chip xử lý đồ hoạ H100 của Nvidia để đạt được điểm số tối đa, trong khi Gemma 3 chỉ sử dụng duy nhất một GPU H100.

Google cũng giới thiệu ShieldGemma 2, một công cụ kiểm tra độ an toàn hình ảnh tích hợp với Gemma 3, giúp nhận diện và phân loại nhanh chóng các nội dung không phù hợp, đảm bảo an toàn cho người dùng khi tương tác với các ứng dụng AI.

Các chuyên gia nhận định, động thái tung ra AI Gemma 3 một lần nữa cho thấy chiến lược của Google trong việc thúc đẩy mạnh mẽ phổ cập trí tuệ nhân tạo, cung cấp các công cụ nguồn mở để nhiều nhà phát triển có thể tiếp cận dễ dàng, đẩy nhanh tốc độ ứng dụng AI rộng khắp, từ đó gia tăng lợi thế cạnh tranh trên thị trường công nghệ.