Google Công Bố Hai Phiên Bản Gemini Mới

Google Công Bố Hai Phiên Bản Gemini Mới

Vào tháng 9/2024 vừa qua trên trang chính thức của Google for Developer, Google đã thông báo ra mắt hai phiên bản Gemini mới, mang đến những cải tiến vượt trội về tốc độ và hiệu suất. Với giá cả phải chăng hơn và khả năng xử lý nhanh hơn, các nhà phát triển giờ đây có thể dễ dàng tích hợp các mô hình AI mạnh mẽ này vào ứng dụng của mình. Hãy cùng Cloud Ace tìm hiểu nhé.

Dựa trên nền tảng của các phiên bản thử nghiệm trước đó và đã có nhiều cải tiến so với Gemini 1.5, được ra mắt tại Google I/O vào tháng 5, Gemini 1.5 Pro-002 và Gemini 1.5 Flash-002 hứa hẹn sẽ mang đến những trải nghiệm người dùng tốt hơn. Các developer có thể truy cập miễn phí mô hình này qua Google AI Studio và Gemini API. Đối với các doanh nghiệp lớn của Google Cloud, mô hình đã có sẵn trên Vertex AI.

Đặc điểm nổi bật:

💠 Giảm giá >50% cho phiên bản 1.5 Pro (cả đầu vào và đầu ra cho lời nhắc <128K).
💠 Tốc độ giới hạn cao hơn 2x trên 1.5 Flash và cao hơn ~3x trên 1.5 Pro.
💠 Tốc độ đầu ra nhanh hơn gấp 2 lần và độ trễ thấp hơn gấp 3 lần.
💠 Đã cập nhật cài đặt bộ lọc mặc định.

Gemini 1.5 là mô hình được thiết kế để hoạt động hiệu quả trên nhiều loại văn bản, code và tác vụ đa phương thức. Đặc biệt, trong lĩnh vực toán học, xử lý ngôn ngữ tự nhiên và hiểu hình ảnh. Các mô hình này không chỉ nhanh hơn và hiệu quả hơn mà còn thể hiện khả năng giải quyết các bài toán phức tạp một cách chính xác hơn.

Với Gemini 1.5, người dùng có thể dễ dàng tìm kiếm thông tin từ một lượng lớn tài liệu, từ các bài báo khoa học cho đến các đoạn code phức tạp. Mô hình này cũng xuất sắc trong việc tạo ra các nội dung sáng tạo dựa trên video, hình ảnh và văn bản.

Với các bản cập nhật mới nhất, Gemini 1.5 đã vượt trội hơn so với các phiên bản trước đó khi triển khai thực tế. Ví dụ, khi đánh giá trên MMLU, một tiêu chuẩn đánh giá phổ biến, Gemini 1.5 đã đạt được kết quả cao hơn 7%. Đặc biệt, trong các bài toán toán học phức tạp, mô hình này đã cải thiện hiệu suất đến 20%. Ngoài ra, trong các bài đánh giá về vision và code, các mô hình cũng thể hiện tốt hơn, với mức cải thiện từ 2-7% trong khả năng hiểu visual và tạo code Python.

Nhờ những cải tiến này, Gemini 1.5 trở thành một công cụ hữu ích cho nhiều ứng dụng, từ hỗ trợ nghiên cứu đến phát triển các sản phẩm AI.

Nhờ những cải tiến mới, hệ thống đã đạt hiệu quả cao hơn trong việc tạo ra các phản hồi chất lượng, đáp ứng nhiều yêu cầu khác nhau của người dùng. Google vẫn luôn đặt an toàn lên hàng đầu, tuân thủ chặt chẽ các tiêu chuẩn bảo mật.

Để tối ưu trải nghiệm người dùng, cả hai mô hình đều được thiết kế để trả lời ngắn gọn và dễ hiểu. Đặc biệt, độ dài trung bình của các đầu ra như tóm tắt hay trả lời câu hỏi đã giảm từ 5-20%, giúp tiết kiệm thời gian và tài nguyên.

Trước đó, Google đã thông báo tăng khả năng xử lý từ 1 triệu token lên 2 triệu token cùng khả năng xử lý video, tài liệu PDF lên tới 1.000 trang của Gemini 1.5 Pro tiếp tục mở ra vô vàn ứng dụng sáng tạo.

Để thúc đẩy việc khám phá và phát triển các trường hợp sử dụng mới, kể từ ngày 1 tháng 10 năm 2024, giá token đầu vào, token đầu ra và token lưu trữ bộ nhớ đệm của mô hình Gemini 1.5 Pro sẽ giảm lần lượt 64%, 52% và 64% cho các lời nhắc dưới 128 nghìn token. Với bộ nhớ đệm ngữ cảnh, việc xây dựng các ứng dụng dựa trên Gemini trở nên tối ưu hơn về mặt chi phí cũng như năng suất.

Để hỗ trợ tốt hơn cho cộng đồng developer, giới hạn tốc độ trả phí cho Gemini 1.5 Flash sẽ tăng lên 2.000 RPM và Gemini 1.5 Pro lên 1.000 RPM, tăng đáng kể so với mức hiện tại. Trong thời gian tới, giới hạn tốc độ API Gemini dự kiến sẽ tiếp tục được nâng cấp, mở ra nhiều cơ hội hơn cho các nhà phát triển.

Song song với những cải tiến cốt lõi cho các mô hình mới nhất, trong vài tuần qua, chúng tôi đã giảm đáng kể độ trễ xuống còn 1,5 Flash và tăng mạnh số lượng token đầu ra mỗi giây. Điều này mở ra cơ hội cho nhiều trường hợp sử dụng mới, tận dụng tối đa sức mạnh của các mô hình tiên tiến nhất của Google.

Phiên bản nâng cấp của mô hình Gemini 1.5, mang tên “Gemini-1.5-Flash-8B-Exp-0924”, đã chính thức ra mắt vào tháng 8/2024, mang đến những cải tiến đáng kể về hiệu năng cho cả văn bản và đa phương thức. Người dùng có thể trải nghiệm phiên bản mới này ngay trên Google AI Studio và Gemini API. Nhờ phản hồi tích cực từ cộng đồng nhà phát triển, Google cũng cho biết sẽ tiếp tục điều chỉnh quy trình phát hành để đáp ứng các nhu cầu của người dùng tốt hơn. Đồng thời, người dùng Gemini Advanced cũng sẽ sớm được trải nghiệm phiên bản trò chuyện tối ưu hóa của Gemini 1.5 Pro-002.

English

Cloud Ace

Google Cloud Diamond Partner