Trong suốt năm 2023, Google Cloud đã có những phát triển và sáng tạo vượt bậc về AI như: AI Hypercomputer (nhằm đào tạo và phục vụ các mô hình GenAI), những hỗ trợ Generative AI trong Vertex AI, Enterprise AI platform, Duet AI cho Google Workspace và Google Cloud, etc. Với sự tăng trưởng vượt bậc của người dùng cũng như các nhà phát triển, Google Cloud đã công bố những khả năng mới, quan trọng trên hệ thống của mình để hỗ trợ Gemini – mô hình AI lớn nhất của Google Cloud. Hãy cùng Cloud Ace tìm hiểu nhé.
Cơ sở hạ tầng AI siêu mở rộng: Google Cloud cung cấp cơ sở hạ tầng được tối ưu hóa bởi các hệ thống AI hàng đầu của các doanh nghiệp trong các vùng đám mây dưới dạng dịch vụ. Toàn bộ cơ sở hạ tầng AI được xây dựng với thiết kế cấp hệ thống nhằm tăng hiệu quả và năng suất trong quá trình đào tạo, điều chỉnh và phân phối trí tuệ nhân tạo.
Các mô hình đẳng cấp thế giới: Vào cuối năm 2022, Google đã ra mắt Mô hình ngôn ngữ (PaLM), ngay sau đó là PaLM 2 và hiện mô hình này đang được ứng dụng cho Gemini Pro. Google cũng đã giới thiệu các mô hình dành riêng cho những domain cụ thể như Med-PaLM và Sec-PaLM.
Vertex AI - nền tảng AI doanh nghiệp hàng đầu dành cho nhà phát triển: Với API Gemini được ứng dụng trong Vertex AI, Google giúp doanh nghiệp khám phá, tùy chỉnh, tăng cường, triển khai và quản lý các tác nhân được xây dựng, cũng như danh sách tuyển chọn gồm hơn 130 mô hình AI nguồn mở và third party đáp ứng các tiêu chuẩn chất lượng và an toàn doanh nghiệp của Google. Vertex AI cũng cung cấp công cụ Search và Conversation, sử dụng phương pháp tiếp cận low code nhằm phát triển các tìm kiếm phức tạp và các tác nhân hội thoại có thể hoạt động trên nhiều kênh.
Duet AI - tác nhân AI hỗ trợ cho Workspace và Google Cloud: Duet AI là cộng tác viên được hỗ trợ bởi AI của Google nhằm hỗ trợ người dùng khi họ sử dụng Google Workspace và Google Cloud.
Khi các mô hình Gen AI ngày càng phát triển về quy mô và độ phức tạp, các yêu cầu về đào tạo, điều chỉnh và suy luận của chúng cũng tăng theo. Do đó, nhu cầu về cơ sở hạ tầng AI hiệu suất cao, khả năng mở rộng và tiết kiệm chi phí cho các mô hình đào tạo và phục vụ cũng đang tăng theo cấp số nhân.
Google Cloud vừa công bố Cloud TPU v5p, công cụ tăng tốc AI linh hoạt, mạnh mẽ và có thể mở rộng. Nó có khả năng mở rộng gấp 4 lần so với TPU v4 về tổng số FLOP có sẵn trên mỗi nhóm. Đầu năm 2023, Google đã cung cấp rộng rãi Cloud TPU v5e. Với mức cải thiện tăng 2,7 lần hiệu suất suy luận theo tiêu chuẩn ngành so với TPU v4 thế hệ trước, đây là TPU tiết kiệm chi phí nhất.
Google Cloud cũng đã công bố AI Hypercomputer, kiến trúc siêu máy tính, sử dụng hệ thống tích hợp phần cứng được tối ưu hóa hiệu suất, phần mềm mở, khung ML hàng đầu và mô hình tiêu dùng linh hoạt. Nó có nhiều tùy chọn tăng tốc, bao gồm nhiều loại TPU thế hệ thứ 5 và GPU NVIDIA.
Gemini mô hình AI linh hoạt nhất của Google Cloud — có thể chạy hiệu quả trên mọi thứ từ trung tâm dữ liệu đến thiết bị di động.
Google cũng giới thiệu phiên bản nâng cấp của Image Model - Imagen 2, công nghệ chuyển văn bản thành hình ảnh. Phiên bản mới nhất này mang đến khả năng chụp ảnh chân thực, hiển thị văn bản và tạo logo giúp người dùng có thể dễ dàng tạo hình ảnh với lớp phủ văn bản và tạo biểu trưng.
Ngoài ra, Google còn công bố mô hình MedLM, dòng mô hình nền tảng được tinh chỉnh cho các trường hợp sử dụng trong ngành chăm sóc sức khỏe.
Gemini Pro hiện đã có trong bản preview của Vertex AI. Sự hỗ trợ của Gemini trong Vertex AI gồm những tính năng như sau:
Duet AI cho nhà phát triển và trong Hoạt động bảo mật đã sẵn sàng và Google sẽ kết hợp Gemini vào danh mục Duet AI trong vài tuần tới.
Tìm hiểu thêm về chương trình ưu đãi Google Cloud Platform tại Cloud Ace's Promotion
Cloud Ace - Managed Service Partner của Google Cloud