Google Cloud tiếp tục khẳng định vị thế dẫn đầu trong việc cung cấp hệ sinh thái mô hình AI đa dạng, giúp doanh nghiệp xây dựng và triển khai các ứng dụng cũng như AI Agents ở quy mô toàn cầu. hằm tối ưu hóa hiệu suất và độ tin cậy trên nền tảng Vertex AI, Google Cloud vừa công bố việc tích hợp các mô hình Claude 4.6 của Anthropic — gồm hai phiên bản Opus và Sonnet — vào nền tảng Vertex AI. Trong đó, mô hình Opus 4.6 là giải pháp hiệu suất cao dành cho các quy trình vận hành phức tạp, lập trình và phân tích tài chính chuyên sâu. Ngược lại, Sonnet 4.6 mang đến sự cân bằng tối ưu giữa năng lực xử lý thông minh và hiệu quả chi phí, phát huy thế mạnh trong các tác vụ có khối lượng lớn. Hãy cùng Cloud Ace tìm hiểu nhé.
Claude Sonnet 4.6 – mô hình cân bằng giữa năng lực xử lý và tốc độ, tiệm cận mức độ thông minh của Opus 4.6 nhưng với chi phí tối ưu hơn. Sonnet 4.6 cho phép hoàn thành tác vụ nhanh chóng với chất lượng cao, phù hợp cho các nhu cầu như lập trình quy mô lớn, phân tích dữ liệu và sản xuất nội dung. Đồng thời, đây cũng là mô hình tiên tiến nhất của Anthropic trong các tác vụ sử dụng computer uses.
Tính năng | Claude Opus 4.6 | Claude Sonnet 4.6 |
|---|---|---|
Adaptive Thinking (Tư duy thích ứng) | General Availability (GA) | GA |
Fine-grained tool streaming toggle (Bật/tắt truyền dữ liệu công cụ theo mức chi tiết) | GA | GA |
Effort parameter (Tham số điều chỉnh mức độ xử lý) | GA | GA |
128k Output Tokens | GA | GA |
Compaction API | Preview | Preview |
1M Context Window | Preview | Preview |
Tool params quoting consistency (Tính nhất quán trong trích dẫn tham số công cụ) | GA | GA |
Web search | GA | GA |
Vertex AI giúp doanh nghiệp loại bỏ đánh đổi giữa việc tiếp cận các mô hình AI tiên tiến và triển khai trên một nền tảng phát triển đạt chuẩn toàn cầu. Trong bối cảnh xây dựng các agents phức tạp đòi hỏi nhiều hơn một mô hình đơn lẻ, Vertex AI cung cấp một hệ sinh thái agentic toàn diện, được thiết kế để xử lý hiệu quả các yêu cầu về vận hành thực tế, quản trị, tuân thủ và mở rộng quy mô toàn cầu:
Tối ưu hiệu suất và chi phí vận hành:
Đảm bảo hiệu năng ổn định ngay cả trong giai đoạn cao điểm bằng cách đặt trước năng lực xử lý với chi phí cố định thông qua Provisioned Throughput. Doanh nghiệp có thể gia tăng hiệu quả nhờ các tính năng như global endpoint cho Claude, cơ chế lưu cache prompt với thời gian TTL linh hoạt, batch predictions, tìm kiếm web và cửa sổ ngữ cảnh 1 triệu token (bản preview) dành cho Claude Opus 4.6 và Claude Sonnet 4.6.
Vận hành trên hạ tầng tối ưu:
Vertex AI được xây dựng trên hạ tầng chuyên biệt nhằm đáp ứng nhu cầu tính toán của các mô hình AI tiên tiến, giúp giảm độ trễ và nâng cao hiệu quả xử lý.
Quản trị và bảo mật ở quy mô lớn:
Hệ thống kiểm soát quản trị tích hợp giúp đảm bảo các agent hoạt động đúng mục tiêu và toàn bộ hành động được ghi nhận đầy đủ. Doanh nghiệp có thể bảo vệ toàn bộ hệ sinh thái AI thông qua các lớp bảo mật nền tảng và kiểm soát lưu trú dữ liệu của Google Cloud, đồng thời phòng chống các mối đe dọa mới như: prompt injection hay tool poisoning với Model Armor, kết hợp khả năng bảo vệ AI nâng cao trong Security Command Center để ưu tiên xử lý rủi ro và phát hiện nguy cơ kịp thời.
Cloud Ace - Managed Service Provider của Google Cloud