| Paradigm | Gemini 3 Pro | Gemini 3 Flash |
| Các kiểu dữ liệu được hỗ trợ | Inputs: Text, Image, Video, Audio, và PDF Output: Text | |
| Xử lý ngữ cảnh | Input tokens: 1M Output tokens: 64k | |
| Công cụ sử dụng | Function calling Structured output Search as a tool Code execution | |
| Được tối ưu cho | Tác vụ Agentic Lập trình nâng cao Phát triển thuật toán (Algorithmic development) Hiểu ngữ cảnh dài và đa phương thức phức tạp | Các tác vụ thường ngày. Lập trình tác nhân (Agentic coding). Suy luận nâng cao với tốc độ nhanh. Hiểu ngữ cảnh dài và đa phương thức phức tạp. |
| Nền tảng hỗ trợ | Gemini App Google Cloud / Vertex AI Google AI Studio Gemini API Google AI Mode Google Antigravity | Bao gồm tất cả nền tảng của bản Pro, và thêm: Gemini CLI, Gemini Enterprise, Android Studio. |
| Chi phí (input/output) | $2 / $12 (<200k tokens) $4 / $18 (>200k tokens) | $0.50 / $3.00 $1.00 (audio input) |
Gemini 3 Flash là thành viên mới nhất trong gia đình mô hình ngôn ngữ lớn (LLM) Gemini 3 của Google, kết hợp trí tuệ cấp độ chuyên gia với tốc độ xử lý nhanh gấp 3 lần bản tiền nhiệm. Sản phẩm nổi bật nhờ khả năng lập trình xuất sắc, phân tích đa phương thức mượt mà với mức chi phí rẻ.
Google định vị Gemini 3 Flash là điểm giao thoa giữa tư duy "cấp Pro" và tốc độ đặc trưng của dòng "Flash". Mục tiêu cốt lõi của mô hình này là tối ưu hóa đồng thời ba yếu tố: Chất lượng phản hồi cao - Tốc độ xử lý nhanh - Chi phí vận hành thấp.
Ngay từ khi ra mắt, mô hình này đã hỗ trợ khả năng đa phương thức đầy đủ, cho phép người dùng tương tác mượt mà qua hình ảnh, video và âm thanh. Đây là lựa chọn hàng đầu cho các tác vụ đòi hỏi sự thông minh vượt trội mà vẫn đảm bảo thời gian phản hồi nhanh chóng.
Gemini 3 Flash sử dụng nhiều tính năng mới để nâng cao hiệu suất, khả năng kiểm soát và độ chính xác đa phương thức:
🔹Thinking level: Sử dụng tham số thinking_level để kiểm soát lượng suy luận nội tại mà mô hình thực hiện gồm các mức: minimal , low, medium, và high . Tính năng này giúp cân bằng giữa chất lượng phản hồi, độ phức tạp của suy luận, độ trễ và chi phí. Tham số thinking_level thay thế cho thinking_budget đối với các mô hình Gemini 3.
🔹Thought signatures: Việc xác thực chặt chẽ hơn đối với thought signatures giúp cải thiện độ tin cậy trong các quy trình gọi hàm nhiều lượt (multi-turn function calling).
Lưu ý: Mức độ phân giải ultra high chỉ áp dụng cho phương thức IMAGE (hình ảnh).
Số lượng token của tệp PDF sẽ được liệt kê trong mục IMAGE thay vì mục DOCUMENT trong phần usage_metadata.Media resolution: Sử dụng tham số media_resolution (với các mức low, medium, high, hoặc ultra high) để kiểm soát quy trình xử lý thị giác đối với các đầu vào đa phương thức. Việc này sẽ ảnh hưởng đến mức tiêu thụ token và độ trễ phản hồi.
Google đã phủ sóng mô hình mới này trên hầu hết các nền tảng quan trọng của hệ sinh thái:
Cloud Ace - Managed Service Partner của Google Cloud