Các mô hình AI tiên tiến như Gemini thường xử lý dữ liệu thông qua một cái nhìn tĩnh, dễ bỏ sót chi tiết nhỏ và buộc mô hình phải suy đoán. Với Agentic Vision trong Gemini 3 Flash, nâng cấp khả năng hiểu hình ảnh từ phân tích tĩnh sang chủ động. Mô hình có thể phóng to, kiểm tra và xử lý hình ảnh theo từng bước, kết hợp suy luận thị giác và thực thi code để đưa ra kết quả dựa trên bằng chứng trực quan. Nhờ đó, chất lượng xử lý hình ảnh được cải thiện ổn định lên đến 5–10% trên hầu hết các tiêu chuẩn đánh giá. Hãy cùng Cloud Ace tìm hiểu công nghệ này nhé.