Asset 15

Giới Thiệu Gemini Deep Research Agent

Asset 15

Với sự thành công của tính năng Deep Research được tích hợp vào Gemini Advanced vào đầu năm nay, Google vừa chính thức ra mắt phiên bản nâng cấp mạnh mẽ hơn, Gemini Deep Research Agent hiện đã khả dụng qua Interactions API. Bước tiến này cho phép người dùng có thể nhúng trực tiếp các tính năng nghiên cứu tự động của Google vào sản phẩm phần mềm. Bên cạnh đó, Google cũng giới thiệu dự án mã nguồn mở DeepSearchQA, bộ công cụ chuẩn hóa dùng để kiểm định mức độ bao quát của các tác nhân nghiên cứu web. Hãy cùng Cloud Ace tìm hiểu nhé.

Gemini Deep Research

Gemini Deep Research Agent là AI Agent được tối ưu hóa cho các tác vụ thu thập và tổng hợp ngữ cảnh dài hạn, có khả năng tự chủ lập kế hoạch và thực thi quy trình nghiên cứu đa bước. Vận hành trên nền tảng Gemini 3 Pro – mô hình có độ xác thực cao nhất hiện nay của Google – agent này được đào tạo chuyên biệt để giảm thiểu tối đa hiện tượng "ảo giác" (hallucinations) và nâng cao chất lượng báo cáo.

Thông qua cơ chế học tăng cường đa bước (multi-step reinforcement learning) mở rộng, Gemini Deep Research Agent có thể điều hướng chính xác trong các môi trường thông tin phức tạp, kết hợp linh hoạt giữa tìm kiếm web và dữ liệu nội bộ của doanh nghiệp để tạo ra các báo cáo chi tiết kèm trích dẫn nguồn đầy đủ.

Do tính chất của quy trình tìm kiếm và đọc lặp lại liên tục, việc xử lý có thể kéo dài vài phút. Developers cần sử dụng chế độ background execution (thiết lập background=true) để vận hành agent theo cơ chế bất đồng bộ (asynchronous) và thực hiện thăm dò (poll) để nhận kết quả.

Gemini Deep Research Agent đang dẫn đầu thị trường trên các bài đánh giá Humanity’s Last Exam (HLE) and DeepSearchQA, đồng thời là công cụ nghiên cứu mạnh nhất của Google trên BrowseComp. Giải pháp này được tối ưu để tạo các báo cáo nghiên cứu chuyên sâu với chi phí tối thiểu. Agent này sẽ sớm được tích hợp vào Google Search, NotebookLM, Google Finance, cùng các nâng cấp mới trong Gemini App.

DeepSearchQA: tiêu chuẩn mới cho deep research agents

Các benchmark hiện tại chưa phản ánh hết sự phức tạp của quy trình nghiên cứu web đa bước trong thực tế. Chính vì vậy, Google quyết định giới thiệu open source DeepSearchQA, một bộ tiêu chuẩn mới được thiết kế để đánh giá khả năng của các AI Agent trong các nhiệm vụ tìm kiếm thông tin phức tạp, đòi hỏi nhiều bước xử lý.

DeepSearchQA bao gồm 900 tác vụ theo dạng "causal chain" (chuỗi nhân quả) được soạn thảo thủ công trên 17 lĩnh vực khác nhau, trong đó mỗi bước thực hiện đều phụ thuộc vào kết quả phân tích trước đó. Khác với các bài kiểm tra dựa trên dữ kiện truyền thống, DeepSearchQA đo lường tính toàn diện, yêu cầu AI phải đưa ra các bộ câu trả lời đầy đủ và chi tiết nhất. Cách tiếp cận này giúp đánh giá đồng thời cả độ chính xác lẫn độ bao phủ của quá trình nghiên cứu.

Ngoài ra, DeepSearchQA còn đóng vai trò là công cụ phân tích lợi ích "thinking time". Trong các đánh giá nội bộ, Google nhận thấy hiệu suất tăng đáng kể khi cho phép agent thực hiện nhiều bước tìm kiếm và lập luận hơn – một hướng đi mà Google dự định sẽ khai thác sâu hơn trong các bản phát hành tới.

Phát triển với Gemini Deep Research

Gemini Deep Research Agent mang đến những năng lực vượt trội để tổng hợp thông tin và tạo ra các báo cáo chi tiết:

  • 🔹Unified information synthesis: Phân tích tài liệu (PDF, CSV, docs) kết hợp với dữ liệu web công khai thông qua tính năng File Upload and File Search Tool. Nó cũng xử lý các ngữ cảnh lớn, cho phép đưa lượng lớn thông tin bối cảnh trực tiếp vào câu prompt.

  • 🔹Report steerability: Kiểm soát hoàn toàn output qua prompt, từ việc định nghĩa cấu trúc, các tiêu đề chính/phụ, cho đến việc chỉ định tạo bảng dữ liệu và định dạng cụ thể.

  • 🔹Detailed citations: Cung cấp nguồn trích dẫn cụ thể cho từng nhận định, giúp người dùng dễ dàng xác minh nguồn gốc dữ liệu.

  • 🔹Structured outputs: Hỗ trợ xuất dữ liệu theo JSON schema, giúp các ứng dụng tích hợp phía sau (downstream applications) dễ dàng phân tích cú pháp và xử lý kết quả nghiên cứu.

Cloud Ace - Managed Service Partner của Google Cloud

  • Trụ sở: Tòa Nhà H3, Lầu 1, 384 Hoàng Diệu, Phường Khánh Hội, TP. HCM.
  • Văn phòng đại diện: Tầng 2, 25t2 Hoàng Đạo Thúy, Phường Yên Hòa, Thành phố Hà Nội.
  • Email: sales.vn@cloud-ace.com
  • Hotline: 028 6686 3323
  • Website: https://cloud-ace.vn/

Tin tức liên quan

Shopping Basket
en_USEnglish