Asset 15

Những tính năng nổi bật Gemini 3.5 Live Translate

Asset 15

Google vừa chính thức ra mắt Gemini 3.5 Live Translate, mô hình âm thanh mới nhất dành cho tính năng dịch speech-to-speech trực tiếp, hỗ trợ hơn 70 ngôn ngữ. Khác với các hệ thống turn-by-turn truyền thống phải chờ người nói kết thúc câu trước khi phản hồi, Gemini 3.5 Live Translate tạo ra giọng nói một cách liên tục. Công nghệ này tối ưu hóa sự cân bằng giữa việc chờ thêm ngữ cảnh để cải thiện chất lượng đầu ra và đồng thời bảo toàn ngữ điệu, nhịp độ và cao độ của người nói. Hãy cùng Cloud Ace tìm hiểu nhé.

Gemini 3.5 Live Translate

Gemini 3.5 Live Translate xử lý giọng nói trực tiếp ngay khi tiếp nhận, giúp kết nối thông tin xuyên ngôn ngữ một cách mượt mà và không bị gián đoạn. Giải pháp này tự động nhận diện và xử lý dữ liệu đa ngôn ngữ mà người dùng không cần phải thiết lập thủ công. Thêm vào đó, công nghệ lọc tiếng ồn vượt trội đảm bảo hệ thống vẫn vận hành ổn định ngay cả trong môi trường làm việc nhiều tạp âm. Doanh nghiệp có thể ứng dụng công nghệ này làm trợ lý thông dịch trực tiếp cho các cuộc gọi quốc tế, online meeting, chương trình training, phát sóng đa phương tiện và nhiều hoạt động vận hành khác.

Thông qua việc ứng dụng Gemini Live API, các nền tảng công nghệ như Agora, Fishjam, LiveKit, Pipecat và Vision Agents giúp các developers xây dựng và triển khai ứng dụng dịch giọng nói một cách dễ dàng. Các nền tảng này sẽ giải quyết hệ thống hạ tầng truyền dữ liệu trực tiếp phức tạp, nhờ đó doanh nghiệp có thể tập trung hoàn toàn vào việc cải thiện trải nghiệm người dùng.

Hiện tại, Grab - đối tác của Google Cloud - đang thử nghiệm mô hình này để giúp tài xế và hành khách có thể giao tiếp đa ngôn ngữ gần như ngay lập tức tại các điểm đón. Trên thực tế, người dùng đang thực hiện hơn 10 triệu cuộc gọi thoại mỗi tháng thông qua ứng dụng Grab.

Những tính năng nổi bật:

Speech Translation trên Google Meet sẽ sớm được tích hợp công nghệ 3.5 Live Translate, giúp nâng cao trải nghiệm người dùng thông qua các cải tiến sau:

  • Hỗ trợ hơn 70 ngôn ngữ: bước tiến vượt bậc so với giới hạn chỉ 5 ngôn ngữ như trước đây.

  • Cho phép giao tiếp với hơn 2,000 tổ hợp ngôn ngữ trong cùng một cuộc họp, phá vỡ rào cản trước đó khi hệ thống chỉ hỗ trợ dịch hai chiều với tiếng Anh.

  • Cải tiến giao diện nhằm giúp người dùng truy cập và sử dụng tính năng dịch giọng nói speech translation) ngay lập tức.

Google Cloud dự kiến sẽ phát hành bản cập nhật này dưới dạng private preview cho một số khách hàng doanh nghiệp sử dụng Google Workspace ngay trong tháng này, trước khi tiến hành triển khai rộng rãi vào cuối năm nay.

Mô hình này hiện đang được triển khai cho ứng dụng Google Translate trên toàn cầu ở cả hai hệ điều hành Android và iOS. Khi sử dụng tính năng Live translate, người dùng chỉ cần kết nối thiết bị với tai nghe để có được trải nghiệm thông dịch liền mạch, đồng thời bảo toàn trọn vẹn sắc thái giọng nói của người phát ngôn trên hơn 70 ngôn ngữ.

Đối với người dùng Android, Google cũng đang bắt đầu phát hành "listening mode" mới được tích hợp công nghệ 3.5 Live Translate, cho phép người dùng nghe bản dịch trực tiếp thông qua loa thoại của thiết bị. Tính năng mới này phù hợp cho các tình huống cần tiếp nhận thông tin nhanh chóng, riêng tư và bảo mật khi người dùng không sẵn có thiết bị tai nghe đi kèm.

Ngoài ra, nhằm đảm bảo các yêu cầu về an toàn thông tin, tất cả âm thanh do AI tạo ra sẽ được đính kèm watermark SynthID không thể nhận biết bằng tai người. Giúp các hệ thống dễ dàng phát hiện nội dung do AI tạo ra, góp phần ngăn chặn thông tin sai lệch. Gemini 3.5 Live Translate hiện đang được triển khai trên các sản phẩm của Google:

  • ▪️Dành cho các developers: Bản Public Preview qua Gemini Live API và Google AI Studio.
  • ▪️Dành cho doanh nghiệp: Bản Private Preview trên Google Meet.
  • ▪️Dành cho mọi người dùng: Qua Google Translate trên Android và iOS.
Asset 7

Cloud Ace - Managed Service Partner của Google Cloud

  • Trụ sở: Tòa Nhà H3, Lầu 1, 384 Hoàng Diệu, Phường 6, Quận 4, TP. HCM.
  • Văn phòng đại diện: Tầng 2, 25t2 Hoàng Đạo Thúy, Phường Trung Hoà, Quận Cầu Giấy, Thành phố Hà Nội.
  • Email: sales.vn@cloud-ace.com
  • Hotline: 028 6686 3323
  • Website: https://cloud-ace.vn/

Tin tức liên quan

Shopping Basket
en_USEnglish