AI đang ngày càng đóng vai trò quan trọng trong các hoạt động của doanh nghiệp. Bài viết dưới đây, là cách mà Google Cloud tóm tắt những cải tiến quan trọng đối với dữ liệu và AI Cloud vào năm 2023 trên 3 lĩnh vực: kết nối, ứng dụng AI vào dữ liệu và tăng năng suất cho việc phân tích và tối ưu hóa khối lượng công việc. Hãy cùng Cloud Ace tìm hiểu nhé.
Với những thách thức về dữ liệu như: kích thước, định dạng, trên cơ sở hạ tầng on-premise hay trên cloud, quá nhiều công cụ để migrate dữ liệu, nhờ AI Cloud của Google, doanh nghiệp có thể kết nối với dữ liệu của mình ở nhiều cấp độ:
1. Kết nối dữ liệu cấu trúc và phi cấu trúc:
Google Cloud vừa áp dụng rộng rãi BigLake Object Tables cho phép người dùng truy cập, chuyển đổi, xử lý và truy vấn dữ liệu phi cấu trúc bằng SQL dễ dàng. Đồng thời, Google còn hỗ trợ cho định dạng tệp Hudi và Delta trong Biglake.
Người dùng có thể sử dụng tính năng nhập luồng thông lượng cao trong Cloud Storage, tối ưu hóa lưu trữ tự động cho Lakehouse, và thực hiện giao dịch DML sử dụng BigLake để cho phép sửa đổi nhất quán và cải thiện bảo mật dữ liệu, mà vẫn duy trì khả năng tương thích với đầu đọc Iceberg.
2. Kết nối dữ liệu trên các đám mây
Nhiều doanh nghiệp quản lý và phân tích dữ liệu trên GCP, AWS, Azure bằng BigQuery Omni. Google Cloud đã bổ sung thêm tính năng hỗ trợ cho các chế độ xem cụ thể hóa và tham gia trên multi cloud. Đồng thời, Google cũng đã mở rộng phân tích sang dữ liệu on-premise bằng cách đưa Dataproc Spark lên Cloud, giúp doanh nghiệp có thể kết nối Spark với BigQuery cũng như chạy Spark trên các dự liệu nhạy cảm trong Data Center của mình.
3. Kết nối và quản lý dữ liệu
Với Dataplex, Google đã bổ sung khả năng lập hồ sơ thông minh cho dữ liệu giúp doan nghiệp có cái nhìn tổng quan cho tất cả dữ liệu và nội dung AI của mình như: mô hình vertex AI, cơ sở dữ liệu vận hành và phân tích trên Google Cloud và Omni.
4. Chia sẻ dữ liệu
Nhằm hỗ trợ cho việc kết nối dữ liệu, BigQuery data clean rooms giúp doanh nghiệp chia sẻ, so khớp các file cũng như cộng tác phân tích với các đối tác đáng tin cậy đồng thời tôn trọng quyền bảo mật và riêng tư của người dùng.
5. Tối ưu hóa chi phí:
Với các phiên bản định giá BigQuery cùng với những cải tiến về tính năng tự động chia tỷ lệ vị trí và mô hình thanh toán bộ nhớ nén mới, việc kết nối sẽ không còn tốn kém và không thể dự đoán như trước.
Dưới đây là cách Google Cloud cải tiến BigQuery để hỗ trợ AI:
Truy cập vào các mô hình nền tảng
Cho phép người dùng truy cập trực tiếp các mô hình nền tảng của Vertex AI từ BigQuery.
Lợi ích:
Sử dụng các khả năng của GenAI như: phân tích văn bản trên dữ liệu, tạo các thuộc tính mới, sử dụng Vertex Doc AI để triển khai trình trích xuất LLM được cá nhân hóa, truy cập trực tiếp từ BigQuery để trích xuất kiến thức cụ thể từ dữ liệu văn bản.
Mở rộng phạm vi các mô hình AI
Cho phép truy cập vào hệ sinh thái gồm pretrained models và open ML frameworks với BigQuery ML inference engine
Lợi ích:
Chạy dự đoán trên các mô hình translation, ngôn ngữ tự nhiên và vision của Google trong BigQuery, nhập mô hình ở các định dạng như TensorFlow Lite, ONNX và XGBoost, đồng thời sử dụng trực tiếp các mô hình được lưu trữ trong Vertex AI.
Tính năng và vector embeddings
Với BigQuery feature tables và vector embeddings cho phép người dùng xây dựng các tìm kiếm ngữ nghĩa và thực hiện các truy vấn đề xuất trên quy mô dữ liệu BigQuery real-time.
Ngoài ra, Google Cloud còn tự động đồng bộ hóa dữ liệu vào Vertex AI Feature Store, cho phép cung cấp ứng dụng web với độ trễ thấp mà không cần phải di chuyển bất kỳ dữ liệu nào.
Không gian hợp nhất cho dữ liệu và AI
BigQuery Studio cho phép kết hợp các khối lượng công việc kỹ thuật dữ liệu, phân tích và ML, giúp người dùng chỉnh sửa SQL, Python, Spark và các môi trường khác ngôn ngữ và dễ dàng chạy phân tích ở quy mô petabyte và không cần thêm chi phí quản lý cơ sở hạ tầng.
1. Phân tích dữ liệu với AI
Với Duet AI trong BigQuery, người dùng có thể đơn giản hóa việc phân tích dữ liệu, tạo code và tối ưu hóa khối lượng công việc, cụ thể như sau:
2. Quản trị dữ liệu với AI
Duet AI trong Dataplex có thể được sử dụng để thu thập insight về metadata. Bên cạnh đó Duet AI còn giúp người dùng phân tích nhờ các câu hỏi được đặt ra dựa trên metadata, kiểu sử dụng.
3. AI cho hệ thống business intelligence
Hơn 10 triệu người dùng truy cập Looker mỗi tháng và họ có thể hiểu rõ hơn với quyền truy cập vào hơn 1.000 nguồn dữ liệu và hơn 800 trình kết nối cộng đồng.
Với Duet AI trong Looker, người dùng có thể phân tích dữ liệu hội thoại bằng ngôn ngữ tự nhiên. Nó cho phép
Tìm hiểu thêm về chương trình ưu đãi Google Cloud Platform tại Cloud Ace's Promotion
Cloud Ace - Managed Service Partner của Google Cloud