Asset 15

Phân Tích Dữ Liệu Với AI

Asset 15

AI đang ngày càng đóng vai trò quan trọng trong các hoạt động của doanh nghiệp. Bài viết dưới đây, là cách mà Google Cloud tóm tắt những cải tiến quan trọng đối với dữ liệu và AI Cloud vào năm 2023 trên 3 lĩnh vực: kết nối, ứng dụng AI vào dữ liệu và tăng năng suất cho việc phân tích và tối ưu hóa khối lượng công việc. Hãy cùng Cloud Ace tìm hiểu nhé.

Kết nối tất cả dữ liệu doanh nghiệp

Với những thách thức về dữ liệu như: kích thước, định dạng, trên cơ sở hạ tầng on-premise hay trên cloud, quá nhiều công cụ để migrate dữ liệu, nhờ AI Cloud của Google, doanh nghiệp có thể kết nối với dữ liệu của mình ở nhiều cấp độ:

1. Kết nối dữ liệu cấu trúc và phi cấu trúc: 

Google Cloud vừa áp dụng rộng rãi BigLake Object Tables cho phép người dùng truy cập, chuyển đổi, xử lý và truy vấn dữ liệu phi cấu trúc bằng SQL dễ dàng. Đồng thời, Google còn hỗ trợ cho định dạng tệp Hudi và Delta trong Biglake.

Người dùng có thể sử dụng tính năng nhập luồng thông lượng cao trong Cloud Storage, tối ưu hóa lưu trữ tự động cho Lakehouse, và thực hiện giao dịch DML sử dụng BigLake để cho phép sửa đổi nhất quán và cải thiện bảo mật dữ liệu, mà vẫn duy trì khả năng tương thích với đầu đọc Iceberg.

2. Kết nối dữ liệu trên các đám mây

Nhiều doanh nghiệp quản lý và phân tích dữ liệu trên GCP, AWS, Azure bằng BigQuery Omni. Google Cloud đã bổ sung thêm tính năng hỗ trợ cho các chế độ xem cụ thể hóa và tham gia trên multi cloud. Đồng thời, Google cũng đã mở rộng phân tích sang dữ liệu on-premise bằng cách đưa Dataproc Spark lên Cloud, giúp doanh nghiệp có thể kết nối Spark với BigQuery cũng như chạy Spark trên các dự liệu nhạy cảm trong Data Center của mình.

3. Kết nối và quản lý dữ liệu

Với Dataplex, Google đã bổ sung khả năng lập hồ sơ thông minh cho dữ liệu giúp doan nghiệp có cái nhìn tổng quan cho tất cả dữ liệu và nội dung AI của mình như: mô hình vertex AI, cơ sở dữ liệu vận hành và phân tích trên Google Cloud và Omni.

4. Chia sẻ dữ liệu

Nhằm hỗ trợ cho việc kết nối dữ liệu, BigQuery data clean rooms giúp doanh nghiệp chia sẻ, so khớp các file cũng như cộng tác phân tích với các đối tác đáng tin cậy đồng thời tôn trọng quyền bảo mật và riêng tư của người dùng.

5. Tối ưu hóa chi phí: 

Với các phiên bản định giá BigQuery cùng với những cải tiến về tính năng tự động chia tỷ lệ vị trí và mô hình thanh toán bộ nhớ nén mới, việc kết nối sẽ không còn tốn kém và không thể dự đoán như trước.

Ứng dụng AI vào dữ liệu

Dưới đây là cách Google Cloud cải tiến BigQuery để hỗ trợ AI:

Truy cập vào các mô hình nền tảng

Cho phép người dùng truy cập trực tiếp các mô hình nền tảng của Vertex AI từ BigQuery

Lợi ích: 

Sử dụng các khả năng của GenAI như: phân tích văn bản trên dữ liệu, tạo các thuộc tính mới, sử dụng Vertex Doc AI để triển khai trình trích xuất LLM được cá nhân hóa, truy cập trực tiếp từ BigQuery để trích xuất kiến ​​thức cụ thể từ dữ liệu văn bản.

Mở rộng phạm vi các mô hình AI

Cho phép truy cập vào hệ sinh thái gồm pretrained models và open ML frameworks với BigQuery ML inference engine

Lợi ích:

Chạy dự đoán trên các mô hình translation, ngôn ngữ tự nhiên và vision của Google trong BigQuery, nhập mô hình ở các định dạng như TensorFlow Lite, ONNX và XGBoost, đồng thời sử dụng trực tiếp các mô hình được lưu trữ trong Vertex AI.

Tính năng và vector embeddings

Với BigQuery feature tables và vector embeddings cho phép người dùng xây dựng các tìm kiếm ngữ nghĩa và thực hiện các truy vấn đề xuất trên quy mô dữ liệu BigQuery real-time. 

Ngoài ra, Google Cloud còn tự động đồng bộ hóa dữ liệu vào Vertex AI Feature Store, cho phép cung cấp ứng dụng web với độ trễ thấp mà không cần phải di chuyển bất kỳ dữ liệu nào.

Không gian hợp nhất cho dữ liệu và AI

BigQuery Studio cho phép kết hợp các khối lượng công việc kỹ thuật dữ liệu, phân tích và ML, giúp người dùng chỉnh sửa SQL, Python, Spark và các môi trường khác ngôn ngữ và dễ dàng chạy phân tích ở quy mô petabyte và không cần thêm chi phí quản lý cơ sở hạ tầng.

Tăng năng suất với AI

1. Phân tích dữ liệu với AI

Với Duet AI trong BigQuery, người dùng có thể đơn giản hóa việc phân tích dữ liệu, tạo code và tối ưu hóa khối lượng công việc, cụ thể như sau:

  • -  Hỗ trợ viết các truy vấn SQL và mã Python, cho phép người udngf tập trung hơn vào logic và kết quả.
  • - Tự động đề xuất coce real-time và tạo ra các hàm và code blocks đầy đủ
    Giúp bạn xử lý dữ liệu bằng trải nghiệm trò chuyện.
  • - Google  đã đưa Duet AI vào dịch vụ migrate dữ liệu để giúp hiện đại hóa các ứng dụng cũ thông qua các bản dịch SQL tự động.

2. Quản trị dữ liệu với AI

Duet AI trong Dataplex có thể được sử dụng để thu thập insight về metadata. Bên cạnh đó Duet AI còn giúp người dùng phân tích nhờ các câu hỏi được đặt ra dựa trên metadata, kiểu sử dụng.

3. AI cho hệ thống business intelligence

Hơn 10 triệu người dùng truy cập Looker mỗi tháng và họ có thể hiểu rõ hơn với quyền truy cập vào hơn 1.000 nguồn dữ liệu và hơn 800 trình kết nối cộng đồng.

Với Duet AI trong Looker, người dùng có thể phân tích dữ liệu hội thoại bằng ngôn ngữ tự nhiên. Nó cho phép

  • - Thực hiện phân tích dữ liệu hội thoại bằng ngôn ngữ tự nhiên
  • - Tự động tạo trang tổng quan và báo cáo bằng cách cho Looker biết mục tiêu phân tích
  • - Tạo bản trình bày trên Google Slide với các bản tóm tắt thông minh từ trang tổng quan Looker.
  • - Sử dụng ngôn ngữ tự nhiên để nhanh chóng tạo các phép tính và hình ảnh.
  • - Tạo code LookML nhanh chóng và chỉ định mục đích của mô hình dữ liệu bằng ngôn ngữ tự nhiên

Tìm hiểu thêm về chương trình ưu đãi Google Cloud Platform tại Cloud Ace's Promotion

Cloud Ace - Managed Service Partner của Google Cloud

  • Trụ sở: Tòa Nhà H3, Lầu 1, 384 Hoàng Diệu, Phường 6, Quận 4, TP. HCM.
  • Văn phòng đại diện: Tầng 2, 25t2 Hoàng Đạo Thúy, Phường Trung Hoà, Quận Cầu Giấy, Thành phố Hà Nội.
  • Email: sales.vn@cloud-ace.com
  • Hotline: 028 6686 3323
  • Website: https://cloud-ace.vn/

Tin tức liên quan

Shopping Basket
viVietnamese