Dịch vụ đánh giá Gen AI cho phép doanh nghiệp đánh giá bất kỳ mô hình hoặc ứng dụng Gen AI nào theo các tiêu chí riêng bằng cách thực hiện các bước sau:
🔹 Xác định tiêu chí đánh giá
- Điều chỉnh các chỉ số đánh giá mô hình phù hợp với tiêu chí kinh doanh.
- Đánh giá một mô hình riêng lẻ (pointwise) hoặc so sánh hai mô hình để chọn mô hình tối ưu (pairwise).
- Kết hợp các chỉ số tính toán để có cái nhìn chuyên sâu hơn.
🔹 Chuẩn bị file dữ liệu đánh giá
- Cung cấp file dữ liệu phản ánh chính xác trường hợp sử dụng của doanh nghiệp.
🔹 Thực hiện đánh giá
- Đầu tiên, sử dụng mẫu có sẵn hoặc điều chỉnh từ các ví dụ hiện có.
- Xác định mô hình cần đánh giá và tạo EvalTask để tái sử dụng logic đánh giá thông qua Vertex AI.
🔹 Xem và phân tích kết quả
- Diễn giải kết quả để tối ưu hóa mô hình AI của doanh nghiệp.