66B là một mô hình ngôn ngữ lớn (LLM) với tham số khoảng 66 tỷ, được thiết kế để xử lý ngôn ngữ tự nhiên ở mức độ cao và hỗ trợ nhiều nhiệm vụ khác nhau như sinh văn bản, tóm tắt và phân tích ý nghĩa.
Mô hình dựa trên kiến trúc transformer với cơ chế tự chú ý (self-attention) cho phép nó học các mối quan hệ dài ngắn trong dữ liệu. Quá trình huấn luyện kết hợp dữ liệu văn bản đa lĩnh vực và tối ưu hóa trên nhiều tác vụ để tăng tính tổng quát.

Để xây dựng một mô hình 66B, tập dữ liệu gồm hàng tỷ câu từ các nguồn công khai và hợp đồng có bản quyền được xử lý để loại bỏ nội dung nhạy cảm. Quá trình huấn luyện chiếm thời gian và tài nguyên tính toán đáng kể, đòi hỏi hạ tầng GPU/TPU mạnh mẽ và kỹ thuật tối ưu hóa hiệu quả.
66B cho thấy khả năng sinh văn bản tự nhiên, trả lời câu hỏi và hoàn thành nhiệm vụ hiểu ngữ nghĩa. Tuy vậy, nó vẫn đối mặt với hạn chế như tiềm ẩn sai lệch, thiên vị và phụ thuộc vào chất lượng dữ liệu huấn luyện. Việc đánh giá và kiểm soát chất lượng đầu ra là cần thiết khi áp dụng vào thực tế.

Trong môi trường doanh nghiệp, 66B có thể hỗ trợ tự động hóa hỗ trợ khách hàng, tổng hợp tài liệu, phân tích dữ liệu văn bản và tạo nội dung, đồng thời đòi hỏi quản trị rủi ro và tuân thủ nội quy dữ liệu.
