66b là một mô hình ngôn ngữ lớn (LLM) với tham số 66 tỷ, được thiết kế để xử lý ngôn ngữ tự nhiên và hỗ trợ nhiều tác vụ như dịch ngữ, tóm tắt và trả lời câu hỏi.

66b dựa trên kiến trúc transformer, có nhiều lớp tiến triển và cơ chế tự chú ý để nắm bắt ngữ cảnh dài. Việc tối ưu hóa tham số và kỹ thuật làm mịn dữ liệu giúp nó hoạt động hiệu quả trên nhiều ngữ cảnh khác nhau.
66b được thử nghiệm trên các tập dữ liệu đa ngôn ngữ và cho kết quả đáng chú ý trong dịch máy, tóm tắt văn bản, sáng tác nội dung và hỗ trợ người dùng trong sản phẩm số. Tuy nhiên, vẫn tồn tại các thách thức về định vị sai lệch và chi phí tính toán.