66b là một dự án trí tuệ nhân tạo nhằm triển khai một mô hình ngôn ngữ lớn ở quy mô 66 tỷ tham số. Mục tiêu của dự án là mang lại khả năng hiểu và sinh ngôn ngữ tự nhiên ở nhiều ngôn ngữ và ngữ cảnh khác nhau, đồng thời tối ưu chi phí tính toán và tiêu thụ năng lượng.
\nDữ liệu huấn luyện được thu thập từ nguồn mở và phù hợp với quy định, đại diện cho nhiều ngôn ngữ và thể loại văn bản. 66b được thiết kế với các biện pháp an toàn và cơ chế kiểm soát nội dung nhằm giảm thiểu định kiến, bảo vệ quyền riêng tư và hạn chế thông tin độc hại.
\n66b dựa trên kiến trúc transformer với nhiều lớp tự chú ý và khối feed-forward được tối ưu hóa cho hiệu suất. Quá trình học kết hợp giữa học có giám sát và học tự giám sát, cho phép mô hình rút ra đặc trưng từ dữ liệu lớn và học được khả năng suy đoán khi gặp ngữ cảnh mới.
\n
Trong thực tế, 66b có thể hỗ trợ viết mã, tổng hợp văn bản, phân tích dữ liệu và cung cấp phản hồi tự nhiên trong giao diện người dùng. Nhóm phát triển nhắm tới tích hợp mỏng với hệ sinh thái phần mềm hiện có và đảm bảo tuân thủ các tiêu chuẩn đạo đức và an toàn.
\nĐạo đức và an toàn là ưu tiên hàng đầu. Các thách thức gồm giảm định kiến, đảm bảo quyền riêng tư, kiểm soát nội dung nhạy cảm và minh bạch về cách mô hình được huấn luyện cũng như giới hạn sử dụng.
\nTương lai của 66b được liên kết chặt chẽ với sự tham gia của cộng đồng. Người dùng và nhà phát triển có thể đóng góp dữ liệu, tài nguyên, phần mềm và bài kiểm tra. Cộng đồng mở giúp cải thiện mô hình, chia sẻ bài học và xây dựng ứng dụng có trách nhiệm.
\n