PhởGPT – Phiên bản chat GPT chuyên dụng cho tiếng Việt

thelonervn

Active member
Xuất phát từ nhận thức về những hạn chế của các mô hình tiếng Việt đã có. Các thử nghiệm thực tế đã chứng minh rằng những mô hình này chưa đạt được hiệu suất tối ưu, gây khó khăn trong việc ứng dụng cho các mục đích thực tế. Bên cạnh đó việc thiếu một bộ mã nguồn mở, như một nền tảng cho mô hình ngôn ngữ tiếng Việt của người Việt, do người Việt làm chủ, làm giảm khả năng sáng tạo, cũng như những nghi ngại về tính bảo mật khi phải sử dụng phần mềm của nhà cung cấp.

hd.jpg


Những điều này không chỉ đặt ra thách thức đối với việc tạo ra các ứng dụng tiếng Việt chất lượng cao mà còn ảnh hưởng đến sự phát triển của cộng đồng ngôn ngữ tự nhiên trong nước. Vì vậy, một trong những nhiệm vụ cấp bách đặt ra đối với cộng động AI nói chung, cộng đồng ngôn ngữ tự nhiên (NLP) nói riêng là xây dựng một mô hình mới, mạnh mẽ hơn và có khả năng xử lý ngôn ngữ Việt với độ chính xác và hiệu suất cao.

PhởGPT ra đời, phần nào giải quyết được nhiệm vụ trên. PhởGPT có thể được xem như phiên bản ChatGPT chuyên dụng cho tiếng Việt.

Với mô hình ngôn ngữ dữ liệu lớn có 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer. Mô hình này được huấn luyện từ đầu, sử dụng những kỹ thuật tiên tiến nhất hiện có (như cơ chế tập trung chớp nhoáng (Flash Attention), ngoại suy độ dài ngữ cảnh AliBi). Những kỹ thuật này không chỉ giúp mô hình hiểu sâu hơn về ngữ cảnh mà còn làm tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT. Điều này giúp mô hình trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.

hd2.jpg


Bên cạnh ưu điểm là mô hình ngôn ngữ chuyên dụng cho tiếng Việt, sự khác biệt rất lớn của PhởGPT so với ChatGPT nằm ở việc PhởGPT là một dự án mã nguồn mở (Open-source), thay vì là một phần mềm sở hữu riêng như ChatGPT của OpenAI

Việc công khai mã nguồn PhởGPT và sẵn sàng cung cấp cho người, giúp tạo ra một môi trường, cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.

Việc VinAI nghiên cứu và phát triển, công bố PhởGPT hôm nay, sẽ đặt những nền móng đầu tiên cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, làm cơ sở để phát triển các ứng dụng thực tế, hiêụ quả, phù hợp với chiến lược phát triển AI đến năm 2030 của Chính phủ.

Trong thời gian tới, VinAI sẽ có kế hoạch nghiên cứu và phát triển ứng dụng dành cho người dùng cá nhân và các gói giải pháp hỗ trợ chuyên sâu dành cho doanh nghiệp bằng ngôn ngữ tiếng Việt trong các lĩnh vực như Y tế, Giáo dục…

hd3.jpg
 
Bên trên