Khám phá mô hình Ngôn ngữ Lớn – Cơ hội, ứng dụng và tiến bộ mới trong trí tuệ nhân tạo

Vào lúc 14h00 ngày 29/9/2025, tại Phòng P310 – Trung tâm Nghiên cứu xuất sắc và Đổi mới sáng tạo, nhóm Nghiên cứu mạnh về Dữ liệu lớn và Chuyển đổi số (NCM) đã tổ chức một buổi seminar học thuật thu hút sự quan tâm của các giảng viên, nhà nghiên cứu và những người yêu thích lĩnh vực công nghệ số, dữ liệu lớn, cùng các ứng dụng thực tiễn của Trí tuệ nhân tạo (AI).

Giới thiệu chung về Mô hình Ngôn ngữ Lớn

Ngôn ngữ Lớn (Large Language Models – LLM) là các hệ thống trí tuệ nhân tạo được huấn luyện trên một lượng dữ liệu văn bản khổng lồ, nhằm mục đích hiểu, tạo ra và thao tác với ngôn ngữ tự nhiên một cách chính xác và linh hoạt. Đây được xem là một trong những bước tiến đột phá nhất trong lĩnh vực Xử lý Ngôn ngữ Tự nhiên (Natural Language Processing – NLP) và Trí tuệ nhân tạo trong thập kỷ qua.

Các mô hình này dựa trên kiến trúc transformer (Vaswani & cs., 2017), giúp chúng xử lý ngữ cảnh của từ hoặc câu trong toàn bộ văn bản thay vì chỉ dựa trên các phần riêng lẻ. Nhờ đó, LLM không chỉ hiểu được ý nghĩa của từng từ mà còn nắm bắt được sắc thái, ngữ điệu và nội dung sâu sắc của ngôn ngữ, từ đó tạo ra các phản hồi, nội dung mạch lạc, hợp lý và phù hợp với ngữ cảnh.

Đặc điểm nổi bật của LLM:

– Quy mô lớn: Các mô hình này thường có hàng trăm triệu đến hàng trăm tỷ tham số, thể hiện khả năng xử lý dữ liệu phức tạp và đa dạng.

– Đa năng: Có thể được áp dụng trong nhiều lĩnh vực như dịch thuật, tóm tắt văn bản, trả lời câu hỏi, sáng tạo nội dung, lập trình, phân tích dữ liệu và nhiều nhiệm vụ khác.

– Huấn luyện trên dữ liệu khổng lồ: Được xây dựng dựa trên tập dữ liệu phong phú từ sách, báo, trang web, tài liệu khoa học, giúp mô hình có kiến thức rộng và sâu.

– Khả năng suy luận: Không chỉ tạo ra các câu đúng ngữ pháp, LLM còn có khả năng lập luận, giải thích, đưa ra phản hồi phù hợp theo ngữ cảnh, thậm chí xử lý các nhiệm vụ phức tạp hơn như tự động hóa các quy trình hoặc hỗ trợ ra quyết định.

Các ví dụ tiêu biểu của LLM hiện nay:

– GPT của OpenAI

– PaLM của Google

– LLaMA của Meta

– Claude của Anthropic

Những mô hình này đang được ứng dụng rộng rãi trong nhiều lĩnh vực như giáo dục, nghiên cứu, kinh doanh, y tế và công nghiệp, thúc đẩy cuộc cách mạng trong cách con người tương tác với máy tính.

Chia sẻ từ diễn giả:

Trong buổi seminar, TS. Nguyễn Hoàng Huy đã trình bày chi tiết về quá trình nghiên cứu xây dựng các mô hình ngôn ngữ lớn, đặc biệt là mô hình Llama 3.1 của Meta. Bên cạnh đó, ông cũng giới thiệu các nghiên cứu ứng dụng của LLM trong hệ thống RAG (Retrieval-Augmented Generation) cho Chatbot, kỹ thuật phần mềm, xử lý lỗi Text2SQL, và các mô hình dự đoán trong lĩnh vực chứng khoán.

Hình ảnh nổi bật:

TS. Nguyễn Hoàng Huy trình bày trong buổi seminar

Các khách mời tham dự theo dõi phần trình bày

Kết thúc phần trình bày, các diễn giả và khách mời đã có những trao đổi sôi nổi, tích cực về tiềm năng và ứng dụng thực tiễn của các mô hình LLM trong nhiều lĩnh vực khác nhau.

Kết luận:

Buổi seminar đã cung cấp cho người tham dự những kiến thức bổ ích, giúp hiểu rõ hơn về công nghệ LLM, các tiến bộ mới nhất và những ứng dụng thực tiễn đang mở ra trong thời đại chuyển đổi số mạnh mẽ hiện nay. Đây là dịp để các nhà nghiên cứu, giảng viên và những người quan tâm lĩnh vực công nghệ cập nhật các xu hướng mới, góp phần thúc đẩy các dự án nghiên cứu và ứng dụng trong tương lai.

Khoa CNTT

Tin cùng thể loại