RAG là gì?

timingdeptry · 13/6/25

RAG kết hợp hai bước chính:

Retrieval (Truy xuất):
- Nó tìm kiếm thông tin từ một cơ sở dữ liệu, tài liệu, hoặc nguồn kiến thức bên ngoài (kiểu như vector database hoặc Elasticsearch).
- Thay vì bắt mô hình tự "bịa" câu trả lời dựa trên training data, nó lấy thông tin thực tế từ cơ sở dữ liệu.
- Dữ liệu truy xuất này sẽ làm đầu vào bổ sung cho mô hình.
Generation (Sinh ngôn ngữ):
- LLM (ví dụ: GPT) xử lý dữ liệu truy xuất được để sinh ra câu trả lời "chất hơn nước cất".
- Kết hợp thông tin lấy được với khả năng sinh ngôn ngữ của nó.

Nó làm gì khác biệt?

Thông thường, LLM như GPT chỉ trả lời dựa trên context nó đã học. Nhưng với RAG, nó dùng:

Kiến thức luôn cập nhật: Không giới hạn trong những gì đã được học từ trước.
Trả lời chính xác hơn: Nhờ thông tin từ database hoặc nguồn dữ liệu đáng tin.

Ứng dụng của RAG

Chatbots doanh nghiệp: Kết nối với tài liệu nội bộ (FAQ, chính sách) để trả lời khách hàng.
Tìm kiếm thông minh: Hỗ trợ tìm kiếm theo ngữ nghĩa, kết hợp cả truy vấn chính xác và tự nhiên.
Học tập và nghiên cứu: Tóm tắt hoặc giải thích tài liệu dài.

Ví dụ

User hỏi: "Công ty X có chi nhánh nào ở Việt Nam không?"
RAG:
1. Lấy thông tin chi nhánh từ cơ sở dữ liệu công ty (retrieval).
2. LLM tổng hợp: "Công ty X có chi nhánh tại Hà Nội và TP.HCM."

Chào mừng!!