Thiết kế dữ liệu SFT cho LLM: chất, đa dạng, và chống học vẹt
Sổ tay lưu trữ về thiết kế dữ liệu cho supervised fine-tuning (SFT) — bước dạy một LLM nền làm theo chỉ dẫn / một tác vụ cụ thể. Tổng hợp từ các paper công khai 2023–2025. Viết để sau này đọc lại không phải research từ đầu. 0. Trước hết: SFT thực sự dạy gì? Hiểu lầm phổ biến nhất: coi SFT như “nhồi kiến thức” vào model. Không phải. ...