Hiện tại mình đang làm đề tài về phân lớp văn bản và sử dụng thư viện libsvm. Trong đây mình thấy có cung cấp sẵn các dataset với các đặc trưng phục vụ cho phân lớp. Vấn đề là mình muốn phân lớp cho tiếng Việt chứ không phải tiếng anh. Vây bạn nào biết có tool hay cách nào để rút trích các từ khóa đặc trưng từ 1 văn bản tiếng việt bất kì không, chỉ cho mình với!