Mình/em đang có đề tài sử dụng LibSVM, hiện đang bị ngơ ở chỗ tạo dataset cho SVM.
Cụ thể hơn, mình đang có đề tài phân loại các "bình luận" theo 3 chiều hướng: "Tích cực", "Tiêu cực", "Trung gian" (với lần lượt nhãn là 1, -1, 0).
Bằng một cách nào đó, mình có một List các kiểu Comment với cấu trúc cơ bản là: string Content (nội dung của bình luận), int Label (nhãn cho bình luận).
Tức là đã có một danh sách các Comment rồi. Hiện đang thắc mắc chuyển các dữ liệu này thành dataset cho SVM để SVM tạo thành mẫu chuẩn để phân loại sau này.
Mô tả hơi khó hiểu, nhưng mà ai có/đã/đang biết hoặc làm qua SVM về phân lớp văn bản thì vào giúp mình/em với... Hoặc ai có tut hướng dẫn kỹ về SVM hoặc phần này thì cho em xin cũng được, search google thì thấy nói mông lung lắm.
Cụ thể hơn, mình đang có đề tài phân loại các "bình luận" theo 3 chiều hướng: "Tích cực", "Tiêu cực", "Trung gian" (với lần lượt nhãn là 1, -1, 0).
Bằng một cách nào đó, mình có một List các kiểu Comment với cấu trúc cơ bản là: string Content (nội dung của bình luận), int Label (nhãn cho bình luận).
Tức là đã có một danh sách các Comment rồi. Hiện đang thắc mắc chuyển các dữ liệu này thành dataset cho SVM để SVM tạo thành mẫu chuẩn để phân loại sau này.
Mô tả hơi khó hiểu, nhưng mà ai có/đã/đang biết hoặc làm qua SVM về phân lớp văn bản thì vào giúp mình/em với... Hoặc ai có tut hướng dẫn kỹ về SVM hoặc phần này thì cho em xin cũng được, search google thì thấy nói mông lung lắm.
Comment