Announcement

Collapse
No announcement yet.

[Decision tree]

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • [Decision tree]

    Chào mọi người.
    Em đang tìm hiểu về việc phân loại dữ liệu và cần dùng đến thuật toán cây quyết định (decision tree) cụ thể hơn là ID3.
    Em có một chút thắc mắc.

    Ở link trên có 1 ví dụ mô tả việc xây dựng 1 cây quyết đinh.
    Em ko hiểu tại sao sau khi xây dựng thì yếu tố " Temp" bị mất - ko xuất hiện trong cây quyết định.
    Em xin chân thành cảm ơn. )))

  • #2
    Theo mình nghĩ tại vì tập Temp là tập dữ kiện thừa. Khi xây dựng cây quyết định sẽ loại bỏ những dữ liệu dư ra.
    Có thể thấy dù dữ liệu ở tập Temp thế nào đi nữa thì vẫn không ảnh hưởng tới kết quả cuối.
    Quyết định cuối cùng vẫn dựa vào các tập thuộc tính khác. Vậy nên sẽ loại bớt thuộc tính Temp

    Comment


    • #3
      Thế trong 1 bảng dữ liệu thì làm sao biết được cái tập nào là thừa ạ?

      Comment


      • #4
        Originally posted by 12520252 View Post
        Chào mọi người.
        Em đang tìm hiểu về việc phân loại dữ liệu và cần dùng đến thuật toán cây quyết định (decision tree) cụ thể hơn là ID3.
        Em có một chút thắc mắc.

        Ở link trên có 1 ví dụ mô tả việc xây dựng 1 cây quyết đinh.
        Em ko hiểu tại sao sau khi xây dựng thì yếu tố " Temp" bị mất - ko xuất hiện trong cây quyết định.
        Em xin chân thành cảm ơn. )))
        Thấy bài của em cùng khoa, anh ghé vào. Lâu rồi mới ghé forum chém gió

        Vào chủ đề chính thôi. Thật ra, trước khi đọc bài của em, anh không hề biết cái thuật toán Decision Tree này. Nhưng sau khi đọc + research, suy nghĩ thì anh thấy lý do Temp không xuất hiện là vì dựa vào data đã cho, dùng Outlook làm root-node sinh ra cây quyết định tốt hơn dùng Temp. Mà khi dùng Outlook rồi thì Temp không cần xuất hiện nữa.

        Em có thể tham khảo thêm ở đây: http://bis.net.vn/forums/p/378/661.aspx#661
        Có giận có hờn xin hãy bỏ qua
        Nhiều lúc chỉ là lời nói bâng quơ vô ý mà thôi.hỳ hỳ

        Comment


        • #5
          Em cảm ơn a về tài liệu tham khảo.
          Nhưng làm sao biết được " dùng Outlook làm root-node sinh ra cây quyết định tốt hơn dùng Temp" ạ?
          Và nếu như Outlook xứng đáng được làm root-node thì Temp có thể làm decision-node như Humidity và Windy mà ạ.
          Em vẫn chưa hiểu được phần này.
          :sosad:
          Last edited by 12520252; 13-11-2015, 16:12.

          Comment


          • #6
            Trong tài liệu nó có nói đó bạn, họ dùng Entropy và Information Gain (độ lợi thông tin) để tính xem thuộc tính nào làm nút gốc, rồi từ đó phân nhánh ra. ID3 Decision Tree là thuật toán kinh điển trong phân lớp dữ liệu. Bạn dễ dàng tìm ra nhiều tài liệu về nó. http://luanvan.co/luan-van/de-tai-mo...et-dinh-45033/ .Có trang này mình thấy khá chi tiết nè.

            Comment

            LHQC

            Collapse
            Working...
            X