Announcement

Collapse
No announcement yet.

Lấy tin tức tự động từ website sử dụng Xpath

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • [Java] Lấy tin tức tự động từ website sử dụng Xpath

    Chào các bạn,

    Mình chỉ mới làm quen với java gần đây thôi. Hiện tại mình đang gặp một vấn đề trong java mà người ra đề này không có giải thích gì thêm. Mong các bạn bớt chút thời gian cho mình một vài ý tưởng, phương hướng. Xin cảm ơn các bạn.

    Vấn đề như sau:

    Viết chương trình lấy tin tức tự động từ các báo điện tử gồm các chức năng sau:

    Chức năng 1:
    Ánh xạ các thành phần của một báo điện tử dựa vào XPath: đối với một trang báo điện tử, trang đó đã được phân chia thành các chủ đề cụ thể (Ví dụ: tin thế giới, tin khoa học, tin giáo dục, ...).

    Với mỗi chủ đề cần lấy tin, các thông tin sau cần được ánh xạ để có thể lấy tin tự động:
    + WebLink của chủ đề.
    + XPath đến nơi chứa một tin, đối với mỗi tin cần thêm các thông tin sau:
    * XPath đến link của tin
    * XPath đến title của tin
    * XPath đến hình ảnh của tin
    * XPath đến ngày, giờ đưa tin
    * XPath đến mô tả tóm tắt về tin
    + XPath đến weblink đến trang tiếp theo trong chủ đề. Ví dụ: đang ở trang 1 trong chủ đề tin thế giới cần link qua trang thứ 2, đang ở trang thứ 2 cần link qua trang 3, ... Việc này bảo đảm để lấy tất cả các tin trong một chủ đề.

    -------

    Mình không hiểu cái yêu cầu này mà hỏi thì người ra đề không có phản hồi. Mong các bạn giúp mình. Chân thành cảm ơn.

LHQC

Collapse
Working...
X