Chào mừng đến với Diễn đàn lập trình - Cộng đồng lập trình.
Kết quả 1 đến 5 của 5
  1. #1

  2. #2
    Ngày tham gia
    Sep 2015
    Bài viết
    0
    Trích dẫn Gửi bởi zstar
    sao bạn không dùng biểu thức chính qui
    nếu dùng biểu thức chính qui thì code cứng lun ,khi trang web thay đổi cấu trúc thì mình hok rút trích được nữa, với lại mình rút trích số lượng lớn các trang web nếu dùng biểu thức chính qui thì phải tạo mẫu cho từng trang thì rất lâu.............................
    cám ơn bạn đã trả lời

  3. #3
    Ngày tham gia
    Sep 2015
    Bài viết
    0

    Chuyển Từ trang HTML sang Cây HTML DOM như thế nào??

    Các bạn giúp mình với ,hiện mình đang làm đề tài luận văn thu thập sản phẩm từ các trang web thương mại điện tử và so sánh giá (giống trang web aha.net) ,minh đang gặp vấn đề ngay chổ bóc tách dữ liệu , ý của mình mún là lấy nội dung trang web (mã HTML) chuyển sang dạng cây HTML để mình duyệt tất cả các node của cây HTML rùi chọn node chứa thông tin cần rút trích.
    Các bạn giúp đỡ mình nha cám ơn các bạn rất nhìu............[IMG]images/smilies/online.gif[/IMG][IMG]images/smilies/online.gif[/IMG]

  4. #4
    Ngày tham gia
    Sep 2015
    Bài viết
    0
    mình cũng đang làm về cái bóc tách dữ liệu này, viết bằng regular thì mình biết cách làm rồi bây giờ muốn làm cách 2 là dùng DOM để tiến hành bóc tách, ai biết cách chuyển từ html sang dạng tree DOM thì bảo mình với. Thanks mọi người.

  5. #5
    Ngày tham gia
    Sep 2015
    Bài viết
    0
    cũng có thể làm như thế này

    ví dụ tìm tất cả thẻ link , thay đuờng dẫn đến trang google


    Mã:
     HtmlDocument doc = new HtmlDocument(); doc.Load("file.htm"); foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//a[@href"]) {    HtmlAttribute att = link["href"];    att.Value =“http://google.com”; }doc.Save(“file.htm”);

 

 

Quyền viết bài

  • Bạn Không thể gửi Chủ đề mới
  • Bạn Không thể Gửi trả lời
  • Bạn Không thể Gửi file đính kèm
  • Bạn Không thể Sửa bài viết của mình
  •