Hướng Dẫn Lập Trình Crawl (Thu Thập) Dữ Liệu Web với Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 3 พ.ย. 2024

ความคิดเห็น • 50

  • @Peter-Donate
    @Peter-Donate ปีที่แล้ว +9

    Rất thích cách dạy của anh. Nếu a ra các khóa học, em sẽ ủng hộ ạ. E dân trái ngành đang học data analysis, xem của a a dễ hiểu lắm ạ

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว +2

      Cảm ơn em đã luôn ủng hộ CodeXplore nhé 👏 Anh sẽ cố gắng để ra nhiều video chất lượng hơn nữa

    • @nguyenduyta7136
      @nguyenduyta7136 ปีที่แล้ว +1

      @@CodeXploreanh nay cũng 43 tuổi rồi , dân trái ngành, Python basic, cũng muốn học data analysis em nghĩ thế nào, nếu được cho a lời khuyên nhé. Nếu em có mở khóa học thì cho anh thông tin nhé

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว +1

      @@nguyenduyta7136 dạ nếu anh có đam mê yêu thích thì anh vẫn có thể học thêm ở lĩnh vực data analysis ạ. Có thể học thêm các visualisation tool như Power BI hoặc Tableau a nhé! Hiện tại em chưa có các khoá học nào ngoài TH-cam nên anh có thể tham khảo các khoá trên Udemy về Data Analysis ạ

  • @doducanh5098
    @doducanh5098 ปีที่แล้ว +2

    hay qúa. Mong a ra nhiều hơn vì cách dạy của a rất dễ hiểu

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Anh sẽ cố gắng để ra nhiều video hơn nữa nhé ! Cảm ơn Em đã ủng hộ CodeXplore nhiều nhé 👏

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Anh sẽ cố gắng để ra nhiều video hơn nữa nhé ! Càm ơn Em đã ủng hộ CodeXplore nhiều nhé 👏

  • @baophangia5203
    @baophangia5203 ปีที่แล้ว +2

    video rất hay anh ơi. Mong anh có thể ra thêm nhiều video chất lượng

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Nhất định rồi em nhé ! Cảm ơn em nhiều nha

  • @HieuTran-xp9cb
    @HieuTran-xp9cb ปีที่แล้ว

    bổ ích quá, dạy dễ hiểu nữa, mong anh ra nhiều clip nhé

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      cảm ơn em nhiều nhé

  • @kenhcuatrungnguyen
    @kenhcuatrungnguyen 7 หลายเดือนก่อน

    Bạn giảng hay lắm, cảm ơn bạn. Hi vọng sẽ có thêm nhiều clip hướng dẫn.
    vd: Sau khi lấy dữ liệu thì cái này là dữ liệu thô, và ko có get từ api. Nên khi có cập nhật thì mình phải cập nhật thủ công. Đa số sẽ viết 1 cái job chạy tự động sau xxx time để get, và update lại vào store. Ngoài cách thủ công như vậy thì ko biết bạn có cách nào hay hơn không? và làm sao để tự động lấy tin khi có update mới. Cảm ơn bạn

  • @tranandy9108
    @tranandy9108 ปีที่แล้ว +3

    anh dạy dễ hiểu quá. a có thể recomend cho e vài khóa học nên học khi bắt đầu nhảy ngang qua code được ko ạ. E đã học được 1 chút căn bản python

  • @TrungTuan2007
    @TrungTuan2007 ปีที่แล้ว +2

    anh làm tiếp lập trình game bằng python đi, em muốn học nhiều game mà toàn tiếng anh, mong anh hướng dẫn tạo thêm nhiều tựa game hay, cảm ơn anh 😊

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว +1

      Hi em a sẽ cố gắng làm các video về chủ đề lập trình game nhé

  • @izclubcom
    @izclubcom 21 วันที่ผ่านมา

    Với những trang web họ xuất dữ liệu ra bằng javascript, tức là khi chúng ta inspect trang web đó thì thấy được dữ liệu, nếu ctrl+u để viewsource thì chỉ cơ các thẻ tag cơ bản, ko có dữ liệu thì các thư viện Python này có làm được ko bạn? Bạn có thể ra video tiếp không 😊

  • @MinhNguyen-sc1cg
    @MinhNguyen-sc1cg ปีที่แล้ว

    Rất trực quan, cảm ơn b nhé !

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Codexplore rất vui vì video hữu ích vs bạn

  • @sarlavi5665
    @sarlavi5665 ปีที่แล้ว +1

    Úi bữa em cũng nhận được 1 bài test cho job FrontEnd y chang video này luôn anh @@

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว +1

      Ồ thật trùng hợp em nhỉ ? Tại cũng có nhiều bạn hỏi anh về chủ đề này nên anh làm video hướng dẫn luôn 😄

  • @hiendoan7293
    @hiendoan7293 ปีที่แล้ว +1

    quá tuyệt quá bổ ích thank a

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      CodeXplore rất vui khi video hữu ích vs em 😍

  • @trung2403
    @trung2403 ปีที่แล้ว +1

    Những bài học rất thú vị. Nếu có thể hy vọng CodeXplore làm 1 series về Langchain.

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Ok em 👍 anh sẽ nghiên cứu rồi làm nhé

  • @lienvu217
    @lienvu217 8 หลายเดือนก่อน

    Bạn cho mình hỏi, mình cần thu thập dữ liệu từ web khác như shopee chẳng hạn với các nội dung như tên sản phẩm, giá bán hàng, số lượng thì cách làm có tương tự như nội dung hướng dẫn trong video này ko?

  • @tpdakc7904
    @tpdakc7904 10 หลายเดือนก่อน

    cảm ơn anh. a có thể làm video crawl data từ các trang thương mại điện tử không?

  • @quanghuytruong7047
    @quanghuytruong7047 7 หลายเดือนก่อน

    Cho e hỏi nếu trang web yêu cầu đăng nhập mới xem đc dữ liệu mình cần lấy thì mình phải code thêm phần tự đăng nhập vào phải ko ạ?

  • @kenhcuazit6288
    @kenhcuazit6288 ปีที่แล้ว +1

    Làm về docker đi anh ❤

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Ok em để anh nghiên cứu rồi làm nhé

  • @TVQ_Gaming
    @TVQ_Gaming ปีที่แล้ว

    a ra video chỉ cách craw đa luồng được không ạ

  • @chicuongpham9470
    @chicuongpham9470 ปีที่แล้ว

    phần thẻ khi dùng soup.find('body') mình ra no cho ra kết quả như vậy : document.cookie="D1N=ebf8bcb9799b521106133976232e0045"+"; expires=Fri, 31 Dec 2099 23:59:59 GMT; path=/";window.location.reload(true);. Có cách nào khắc phục không bạn mình kẹt chổ này nên không crawl được gì luôn, hay phải dùng selenium cho những trang web dùng script như này. Cảm ơn chia sẽ của bạn

  • @vietle6844
    @vietle6844 6 หลายเดือนก่อน

    anh ơi em ko import được 2 cái thư viện, mà em kiểm tra thì đều cài đặt 2 thư viện đó rồi ạ

  • @dienho5592
    @dienho5592 8 หลายเดือนก่อน

    anh ơi em muốn Export ra csv ạ, mấy nay em loay hoay anh có video hướng dẫn không ạ

    • @kenhcuatrungnguyen
      @kenhcuatrungnguyen 7 หลายเดือนก่อน

      # Tạo data
      data[]
      # Thêm dữ liệu vào danh sách, đưa dòng này vào vòng lặp for để lưu lại toàn bộ danh sách đã lấy được.
      data.append([position, name, country, car, pts])
      # Chuyển đổi danh sách thành DataFrame
      df = pd.DataFrame(data, columns=['Position', 'Name', 'Country', 'Car', 'Points'])
      # Lưu DataFrame thành file Excel
      df.to_excel('formula1_2024_drivers.xlsx', index=False)
      Hi vọng giúp được bạn

  • @nhattanktnn
    @nhattanktnn ปีที่แล้ว +1

    Anh cho em hỏi, sao trong jupyter notebook vscode của em nó không hiện gợi ý nhập như của anh. Có cách nào không ạ

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Hi em em cài extension Python của Vscode chưa

  • @duonghoangyenceo
    @duonghoangyenceo 2 หลายเดือนก่อน

    crawnl xong ko index. tại trùng content cậu ơi.

  • @namphan9377
    @namphan9377 ปีที่แล้ว +1

    Đoạn select kernel em không xuất hiện Python Env là do đâu anh nhỉ?

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Em có tạo virtual env giống a chưa ?

  • @ngoclinhnguyen8708
    @ngoclinhnguyen8708 8 หลายเดือนก่อน

    a ơi, a có nhận crawl data trên foody về không ạ ?

    • @kenhcuatrungnguyen
      @kenhcuatrungnguyen 7 หลายเดือนก่อน

      Crawl shopee hay foody cũng tương tự vậy mà. tuy nhiên nếu crawl shopee hay foody thì crawl theo từng category, lấy thêm hình ảnh lưu về local sau đó insert nó vào excel để lưu offline

  • @hungvan8248
    @hungvan8248 ปีที่แล้ว

    đối với những trang ko có sẵn thẻ như trang f1 thì làm sao anh

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      hi em, thì mình sẽ phải check trong inspect xem là các element mình muốn lấy nó nằm ở trong html tag nào rồi mình scrape e nhé

  • @lochuynh6734
    @lochuynh6734 ปีที่แล้ว +1

    Anh có phải là một fan F1 không anh :))

    • @CodeXplore
      @CodeXplore  ปีที่แล้ว

      Anh có xem nhưng mà là fan phong trào à e 😅

  • @NguyenMinh-tz8lp
    @NguyenMinh-tz8lp ปีที่แล้ว

    cái link invite discord hết hạn rui anh ơi, anh cho em xin lại link vào server với ạ :>

  • @chuyenmon8012
    @chuyenmon8012 ปีที่แล้ว

    mình có một dự án muốn nhờ cao thủ giúp để hoàn thiện (lấy dữ liệu kiểu công văn chỉ đạo từ 1 bảng, lưu file về và đưa lên google sheet). Bác nào có time thì giúp mình nhé. Xin gửi phí ạ

  • @hifii1234
    @hifii1234 ปีที่แล้ว +1

    Lô anh

  • @thiencong9810
    @thiencong9810 7 หลายเดือนก่อน

    cho xin link web codexplore's friends