Web Scraping Using Python | GeeksforGeeks

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 ก.ค. 2024
  • Web Scraping is the process of extracting data from a website and this extracted data can be stored in various formats like SQL, Excel, and HTML. Although there are various tools available to perform web scraping - Python is considered as one of the best for Web Scraping especially due to Beautiful Soup, Scrapy, and other libraries that support web scraping.
    Here, in this video, we're going to discuss all the steps from scratch required to do Web Scraping using Python such as what dependencies you need to install, what code you need to write along with its explanation, etc. with a live implementation example.
    Check Out the Related Articles:
    What is Web Scraping and How to Use It?[www.geeksforgeeks.org/what-is...]
    Implementing Web Scraping in Python with BeautifulSoup [www.geeksforgeeks.org/impleme...]
    00:00 Introduction
    00:30 Primary Requirement - Install Python
    01:14 How to Install Beautiful Soup?
    02:18 How to Install Requests Module?
    02:42 What is Web Scraping in actual?
    03:28 Web Scraping using Python - Live Implementation
    06:10 How to Get Specific Data from Web Scraping
    07:45 Closing Notes!
    This video is contributed by Ishan Sharma
    LinkedIn profile of the contributor - / ishansharma7390
    -------------------------------------------------------------------------
    🔴 Data Science Projects made easy with Colab AI: • DATA SCIENCE PROJECTS ...
    🔴 Machine Learning Projects [Playlist]: • Machine Learning Projects
    🔴 Python Projects [Playlist]: • Top Python Projects fo...
    🔴 Data Science Concepts: • Data Science Concepts ...
    🔴 Career in DATA ANALYTICS | DATA ANALYST at AMERICAN EXPRESS: • Career in DATA ANALYTI...
    -------------------------------------------------------------------------
    📚 Explore Our Courses: practice.geeksforgeeks.org/co...
    -------------------------------------------------------------------------
    Follow us for more fun, knowledge, and resources:
    💬 Twitter- / geeksforgeeks
    🧑‍💼 LinkedIn- / geeksforgeeks
    📷 Instagram- geeks_for_g...
    💌 Telegram- t.me/s/geeksforgeeks_official
    📱 Download GeeksforGeeks' Official App: geeksforgeeksapp.page.link/gf...
    Please Like, Comment, and Share the Video among your friends.
    #python #webscraping #learnpython #beautifulsoup #installpython #pythonprojects #pythontutorial #scrapy

ความคิดเห็น • 94

  • @GeeksforGeeksVideos
    @GeeksforGeeksVideos  7 หลายเดือนก่อน

    Check out our Top Python Project Series: th-cam.com/play/PLqM7alHXFySExPLJSzpKfKe6JO44Qm0qj.html&si=af1b545THp3WUo94

  • @GeeksforGeeksVideos
    @GeeksforGeeksVideos  3 ปีที่แล้ว +13

    WISH TO CONTRIBUTE VIDEOS ON GEEKSFORGEEKS? Please submit this Google Form: docs.google.com/forms/d/e/1FAIpQLScSVFlE-stz69M_l46xcwZlVRzDxT_91dlc-px5ytr7QHYmkQ/viewform

  • @prasiddhgoel
    @prasiddhgoel 3 ปีที่แล้ว +43

    thanks dude you helped me out in 8 minutes that i couldnt even learn in like 1 hour tutorial thank you!

  • @ali57555
    @ali57555 2 ปีที่แล้ว +26

    I really hoped this video would be longer. This was great

  • @yosefasefaw4207
    @yosefasefaw4207 10 หลายเดือนก่อน +5

    very good video! clear concise and straight to the point.
    thanks!

  • @kodaliharshini9020
    @kodaliharshini9020 ปีที่แล้ว +2

    @ishansharma instead of html.parser,what's d cmd used when we require data inform of CSV?

  • @shereenabbas1423
    @shereenabbas1423 10 หลายเดือนก่อน

    Thank you very much!!! On point, fast, simple, worked straight away!

  • @Autoscraping
    @Autoscraping 6 หลายเดือนก่อน +2

    An extraordinary piece of video material that has proven highly useful for our new team members. Your generosity is immensely appreciated!

  • @unstoppablesaad1978
    @unstoppablesaad1978 11 หลายเดือนก่อน +2

    Hi bro, the prettify code is running but when i write get_text code it says- pinterest doesn't work unless you turn on java script what to do now?

  • @RogueMoose-ce5sz
    @RogueMoose-ce5sz ปีที่แล้ว

    Man this was helpful, thank you.

  • @benzoateostylezenebicarbon9602
    @benzoateostylezenebicarbon9602 ปีที่แล้ว

    the library in the background is actually such a good library.

  • @sainathchowdhary8744
    @sainathchowdhary8744 3 ปีที่แล้ว +4

    Thanks for making an amazing video and thanks for involving our inspiration Ishaan Sharma in this video.

  • @ucpian642
    @ucpian642 ปีที่แล้ว +1

    Excellent way of Teaching

  • @HussainKiFamily
    @HussainKiFamily ปีที่แล้ว

    Sir jee its urgent. Kesy pata chalyga k buyer k diye gaye stores me kitni products hain?

  • @RajMhamane
    @RajMhamane ปีที่แล้ว

    Thanks a lot for this video !!

  • @MrRajSood01
    @MrRajSood01 ปีที่แล้ว

    hey thanks for the great video but i cant seem to install it on my windows pc.... can anyone help?

  • @user__rahul
    @user__rahul 4 หลายเดือนก่อน

    How can i extract corporate announcement feom nse using python scrapping ? Any idea ?

  • @shrikrishnan_balakrishnan
    @shrikrishnan_balakrishnan 3 ปีที่แล้ว +7

    YOU ARE Genuine Ishan Sharma ❤️

  • @arora-ayush
    @arora-ayush 4 หลายเดือนก่อน +1

    Super useful, thank you for sharing this with us.

  • @architaray4353
    @architaray4353 ปีที่แล้ว

    why this print(res.get_text()) giving me error?

  • @shivkanyabyale6804
    @shivkanyabyale6804 11 หลายเดือนก่อน

    Can anyone help how to get all text data but not the footer and header

  • @pinkisarkar7883
    @pinkisarkar7883 ปีที่แล้ว

    Excellent for the teaching

  • @sahuyuvraj
    @sahuyuvraj ปีที่แล้ว

    great explanation ❤

  • @palllav508
    @palllav508 3 ปีที่แล้ว +1

    But why are the first two books of hp series missing from your bookshelf

  • @skylarkolisko5245
    @skylarkolisko5245 2 ปีที่แล้ว +1

    Great intro!!

  • @SureshKumar-gg5wu
    @SureshKumar-gg5wu 2 หลายเดือนก่อน

    Bro my project is government schemes chat bot I scraped the data and it is unstructured and the data get structured and how to retrieve the information when I gave any scheme It given to scheme name and details and apply link and age limit

  • @akshaykalamkar1545
    @akshaykalamkar1545 3 ปีที่แล้ว

    Hello bro.......how to scrap 1000 websites in one run......... manually scrapping is too hard...can we scrap at single click

  • @nayanboro6005
    @nayanboro6005 ปีที่แล้ว

    How can we scrap data from a tutorial centre?

  • @professorschamber3271
    @professorschamber3271 11 หลายเดือนก่อน

    Very interesting. You just got yourself a subscriber

  • @misugikun9980
    @misugikun9980 2 ปีที่แล้ว

    how can i do this with Anconda ?!

  • @keerthanamahalingam474
    @keerthanamahalingam474 3 ปีที่แล้ว +3

    Please upload tutorials based on web scraping

  • @An-yh2bl
    @An-yh2bl 4 หลายเดือนก่อน

    Thank you :) great video! Could you please make a video on how to export the data into CSV or excel file? I am new to Python.

  • @CSKAASIPRASANTHA
    @CSKAASIPRASANTHA 2 ปีที่แล้ว +1

    Excellent 👍

  • @hiteshyadav5719
    @hiteshyadav5719 8 หลายเดือนก่อน

    Bhai koi batayega terminal kese open karte he

  • @knowledgesignim8428
    @knowledgesignim8428 ปีที่แล้ว

    How to use selenium library in python scraping for beginners in hindi

  • @user-be8tc5kl6d
    @user-be8tc5kl6d 2 ปีที่แล้ว

    is there any book for study scraping?
    "the besot book"

  • @san5527
    @san5527 หลายเดือนก่อน

    Thank You!

  • @martinnoonan9405
    @martinnoonan9405 ปีที่แล้ว

    great tutorial

  • @Vijay-Yarramsetty
    @Vijay-Yarramsetty ปีที่แล้ว +1

    always prefer to use virtaul env to install the pip libraries.

  • @GhostRider....
    @GhostRider.... ปีที่แล้ว

    Nice Explanation

  • @sagarrajkumardesai4275
    @sagarrajkumardesai4275 2 ปีที่แล้ว

    Thank you bro

  • @ajithkumarsekar371
    @ajithkumarsekar371 11 หลายเดือนก่อน

    Thanks for your video

  • @Quackeee
    @Quackeee 2 ปีที่แล้ว +5

    Why does it say requests is a missing module

  • @nikhildeshpande1247
    @nikhildeshpande1247 2 ปีที่แล้ว

    I was extracting text from perticular website it is giving response [500] error ?? anyone knows what it is??

  • @user-bp8sg8wy6o
    @user-bp8sg8wy6o 10 หลายเดือนก่อน

    Dude can I do one thing
    Can I scrape the data from website and can I show this in my react native application
    Suppose I want to show the data which is in the website and want to show in the react native application
    Can anyone has any idea

  • @neeleshsinha1111
    @neeleshsinha1111 2 ปีที่แล้ว

    ModuleNotFoundError: No module named 'requests'
    its showing this. HELP ME!!!!

    • @patrickwalsh1154
      @patrickwalsh1154 2 ปีที่แล้ว

      Did you install the requests module?

  • @shuvadipghosh374
    @shuvadipghosh374 3 ปีที่แล้ว +2

    Please tell how to scrape a dynamically updated website like the Google classroom .

    • @BhupeshRajShakya
      @BhupeshRajShakya 2 ปีที่แล้ว +1

      U just need to find where the api data store in script then u do it

  • @webscrapingfreelancer76
    @webscrapingfreelancer76 ปีที่แล้ว

    You are genius

  • @rafy-ivanmorales3077
    @rafy-ivanmorales3077 2 ปีที่แล้ว +2

    I’m a new student and need help to do this project:
    I have a port scanner script it works properly, it works in Pycharm using python3.9.
    I have to make a file and I did make call (Example.txt)
    On this file, I have to do this:
    3. If the Ports is open, it should create a file and add an entry for port number
    4. In case of any exception for instance “host is not available”, “host name could not be resolved” or
    due to any other error, you need to write that exception into the same file.
    I’m not asking for you to do the project for me, I'm only asking ware I need to work or used in my script to accomplish this because it is my first time doing this and working with python too, and I have been struggling with this part one very bad. I can even send you the code, so you can look and only tell me what I’m doing bad, is not working.

    • @landofabraham
      @landofabraham 10 หลายเดือนก่อน

      Have you solved it?

  • @SaiTeja-rd4dr
    @SaiTeja-rd4dr 3 ปีที่แล้ว +3

    Hi dude can we scrape only fresh data from time to time (for every 6 hours)
    by writing condition

    • @NoamAsulin
      @NoamAsulin 3 ปีที่แล้ว

      I guess it's possible if you use Time module

  • @gurpreetsingh-lu3ob
    @gurpreetsingh-lu3ob 3 ปีที่แล้ว +1

    Sir i want to scrape a PDF file, can you help me please?

    • @samm3417
      @samm3417 2 ปีที่แล้ว

      You don't scrape a pdf file you open it using with open

    • @nashtrashcool
      @nashtrashcool ปีที่แล้ว

      @@samm3417 you mean open(filename,type) ? Isn't this only limited for binary files? Sorry im a noob

  • @TheSibyjohn
    @TheSibyjohn 2 ปีที่แล้ว

    Excellent my man....no wonder Indians are up there....

  • @webscrapingfreelancer76
    @webscrapingfreelancer76 ปีที่แล้ว

    Nice

  • @Vkdride
    @Vkdride 8 หลายเดือนก่อน

    i tried same on colab and it gave in output

    • @Vkdride
      @Vkdride 8 หลายเดือนก่อน

      GeeksforGeeks | A computer science portal for geeks

  • @muskaangupta4915
    @muskaangupta4915 ปีที่แล้ว

    Nh hua run mera to

  • @Arjun-kq5vj
    @Arjun-kq5vj ปีที่แล้ว

    mm poli saannam

  • @sunnyjha4932
    @sunnyjha4932 2 ปีที่แล้ว +1

    good intro

  • @SHREYASSEC
    @SHREYASSEC ปีที่แล้ว

    The moment the video started I paused and zoomed in to confirm and it was indeed HoH😲

  • @stevenroyalson7850
    @stevenroyalson7850 3 ปีที่แล้ว +1

    Why u used html.parser

    • @Jxrdy
      @Jxrdy 2 ปีที่แล้ว

      so that you can scrape

  • @JanaP
    @JanaP 10 หลายเดือนก่อน

    Hi, you forgot to explain inspect element part

  • @wettmarley
    @wettmarley 9 หลายเดือนก่อน

    hope its works with any web application

  • @kevo8279
    @kevo8279 5 หลายเดือนก่อน

    W book collection fr

  • @rominmenezesromin3
    @rominmenezesromin3 6 หลายเดือนก่อน

    Bro you forgot to tell us under requirements for coding we need to install Visual Studio Code.

  • @aadityabisaria5427
    @aadityabisaria5427 5 หลายเดือนก่อน

    shit and to the point. much appreciated

  • @faisalrhm9145
    @faisalrhm9145 2 ปีที่แล้ว

    hi your are good

  • @janardannn
    @janardannn 3 ปีที่แล้ว +16

    did he mention that web scraping can get you sued if done without permission?

    • @iiaamm
      @iiaamm 3 ปีที่แล้ว

      😂

    • @garvitkohli
      @garvitkohli 2 ปีที่แล้ว

      😂

    • @stark4755
      @stark4755 ปีที่แล้ว

      Bm

    • @tushar12226
      @tushar12226 5 หลายเดือนก่อน

      Bruh

    • @senopolix
      @senopolix 2 หลายเดือนก่อน +1

      Bro, it doesn't need any permission, you need to understand, what actually we do , in web scraping

  • @jishankhan6686
    @jishankhan6686 3 หลายเดือนก่อน

    Where is terminal

    • @saenxa
      @saenxa 2 หลายเดือนก่อน

      In your backyard

  • @b10gaming2
    @b10gaming2 ปีที่แล้ว

    this video is indian version of tech with tim

  • @vaasudhfp2874
    @vaasudhfp2874 3 ปีที่แล้ว

    after that.??'

  • @vaalarivan_p
    @vaalarivan_p ปีที่แล้ว

    2:00

  • @rushilverma3606
    @rushilverma3606 3 ปีที่แล้ว

    it shows error when request.get()is used ,
    Not acceptable!
    error generated by Mod_Security

    • @ravikiran3871
      @ravikiran3871 ปีที่แล้ว

      use requests.get() not request.get

  • @utsavbhardwaj7505
    @utsavbhardwaj7505 หลายเดือนก่อน

    saaaaaaaaaaaaaaaade
    karu suddi laaaaaaaaaaaaaal
    na mane
    na mane

  • @nashtrashcool
    @nashtrashcool ปีที่แล้ว

    Wtf is this itna sab to reels me hi pta chal jata h

  • @raj-nq8ke
    @raj-nq8ke 3 ปีที่แล้ว

    He did nothing related to scraping. He just read the how to install beautiful soup. I wonder did he even know scraping.