Web Scraping con Python - Curso con Beautiful Soup

แชร์
ฝัง
  • เผยแพร่เมื่อ 7 ก.ย. 2024

ความคิดเห็น • 160

  • @diegomeza2736
    @diegomeza2736 ปีที่แล้ว +67

    Muy bien. Me gustaría que invitaran más colaboradores y el canal tenga más actividad 👍 similar al canal en inglés. La comunidad en español los necesita 🙌

    • @ivanvaras352
      @ivanvaras352 ปีที่แล้ว

      ¿CUÁL ERA EL LENGUAJE DE PROGRAMACIÓN R?

    • @albertopardini1680
      @albertopardini1680 ปีที่แล้ว

      El lenguaje es Python corriendo dentro de google colab que son cuadernos de Jupyter Notebooks@@ivanvaras352

  • @user-tr3ml5cd9r
    @user-tr3ml5cd9r 5 วันที่ผ่านมา +1

    Excelente explicación. Creo que no se puede hacer mejor y la página web de ejemplo para practicar es fabulosa. Mil gracias

  • @marcosmarval
    @marcosmarval ปีที่แล้ว +12

    Sin haberlo visto aún ya lo guardo en mis listas y le doy su like....gracias 👍

  • @sarismejiasanchez
    @sarismejiasanchez ปีที่แล้ว +10

    Magnífico!
    El curso fue fluido y claro.
    Ahora queda practicar e implementarlo e interactuar con otros sitios de interés!
    No queda más que agradecer por compartir contenido gratuito y de calidad! 🙌😁

  • @Autoscraping
    @Autoscraping 7 หลายเดือนก่อน +4

    Extraordinario material audiovisual que ha sido de gran utilidad para nuestros nuevos colaboradores. ¡Tu generosidad es inmensamente apreciada!

  • @tomasheinzmann5421
    @tomasheinzmann5421 2 หลายเดือนก่อน +3

    Me gusto mucho, hace un tiempo que queria aprender como hacer el web scraping, voy a poner en practica los conocimentos, muchas gracias por el video 👍

  • @juanmanuelb.8392
    @juanmanuelb.8392 24 วันที่ผ่านมา +1

    Gracias Gustavo!! muy claro el curso y muy útil para quienes nos estamos iniciando en estas herramientas.

  • @sarismejiasanchez
    @sarismejiasanchez ปีที่แล้ว +7

    Hasta el momento estoy encantada con el curso, la explicación de las temáticas es amigable y clara, adicional a ello, el repo de GitHub con la presentación y el código a trabajar 🙌 Compartir el conocimiento, gratis y con este nivel de calidad! Simplemente agradecida!
    Hace mucho estaba por reforzar mis conocimientos en el tema y me animé con tu curso 👌 espero llevarlo a feliz término.
    Muchas gracias 🧠😁

  • @iliovininino
    @iliovininino ปีที่แล้ว +7

    Impresionantn lo bien que explica Juantorena. Introduce el tema, contextualiza y desarrolla todo en detalle para que no queden conceptos librados al azar. Maravilloso tutorial, muy por encima de muchos contenido pagos que he visto de diversos temas.
    Felicitaciones y muchas gracias por el trabajo.

  • @dioco098
    @dioco098 ปีที่แล้ว +3

    JUSTO ESTOY EN LA MATERIA DE MINERIA DE DATOS Y ESTO ES JUSTAMENTE LO QUE BUSCABA

  • @esarmiento7
    @esarmiento7 3 วันที่ผ่านมา

    Fue chevere aprender hice webscraping junto con selenium, guardando en bases de datos, sacando estadisticas pero un año a eso y no conseguí ni un cliente.

  • @milosZcr
    @milosZcr หลายเดือนก่อน +1

    Muy útil, complementa lo que he aprendido en otro tutorial. Además me alegra ver este contenido en español, ya había pasado por el canal de fcc pero en inglés, no sabía que existía este.
    Gracias

  • @krimenet4376
    @krimenet4376 9 หลายเดือนก่อน +3

    Acabo de finalizar el curso, gracias por vuestro trabajo me ha ayudado para una introducción a Beautiful Soup ahora toca practicar :)

  • @alejandrosan
    @alejandrosan ปีที่แล้ว +2

    Muy buen curso, casos prácticos y ejemplos para varios posibles escenarios, qué calidad este curso!!

  • @ronalgranja9301
    @ronalgranja9301 ปีที่แล้ว +3

    Saludos, aquí siempre al dia con los nuevos videos.

  • @DanySordelli
    @DanySordelli วันที่ผ่านมา +1

    BUen Trabajo. Muy Claro. Gracias!

  • @rodolfoantoniopizacoronado9680
    @rodolfoantoniopizacoronado9680 2 หลายเดือนก่อน +2

    Excelente clase, muy pedagógico. Muchas gracias

  • @XxXjujio2013XxX
    @XxXjujio2013XxX 5 หลายเดือนก่อน +1

    Obvio es re contra legal e importante lo que voy a hacer con esto.
    Las palabras salvan vidas.

  • @marianocastelli5172
    @marianocastelli5172 2 หลายเดือนก่อน +2

    Muy buena clase. Muchas gracias por compartir el conocimiento. Saludos!

  • @DiegoEmeGe
    @DiegoEmeGe 11 หลายเดือนก่อน +1

    Muchísimas gracias. Impresionante curso. Es la primera vez con Python y esto tiene un potencial enorme. Muy bien explicado. Enhorabuena.

  • @marcosdemircan2904
    @marcosdemircan2904 ปีที่แล้ว +2

    Superrrrr. Graciassss Milessss al equipo de FreecodeCamp. Bendiciones miless🇨🇺🇨🇺🇨🇺

  • @EmilioAt77
    @EmilioAt77 7 หลายเดือนก่อน +2

    Buenisimo! Me gustó mucho el cursito, me llevo algunos trucos que no conocía. Los felicito por su trabajo! 👏🏻🍻

  • @FacundoBoladeras
    @FacundoBoladeras 11 หลายเดือนก่อน +2

    Increible contenido, muchas gracias por compartir esto de forma gratuita!!

  • @jorgeguzman9048
    @jorgeguzman9048 ปีที่แล้ว +3

    Apoyo total al canal 🤗 espero algún día ver cursos a la par que FreeCodeCamp la principal

  • @arielmancuzo9113
    @arielmancuzo9113 ปีที่แล้ว +7

    Todavia no lo veo, pero ya me gusta que tenga imagenes de los simpsons, eso si es mucho muy importante

  • @carlosvargas9847
    @carlosvargas9847 ปีที่แล้ว +2

    Muchas gracias Gustavo Juantorena, me facilitaste mucho las cosas, bendiciones. saludos del tabo, chile

  • @Artemius79
    @Artemius79 ปีที่แล้ว +1

    Muy bueno!. Ojalá tengamos más contenido, aprovechando todo el conocimiento de Gustavo!

  • @sebastiansebastian3158
    @sebastiansebastian3158 9 หลายเดือนก่อน +1

    Muy bueno el curso. Muchas gracias por todo el contenido y las explicaciones. Excelente calidad!

  • @Pedro1043ful
    @Pedro1043ful 9 หลายเดือนก่อน +3

    Minuto 1:34:12 el metodo zip() también funciona con tres listas. Por ejemplo se puede usar esto:
    datos = list(zip(marcas, nombres, precios))

  • @rossisilvablas1646
    @rossisilvablas1646 10 หลายเดือนก่อน +2

    Ahora a practicar, muy bueno gracias!!😊

  • @carchobe
    @carchobe 9 หลายเดือนก่อน +2

    Gracias por este curso, fue de lo mejor 👍

  • @zacky6416
    @zacky6416 ปีที่แล้ว +2

    Gracias freecodecamp y Gustavo! 🙏

  • @CristianArielSanhueza
    @CristianArielSanhueza 11 หลายเดือนก่อน +3

    Excelente el contenido!! muchas gracias por generar contenido de calidad en español! Salu2!

  • @Kytk7
    @Kytk7 ปีที่แล้ว +3

    Gracias por crear estos cursos ❤❤❤

  • @miguelangeltitorodriguez6742
    @miguelangeltitorodriguez6742 ปีที่แล้ว +2

    Excelente curso , ahora a practicar

  • @user-pd6ip5sw5r
    @user-pd6ip5sw5r 7 หลายเดือนก่อน +2

    Enorme clase! muchas gracias

  • @henrygustavosalazartorrez8297
    @henrygustavosalazartorrez8297 ปีที่แล้ว +2

    Gracias, es algo nuevo que aprender

  • @konata_fan
    @konata_fan ปีที่แล้ว +2

    Gracias infinitas, estaba justo necesitando este tema 🎉🎉🎉🎉🎉

  • @user-zn9nc3uu6d
    @user-zn9nc3uu6d ปีที่แล้ว +4

    🎉Te volaste la barda, con este curso...😂

  • @miguelromero2363
    @miguelromero2363 ปีที่แล้ว +2

    Gracias por este curso. Muy lindo!!

  • @marcelelopezc369
    @marcelelopezc369 ปีที่แล้ว +1

    Que tema tan interesante y poderoso. Gracias. 🏆🏆🏆

  • @giovannyvanegas88
    @giovannyvanegas88 ปีที่แล้ว +2

    Excelente, gracias por compartir este conocimiento 🤙

  • @JOHNSTIVEN
    @JOHNSTIVEN ปีที่แล้ว +2

    brutal, gracias crack :3, gracias por existir este hermoso canal :3

  • @inghmop
    @inghmop ปีที่แล้ว +2

    Excelente contenido. Muchas gracias.

  • @hugoloncq2612
    @hugoloncq2612 10 หลายเดือนก่อน +1

    Muy buen curso. Agradecido:

  • @jonathandajome690
    @jonathandajome690 ปีที่แล้ว +3

    Vamos!!! 🎉🎉

  • @sam-eq9nt
    @sam-eq9nt 10 หลายเดือนก่อน +2

    Gracias por compartir

  • @kevinsantillan4843
    @kevinsantillan4843 7 หลายเดือนก่อน +1

    Excelente curso

  • @vivracionespositivas
    @vivracionespositivas ปีที่แล้ว +3

    Gracias por compartir..

  • @rollopaterson-thelastimpre5572
    @rollopaterson-thelastimpre5572 ปีที่แล้ว +2

    Muy util gracias!

  • @jorgediaz6989
    @jorgediaz6989 ปีที่แล้ว +1

    Joder!! me encanta este curso

  • @ramiroromeroacevedo
    @ramiroromeroacevedo ปีที่แล้ว +4

    Excelente 👌

  • @DarkerDark1
    @DarkerDark1 ปีที่แล้ว +3

    Muuuuchas gracias!!

  • @dante1234565
    @dante1234565 ปีที่แล้ว +2

    Muchas gracias.

  • @diegoarielsimonelli5902
    @diegoarielsimonelli5902 ปีที่แล้ว +2

    Impecable!!

  • @Felipe-gk9mc
    @Felipe-gk9mc 11 หลายเดือนก่อน +1

    Ahora necesito un curso de SQL, please.
    Saludos desde Brasil

  • @Diegotopizarro
    @Diegotopizarro หลายเดือนก่อน +1

    gracias por esto

  • @kimruiz5019
    @kimruiz5019 4 หลายเดือนก่อน

    mil gracias, muy bueno; a la hora de ponerlo en practica se me dificulta un poco cuando los divs cargan información de bases de datos y servidores internos, ademas de estilos de Javascript, osea las paginas que cargan ventas de usuarios externos como las inmobiliarias.

  • @mrj1968
    @mrj1968 ปีที่แล้ว +2

    hermosa clase y muy bien explicada para alguien que recien inicia, existira mas clases sobre web scraping con el mismo instructor?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      Gracias! Por ahora esta. Qué tema de web scraping te gustaría que se enseñe y no está incluído en este curso?

    • @sebastianpardo4002
      @sebastianpardo4002 ปีที่แล้ว +2

      @@gustavojuantorena podria ser algo que se lleve a cabo en las empresas un ejemplo real pero complicado desde el webscraping hasta el data analytic y en lo posible data science para despues poder expresar lo buscado en graficos, como en power BI, Qlickview, etc...

    • @emilianobaldino914
      @emilianobaldino914 หลายเดือนก่อน

      Hola, muchas gracias! Alguna librería recomendada para scrapear gran cantidad de texto (400 pag)? @gustavojuantorena

  • @alcobaa
    @alcobaa ปีที่แล้ว +1

    Vamos Argentina, carajo

  • @scavro
    @scavro ปีที่แล้ว +1

    Buen curso

  • @exodavid0780
    @exodavid0780 ปีที่แล้ว +2

    Excelente ❤️

  • @LeninElio
    @LeninElio ปีที่แล้ว +4

    Excelente, nos podrían compartir presentacion que uso al inicio por favor ?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +4

      Hola @LeninElio, las acabo de agregar en el repositorio del curso que está en la descripción. Saludos!

  • @carloscacn
    @carloscacn 7 หลายเดือนก่อน +1

    Hola Saludos muy buen curso. Me trabe en el ejercicio 2. Se debe separar el string de la lista producto y hacer un diccionario q contenga la condicion de la patineta(nueva, usada) y otra con el numero para despues hacer el condicional donde se muestren las q tengan un numero mayor a 3 ???

    • @gustavojuantorena
      @gustavojuantorena 7 หลายเดือนก่อน +1

      Hola Carlos, qué bueno que te hayas puesto a hacer los ejercicios. Lo podés hacer de muchas formas pero lo importante es poder filtrar y quedarte solo con las patinetas que tengan un número mayor a 3 en su nombre y su correspondientes precios. Separar el string y después usar un condicional me parece una buena estrategia. Vas a tener que tener cuidado que para hacer esa comparación de númeor "mayor" vas a tener que trabajar con valores numéricos (int o float) y no strings. Saludos!

  • @jorgevalbuena4502
    @jorgevalbuena4502 ปีที่แล้ว +3

    😮

  • @ydvkuldeep5246
    @ydvkuldeep5246 ปีที่แล้ว

    When performing web scraping, if you encounter websites where certain HTML elements, like divs, lack consistent information (for example, one company's div has all details while another company's div is missing revenue information), it can lead to issues when converting the data into a CSV file.

  • @kletis
    @kletis 10 หลายเดือนก่อน +1

    Muchas gracias por el curso muy util, uno de los problemas que me he encontrado es no poder superar el aceptar cookies. No se como resolverlo.

    • @gustavojuantorena
      @gustavojuantorena 10 หลายเดือนก่อน

      Hola! Si, no es necesariamente algo sencillo. Fíjate en la.docimentación de la librería requests que se puede pasar un parámetro cookies con un diccionario que contenga las que necesites.

  • @esarmiento7
    @esarmiento7 5 หลายเดือนก่อน +1

    Hola, se puede hacer un scrap que me guarde el valor de una pagina cada hora? osea es un contador pero quiero capturar que valor tenia a la 1am, 2am, etc. obviamente si apago el equipo no se si se puede desde google colab. gracias.

    • @gustavojuantorena
      @gustavojuantorena 5 หลายเดือนก่อน +1

      Hola! Si, hay muchas maneras de hacer que un codigo se ejecute cada un determinado tiempo, en sistemas UNIX como Linux y Mac se puede usar un software por terminak que se llama cron (podes buscar "cron jobs"). En Windows podés usar el programador de tareas. Respecto a Colab, suele se un problema porque después de cierto tiempo de inactividad no te deja seguir usándolo, por eso mejor correr el código como un script de Python. Espero que te sirva. Saludos!

    • @esarmiento7
      @esarmiento7 5 หลายเดือนก่อน +1

      @@gustavojuantorena Gracias, voy a mirarlo.

  • @bizarrapmusic
    @bizarrapmusic 9 หลายเดือนก่อน +1

    En la parte de la tabla, si estás mirando constantemente el html de la página. No es mas fácil entonces simplemente hacer un get de la url/table.html ? XD

    • @gustavojuantorena
      @gustavojuantorena 9 หลายเดือนก่อน

      Hola! Tu observación está muy bien, en este caso el objetivo era mostrar como lidiar con elementos , dónde algunas veces no es tan fácil acceder a la URL dónde está alojada la información.

  • @BlooooodLine
    @BlooooodLine 8 หลายเดือนก่อน +1

    Donde se encuentra la resolución de los ejercicios finales?

    • @gustavojuantorena
      @gustavojuantorena 8 หลายเดือนก่อน

      Hola! Cómo digo en el vídeo, si hay dudas las podemos resolver acá en los comentarios. Te trabaste con alguno? Hay una duda puntual?

  • @josecarlosvielmanmallada4867
    @josecarlosvielmanmallada4867 11 หลายเดือนก่อน +1

    Buenas, alguien sabe como puedo usar a api de wikipedia en ubuntu linux?

    • @gustavojuantorena
      @gustavojuantorena 11 หลายเดือนก่อน

      Hola! En el curso lo usamos en Linux ya que Google Colab está corriendo en una computadora con ese sistema operativo. No hay que hacer nada distitno a correr el código tal cual está, ya que Python es multiplataforma

  • @gabrielag.hernandez8697
    @gabrielag.hernandez8697 ปีที่แล้ว +1

    Hola como están.. mi hijo quiere aprender a programar que tipo de computadora tiene que tener?..desde ya gracias por la información y saludos desde Argentina

    • @Raauruu
      @Raauruu ปีที่แล้ว +1

      Cualquiera vale. No necesitas nada potente. En Google Colab se hace todo en la nube

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +1

      Coincido. No se necesita una computadora más allá de lo estándar para empezar a programar. Muchos éxitos para él!

    • @gabrielag.hernandez8697
      @gabrielag.hernandez8697 ปีที่แล้ว +1

      Gracias por la información!!!

  • @alfredomorales3017
    @alfredomorales3017 6 หลายเดือนก่อน +1

    ¿como se podria aplicar en alguna pagina que previamente se requeire autenticar?

    • @gustavojuantorena
      @gustavojuantorena 6 หลายเดือนก่อน +1

      Hola Alfredo, para el caso de autenticación, luego de asegurarte que esa página permite el scraping, deberías usar una herramienta como Selenium o Playwright que te permita emular la acción del navegador. Las ideas generales del curso te van a seguir siendo útiles (por ejemplo cómo acceder al espacio para poner el nombre de usuario y la contraseña), pero BeatifoulSoup no está pensado para ese tipo de casos. Éxitos!

  • @esarmiento7
    @esarmiento7 4 หลายเดือนก่อน

    Hay comunidades de esto? Me gustaria unirme a alguna para ver que cosas van saliendo. Saludos

  • @ShigureMuOnline
    @ShigureMuOnline 5 หลายเดือนก่อน +1

    por las puras fue el diccionario url_imagenes cierto? no lo llegaste a usar en la hora 1h:00min

    • @gustavojuantorena
      @gustavojuantorena 5 หลายเดือนก่อน +1

      Es verdad! Lo definí y no lo usé, muy buena observación. Me imagino que al principio pensé en guardarme todas las urls en esa lista pero al final decidí descargarlas directamente.

    • @ShigureMuOnline
      @ShigureMuOnline 5 หลายเดือนก่อน +1

      @@gustavojuantorena uy muchas gracias por la rápida respuesta. Gracias me habia quedado con esa duda, ahora puedo vivir tranquilo

  • @angellavado8166
    @angellavado8166 7 หลายเดือนก่อน +1

    como hacer web scraping para paginas dinamicas con insercion con javascript

    • @gustavojuantorena
      @gustavojuantorena 7 หลายเดือนก่อน +1

      Hola! Para esos casos te van a servir las ideas generales de este curso pero vas a tener que usar una herramienta Selenium o Playwright que te permitan interactuar con páginas más dinámicas que tengan mucho código en JavaScript.

  • @sarismejiasanchez
    @sarismejiasanchez ปีที่แล้ว

    Me habría gustado tener la explicación del apartado Pedidos HTTP con requests que hay en Colab. ¿Sería un error de edición? Comenzó desde Uso basico de APIs 🤔

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +2

      Quedó fuera de la edición final, pero no involucra algo que no se explique. Si hay alguna duda puntual decinos!

    • @sarismejiasanchez
      @sarismejiasanchez ปีที่แล้ว

      Una que no tiene que ver con el curso, pero quisiera una recomendación. ¿Que distribución de Linux usas en tu máquina?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +1

      @@sarismejiasanchez Uso Ubuntu

    • @sarismejiasanchez
      @sarismejiasanchez ปีที่แล้ว +1

      @@gustavojuantorena gracias ☺️

  • @orlandog1979
    @orlandog1979 ปีที่แล้ว +1

    El web scraping es Ilegal? En algunos lugares no lo permiten y por lo tanto me lleva a una inquietud.. Vale la pena aprenderlo?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      Depende de varios factores: Si la información está pública sin necesidad de utilizar usuario y contraseña, copyright y de los términos y condiciones de la página.

  • @mikewaldron475
    @mikewaldron475 3 หลายเดือนก่อน

    me da error:
    ---------------------------------------------------------------------------
    NameError Traceback (most recent call last)
    in ()
    ----> 1 precios
    NameError: name 'precios' is not defined
    ¿Como se soluciona?

    • @gustavojuantorena
      @gustavojuantorena 3 หลายเดือนก่อน

      Hola. El error dice que 'precios' no fue definido, probablemente te haya faltado ejecutar una celda anterior donde se define esa lista.
      Fijate en la celda que comienza con estas lìneas:
      divs = soup.find_all('div', class_='detail-box')
      productos = []
      precios = []
      Saludos!

  • @javieramartinez3146
    @javieramartinez3146 22 วันที่ผ่านมา

    Puedes explicar como es el asunto de los Exploits? como puedo mandar parametros desde python y poder hacr scraping haciendo login en un sitio web?

    • @gustavojuantorena
      @gustavojuantorena 21 วันที่ผ่านมา

      Hola Javier, no creo haber hablado de exploits ¿A qué te referís? Sobre la autenticación podés ver la documentación de la librería Requests que tiene varias opciones, pero también es común usar otras herramientas como Selenium. Saludos!

    • @javieramartinez3146
      @javieramartinez3146 21 วันที่ผ่านมา

      @@gustavojuantorena Hola, me refería al envío de Pos para hacer log in. Agradecido por la buena documentación

    • @gustavojuantorena
      @gustavojuantorena 21 วันที่ผ่านมา

      @@javieramartinez3146 Un ejemplo básico podría ser el siguiente:
      import requests
      from requests.auth import HTTPBasicAuth
      response = requests.get(url de la web',
      auth=HTTPBasicAuth('tu_usuario', 'tu_contrasena'))
      Pero va a depender de otros factores, te recomiendo ir a la documentación de Requests.
      Saludos!

  • @esarmiento7
    @esarmiento7 8 หลายเดือนก่อน +1

    Cual libreria hace el webscraping mas rapido que existe?

    • @gustavojuantorena
      @gustavojuantorena 8 หลายเดือนก่อน +1

      Hola! No sabría decirte exactamente porque hay diferentes maneras de medir que tan rápido funciona, pero en Python usar BeatifoulSoup es una opción veloz (respecto a Selenium por ejemplo). Así que si aplica al caso de uso, suele ser de lo primero que se utiliza. Saludos!

    • @esarmiento7
      @esarmiento7 8 หลายเดือนก่อน

      @@gustavojuantorena le puedo hacer scraping a titktok o me boquea la ip? Saludos

    • @gustavojuantorena
      @gustavojuantorena 8 หลายเดือนก่อน +1

      Primero deberías asegurarte de no estar incumpliendo las condiciones. En ese caso me parece probable que te bloqueen la IP después de algunos requests

  • @TheJory248
    @TheJory248 ปีที่แล้ว

    En mi caso la tabla de la que quiero extraer los datos si la muestra en el HTML pero al extraer los datos solo me muestra la etiqueta que la contiene:

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      Es alguna duda sobre el curso? O un proyecto de web scraping aparte?

    • @TheJory248
      @TheJory248 ปีที่แล้ว

      @@gustavojuantorena Buenas noches, es aparte sabrás en tu experiencia si existen páginas que de alguna manera cifren los datos para que no puedan ser extraídos?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      @@TheJory248 Hola, si efectivamente puede pasar eso, por ejemplo con cifrado XOR. Podés buscarlo en Google para más información

  • @carloshinojosa7564
    @carloshinojosa7564 ปีที่แล้ว

    Alguien que pueda ayudarme con una duda que tengo?
    Quiero extraer datos de una plataforma. La plataforma pues no es de acceso libre sino que debes pagar una suscripción. Yo estoy construyendo una herramienta que facilita mi interacción con la plataforma y para ello debo extraer algunos datos. ¿Es posible hacer web scraping a una plataforma de paga si sí tienes la suscripción?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +2

      Normalmente si hay que poner nombre de usuario y contraseña, hacer scraping no está permitido. Deberías ver los términos y condiciones de la web.

    • @LuisMiguelAndujar
      @LuisMiguelAndujar 9 หลายเดือนก่อน +1

      Si tienes usuarios y contraseña para entrar Beautiful Soup no es la librería que necesitas para realizar webscrapping tendrías que mirar la librería bastante más potente llamada Selenium.

  • @josepifarre9172
    @josepifarre9172 7 หลายเดือนก่อน

    hola, pip3 install --force-reinstall -v no se instala por ende hay error en todo el codigo, al final de la instalacion dice que hay instalado normalizer.exe en PATH, quito el normalizer.exe?

    • @gustavojuantorena
      @gustavojuantorena 7 หลายเดือนก่อน +1

      Me podés explicar más sobre el error? La idea es ejecutarlo directamente en Google Colab y ahí no debería aparecer ningún archivo ".exe" porque está corriendo en Linux

    • @josepifarre9172
      @josepifarre9172 7 หลายเดือนก่อน

      @@gustavojuantorena Si, es que sale una carpeta en windows que es python 11, nunca lo instale, dentro de ella hay un archivo de normalizer.exe que aparecio de la nada, no se donde enviarte las capturas de pantallas.

    • @gustavojuantorena
      @gustavojuantorena 7 หลายเดือนก่อน +1

      @@josepifarre9172 Te recomiendo que lo ejecutes en Google Colab, es directamente en el navegador y no vas a tener ese problema. En la descripción de este video entrás al link que dice "Código del curso ... " y cuando entres a ese repositorio apretas en el boton "open in colab" que està despuès de "👩‍💻 Accedé al código del curso entrando al siguiente enlace:" De este modo no vas a tener ningún problema con windows porque se va a estar ejecutando en la nube de google con un sistema Linux por detrás. Saludos!

    • @josepifarre9172
      @josepifarre9172 7 หลายเดือนก่อน +1

      @@gustavojuantorena Muchísimas gracias

    • @gustavojuantorena
      @gustavojuantorena 7 หลายเดือนก่อน

      @@josepifarre9172 De nada! 😀

  • @_awesomnet_4687
    @_awesomnet_4687 หลายเดือนก่อน +1

    Muy buen curso pero siento que le faltó llegar un poco mas a profundidad en los temas

    • @gustavojuantorena
      @gustavojuantorena หลายเดือนก่อน

      Gracias ¿Qué te parece que le faltó?

    • @_awesomnet_4687
      @_awesomnet_4687 หลายเดือนก่อน +1

      @@gustavojuantorena Quizás empezar primero con un repaso de python y la forma de manejar itersbles, resaltar al principio que bs4 retorna un objeto de besrifulsoup y no un iterables común. profundizar un poco más con el manejo de excepciones que están en la documentación de la librería, más ejercicios que estén entre cada 1 o 2 módulos para lograr esa sensación de progreso en el aprendizaje. Esto ya es una opinión pero el no usar vscode no está mal pero es el entorno que siempre manejamos así que creo que sería mejor intentar adecuarse ya a la herramienta de trabajo del día a dia

    • @gustavojuantorena
      @gustavojuantorena หลายเดือนก่อน

      @@_awesomnet_4687 Gracias! Lo voy a tener en cuenta para próximos cursos!

  • @jamesmoisesllalleperez3079
    @jamesmoisesllalleperez3079 10 หลายเดือนก่อน

    como hago para esa información luego insertarla en la misma pagina?

    • @gustavojuantorena
      @gustavojuantorena 10 หลายเดือนก่อน

      Hola JAMES, normalmente uno no tiene acceso para colocar información en una página de internet y modificarla. De eso se encarga aquella persona que la creó y/o la mantiene.

  • @Jralexisg
    @Jralexisg ปีที่แล้ว

    Puedo hacerle web scraping a pdf subidos en la web con datos publicados

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว +1

      Si los archivos PDF están públicos podrías descargarlos de manera similar a cómo nos bajamos las imágenes en este caso. Luego deberías procesar el contenido de ese PDF ya en tu computadora (por ejemplo usando una librería de OCR)

    • @jacarrascom
      @jacarrascom ปีที่แล้ว

      ​@@gustavojuantorena que librería OCR se podría utilizar?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      @@jacarrascom Por ejemplo pytesseract

  • @franescobar89
    @franescobar89 ปีที่แล้ว +1

    Biologo especializado en neurociencias y doctor en inteligencia artificial... Ahí te veo Skynet

  • @antonioroa3971
    @antonioroa3971 ปีที่แล้ว

    La descarga de las imagenes no funciona del todo bien. . De hecho las imagenes son solo de tamaño 4kB cuando las descargo con el codigo tal cual lo implementas
    Sin embargo si las puedo abrir si las descargo directamente con un tamaño promedio de 200 KB
    Algo no está yendo bien

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      Hola @antonioroa3971, no estoy logrando replicar tu problema. Con el código como está implementado se descargan en la misma calidad que en la página, en un rango de tamaños entre 20kbs y 3 Mbs. De todos modos sin dudas esa implementación puede mejorarse! Saludos

  • @eduardoalfredoperez5059
    @eduardoalfredoperez5059 10 หลายเดือนก่อน

    Hasta el minuto 31 y 30 segundos todo bien. Cuando se corren las dos ordenes me da error ---------------------------------------------------------------------------
    NameError Traceback (most recent call last)
    in ()
    ----> 1 type(respuesta_sunset)
    NameError: name 'respuesta_sunset' is not defined
    Que quede claro que yo no se nada de programacion. Pero pense que era para todos este video.

    • @eduardoalfredoperez5059
      @eduardoalfredoperez5059 10 หลายเดือนก่อน

      Usè la data de la misma sunset y dio resultado. Paso derecho al scraping porque la parte de la api es mas confusa que la data de la pagina sunset

    • @eduardoalfredoperez5059
      @eduardoalfredoperez5059 10 หลายเดือนก่อน

      Y monica me dice que el archico de respuesta es un jSON

    • @gustavojuantorena
      @gustavojuantorena 10 หลายเดือนก่อน

      Hola Eduardo. No entendí mucho tu problema, ya lo solucionaste? Saludos

  • @franliendro
    @franliendro ปีที่แล้ว

    no era que el próximo curso iba a ser el de videojuegos???

  • @cobrachess1775
    @cobrachess1775 ปีที่แล้ว

    Que hacer si la página pide un login?

    • @gustavojuantorena
      @gustavojuantorena ปีที่แล้ว

      En principio deberías poder enviar información al servidor, emulando lo que hacés al completar el login manualmente. Una de las maneras mas comunes es emulando un navegador por ejemplo utilizando herramientas como Selenium o Playwright. De todos modos deberías ver que no estés incumpliendo los términos y condiciones de la página. Saludos.

  • @esarmiento7
    @esarmiento7 5 หลายเดือนก่อน +1

    Que vpn se puede usar para que no bloqueen la ip? saludos.

    • @gustavojuantorena
      @gustavojuantorena 5 หลายเดือนก่อน +1

      Hola, usar una VPN no suele ser la alternativa ante un bloqueo, lo que suelen hacer algunas personas es ir rotando proxies o buscando otra manera de hacer los pedidos al servidor desde otra IP.

  • @anap5009
    @anap5009 ปีที่แล้ว

    Hola, me encana su canal, tienen videos de Devops? gracias

  • @TheSuperxxd
    @TheSuperxxd ปีที่แล้ว

    Chatgpt y era. Mas facil

  • @MsVeloz21
    @MsVeloz21 ปีที่แล้ว +3

    Muy bien, lo explicas muy bien, muchas gracias

  • @cipolletti7
    @cipolletti7 10 หลายเดือนก่อน +2

    Excelente 👌