Como Pegar Dados da Internet com Python

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ม.ค. 2025

ความคิดเห็น • 31

  • @MiguelGomes1412
    @MiguelGomes1412 4 ชั่วโมงที่ผ่านมา +1

    Vc explica muito bem irmão, parabéns de vdd

  • @fabioguimaraes9573
    @fabioguimaraes9573 3 วันที่ผ่านมา +2

    Parabéns pela didática! Muito bom!

    • @eficienciaprogramada
      @eficienciaprogramada  3 วันที่ผ่านมา +1

      Fico feliz que gostou, meu amigo! Espero ter ajudado nos seus estudos!

  • @_math051
    @_math051 3 หลายเดือนก่อน +3

    didática melhor do que muitos aí, você ensina de verdade. Parabéns mano, mais um inscrito.

    • @eficienciaprogramada
      @eficienciaprogramada  2 หลายเดือนก่อน +1

      Opa, ficamos muito felizes em saber que a didática tá boa! Isso facilita demais o ensino! Obrigado e seja bem-vindo ao canal

  • @maujor1
    @maujor1 2 หลายเดือนก่อน +2

    Muito bom.
    Parabéns.
    No início do vídeo (tempo 2:49) ao ler as tabelas deu erro, pedindo para instalar lxml (biblioteca para manipular dados XML e HTML).
    Instalei e funcionou. (Estou usano diretório virtual - .venv)

    • @eficienciaprogramada
      @eficienciaprogramada  2 หลายเดือนก่อน +2

      Bem notado! Ótimo saber que está usando ambientes virtuais, esta é uma ótima prática, parabéns!

  • @Contador27
    @Contador27 2 วันที่ผ่านมา +1

    Augusto, é possível referenciar uma coluna sem ser pelo nome dela ?
    Por exemplo, quero referenciar a coluna de Diretor(a), posso usar um número de índice ?
    Estou em dúvida porque penso que o administrador da página pode mudar o nome da coluna.

    • @eficienciaprogramada
      @eficienciaprogramada  2 วันที่ผ่านมา

      Pode sim!!! você pode usar o método ".iloc" do pandas e pesquisar colunas ou linhas pelo seus respectivos índices!

  • @rodrigomatias4005
    @rodrigomatias4005 หลายเดือนก่อน +2

    Ótimo video. Uma dúvida: No meu vscode não aparece as informações do site. Qual extensão você usa?

    • @eficienciaprogramada
      @eficienciaprogramada  หลายเดือนก่อน +1

      opa, como assim as informações do site? Pode explicar melhor para que eu possa te ajudar?

    • @rodrigomatias4005
      @rodrigomatias4005 หลายเดือนก่อน

      @ parte do vídeo 2:50 . Nessa parte vc inseri o link e digita depois tabelas e as informações do site aparece

    • @eficienciaprogramada
      @eficienciaprogramada  หลายเดือนก่อน +1

      @@rodrigomatias4005 ah sim! É porque estou usando um jupyter notebook para programar. Nele, só preciso chamar o nome da variável para ele mostrar o resultado dela. Tente algo do tipo: print(tabelas) no seu código e veja se consegue ter acesso às informações armazenadas nessa variável "tabelas".

  • @VictorPireseSilva
    @VictorPireseSilva 5 วันที่ผ่านมา +1

    como faço para pegar os dados de uma tabela que estão dentro de um site que precisa de login?

    • @eficienciaprogramada
      @eficienciaprogramada  5 วันที่ผ่านมา +1

      Ai você terá que usar a biblioteca selenium para criar um bot simples que faz o login de maneira automática para você. Porém, podem haver algumas complicações no caminho:
      - Caso o site precise de reCaptcha, vai impedir tua automação. Antes existiam maneiras de contornar, mas está ficando cada vez + difícil.
      - Caso o site precise de um código via e-mail, dá para automatizar, mas ai deixa o código um pouco + complicado.
      - Caso tenha autenticação de 2 fatores, sugiro seguir por e-mail que, como disse, dá para automatizar essa coleta do código enviado.
      Esses links podem te ajudar, enquanto não temos vídeos pronto para isso:
      tohidhaghighi.medium.com/use-selenium-for-test-login-page-with-python-85639fe24dae
      www.geeksforgeeks.org/gmail-login-using-python-selenium/
      stackoverflow.com/questions/67528971/how-to-login-to-a-website-using-selenium-in-python

    • @VictorPireseSilva
      @VictorPireseSilva 5 วันที่ผ่านมา

      @@eficienciaprogramada muito obrigado mesmo!

  • @jesustadeuferreira3851
    @jesustadeuferreira3851 9 วันที่ผ่านมา +1

    O "astype" não realiza a conversão. Help me!

    • @eficienciaprogramada
      @eficienciaprogramada  3 วันที่ผ่านมา

      Opa, meu amigo! Acredito que resolvemos no outro thread de comentário seu! Se ainda tiver dúvida, pode mandar!

  • @fabriciocruz-eng
    @fabriciocruz-eng 3 หลายเดือนก่อน +1

    Vídeo muito bom e intuitivo. Parabéns! Não encontrei o link com a gravação informado no final da aula.

    • @eficienciaprogramada
      @eficienciaprogramada  3 หลายเดือนก่อน

      Opa, que bom que gostou! Verdade, esqueci do link! Acabei de disponibilizar na descrição, meu amigo. Espero que goste!

  • @jesustadeuferreira3851
    @jesustadeuferreira3851 9 วันที่ผ่านมา +1

    ValueError: invalid literal for int() with base 10: '1.308.497.944', no último não é feita a conversão do "object" para "int64" . Não entendi.

    • @EDINARDOLINHARES
      @EDINARDOLINHARES 7 วันที่ผ่านมา +1

      tabela_filtrada["Bilheteria (US$)"] = tabela_filtrada["Bilheteria (US$)"].str.replace(" ", "").str.replace(".", "").astype('int64)
      Isso deverá resolver!!!

    • @EDINARDOLINHARES
      @EDINARDOLINHARES 7 วันที่ผ่านมา

      a inclusão de mais um replace, substituindo o ponto, pois nesse campo tem um ponto em vez de espaço.

    • @jesustadeuferreira3851
      @jesustadeuferreira3851 7 วันที่ผ่านมา +1

      @@EDINARDOLINHARES Obrigado. Resolveu. Estou começando a estudar, vendo vários vídeos. Este vídeo foi bastante esclarecedor. Até outra pesquisa. Muito Obrigado.

    • @eficienciaprogramada
      @eficienciaprogramada  6 วันที่ผ่านมา

      Perfeita colocação, meu amigo! Esta linha de código que devemos inserir para resolver o problema.

    • @eficienciaprogramada
      @eficienciaprogramada  6 วันที่ผ่านมา

      Fico feliz que conseguiu resolver o problema e que o vídeo lhe ajudou nos estudos!

  • @Arthur026a
    @Arthur026a 24 วันที่ผ่านมา +1

    Tem como resgatar as citações de artigos científicos com Python e colocar em forma de tabela ?

    • @eficienciaprogramada
      @eficienciaprogramada  24 วันที่ผ่านมา

      Tem sim, mas provavelmente você terá que montar um código para ler direto de um arquivo PDF, ao invés da web. E confesso que mexer em PDFs com python é um pouco chato. Porém, vamos trazer um vídeo tutorial de PDFs por aqui e espero que lhe ajude.

  • @raulaguiar7513
    @raulaguiar7513 3 วันที่ผ่านมา +1

    NameError Traceback (most recent call last)
    Cell In[4], line 1
    ----> 1 tabelas = pd.read_html("pt.wikipedia.org/wiki/Lista_de_filmes_de_maior_bilheteria")
    2 tabelas
    NameError: name 'pd' is not defined
    Sabe porque esta dando esse erro ?

    • @eficienciaprogramada
      @eficienciaprogramada  3 วันที่ผ่านมา

      Opa, você deve importar a biblioteca pandas e abreviá-la como "pd" logo no início do código, assim como eu fiz.
      O primeiro passo do teu código deve ser esta importação:
      import pandas as pd