Como fazer TRATAMENTO de DADOS com PYTHON

แชร์
ฝัง
  • เผยแพร่เมื่อ 20 ก.ย. 2024

ความคิดเห็น • 30

  • @OlecramHPP
    @OlecramHPP 3 หลายเดือนก่อน +3

    Melhor canal do mundo!! E não é exagero!!

  • @joaocoimbra4032
    @joaocoimbra4032 ปีที่แล้ว +3

    Você é o melhor do mundo, estou aguardando seu curso

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +1

      Olá João, hoje vai sair um vídeo novo daqui a pouco, obrigado pelo seu feedback. Valeu. O curso está em preparação, vale a pena esperar um pouquinho porque vai ter muitoooo conteúdo top.

  • @micaelaandrade414
    @micaelaandrade414 ปีที่แล้ว +1

    Cai no seu canal por acaso e já estou grata! Obrigada por compartilhar conhecimento tão bem, de uma forma didática e sem enrolação! 😊 partiu assistir todos os seus vídeos kkk

  • @juliokaro
    @juliokaro 8 หลายเดือนก่อน

    Ótimo vídeo. Bati cabeça para usar o pacote locale, pois não funcionava de jeito nenhum no google colab. Testei em outros ambientes e funcionou.

  • @davilopes8737
    @davilopes8737 ปีที่แล้ว +2

    Explicação show!!
    uma coisa que tenho dúvida é como filtrar um período específico pela coluna data_vendas, por exemplo pegar as vendas apenas de um determinado mês

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +1

      Olá, você pode fazer o filtro pela data_vendas de varias maneiras. Pode usar notação de slice do pandas, fazer uma engenharia de atributos criando campos de dia, mes, ano e depois separando pelo período desejado, ou então usar filtros como se fosse fazer um select.
      Vou deixar 2 vídeos aqui que fala sobre o Pandas e Analise de Dados Avançada, tem muitos tipos de filtro que vai te ajudar a compreender melhor, mas caso haja alguma dúvida pode me perguntar também.
      Analise de Dados Avançada
      th-cam.com/video/CrnFf6wfSYo/w-d-xo.html
      Pandas
      th-cam.com/video/VPvAWtblsRo/w-d-xo.html

  • @leandrocarvalho5945
    @leandrocarvalho5945 ปีที่แล้ว +3

    Mais um ótimo vídeo

  • @claudio1417
    @claudio1417 2 ปีที่แล้ว +1

    Show. Parabéns

  • @odaird7
    @odaird7 ปีที่แล้ว +2

    Ótimo conteúdo

  • @canaljesusnazareno
    @canaljesusnazareno 3 หลายเดือนก่อน

    Olá, esse vídeo tem continuação ?
    Achei que fossemos utizar agora os códigos para treinar algorítimos.

    • @nerddosdados
      @nerddosdados  3 หลายเดือนก่อน

      Esse vídeo fala sobre tratamento de dados no canal tem outros vídeos com modelos preditivos completos

  • @MrGhustavo22
    @MrGhustavo22 ปีที่แล้ว +1

    top demais

  • @flaviakrollguimaraes727
    @flaviakrollguimaraes727 ปีที่แล้ว +1

    Muito bom

  • @rodrigocezar664
    @rodrigocezar664 ปีที่แล้ว

    Travei nessa parte do vídeo 5:23, meu questionamento seria por conta de que a coluna 'VALOR' possuia apenas um valor com 'SEM VALOR', aí você viu que era do modelo PASSAT, até aqui tudo bem, porém eu não entendi por que você alterou todos os valores do modelo PASSAT que tinha como 'VALOR' igual a 200.000 se tornarem o valor 0.

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +2

      Nesse caso lá no vídeo e no script faz o contrário.
      Eu coleto a média do modelo passat que é 200.000 e então eu preencho com 200.000 somente o valor que está igual a 0 (zero)

  • @pauloavelar252
    @pauloavelar252 ปีที่แล้ว

    Olá parabéns pelo Canal. Vc poderia me ajudar com uma dúvida. Rodei seu código na minha maquina e da esse erro: unsupported locale setting.

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว

      Olá bom dia
      Você utiliza Windows ou Linux ?

    • @pauloavelar252
      @pauloavelar252 ปีที่แล้ว

      @@nerddosdados Mac.

  • @paulorltenorio
    @paulorltenorio ปีที่แล้ว +1

    df_dados.loc[(df_dados['VALOR'] == 'SEM VALOR'), 'VALOR'] = 0
    df_dados.loc[df_dados['MODELO'] == 'PASSAT'].median( )
    df_dados.loc[(df_dados['VALOR'] == 200000), 'VALOR'] = 0
    Na última linha acima não entendi. Pois na primeira linha acima entendi que na coluna VALOR onde o dado é igual a SEM VALOR substitui pelo dado 0.
    Na segunda linha conseguimos o valor da mediana que é 200000.
    Então seguindo a lógica da primeira linha acima, temos na terceira linha acima onde o dado é 200000 na coluna VALOR e substitui por 0.
    Mas não é assim que você disse. Você disse que onde é 0 substitui por 200000.
    Então não entendi.

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +1

      Olá Paulo, boa noite. Verifique se não há algum bloqueio de pop-up na sua máquina que esteja impedindo o download do material, fiz um teste e consegui baixar o material com o link que está na descrição do vídeo, outros inscritos do canal tambem conseguiram.
      Em relação a sua dúvida, vamos lá, vou tentar explicar a linha de código passo a passo.
      A linha de código é essa --> df_dados.loc[(df_dados['VALOR'] == 200000), 'VALOR'] = 0
      Observe que dentro do parenteses eu estou colocando que o campo VALOR será igual a 200000 que é o valor da mediana.
      Depois do parenteses está assim 'VALOR'] = 0
      Essa é a sintaxe python onde estou fazendo a atualização do valor que é ZERO para 200000
      df_dados.loc[(df_dados['VALOR'] == 200000) aqui altera para 200000
      'VALOR'] = 0 na continuação significa que o valor que for igual a 0 será alterado para 200000
      Espero ter tirado sua dúvida. Abraços

  • @paulorltenorio
    @paulorltenorio ปีที่แล้ว +1

    O link para download dos arquivos não está funcionando.

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +1

      Verifique se não há nada bloqueando o download pois outros inscritos conseguiram baixar normalmente

  • @mistermagoo1372
    @mistermagoo1372 ปีที่แล้ว

    Quero parabenilaza-lo pelas aulas, são excelente.
    peço ajuda com esse comando: # Vamos identificar o valor mediana do modelo LAMBORGUINI
    todos os locais onde tem .median() deu erro, df_dados.loc[df_dados['MODELO'] == 'LABORGUINI'].median(), usando o median() tenho erro, só funciona quando tiro o.median(0, uso Vscode com python, jupyter notebook, windows 10.
    a imagem importo ela de onde?

    • @nerddosdados
      @nerddosdados  ปีที่แล้ว +1

      Como está usando o vscode verifique se não tem alguma parte do código que está incorreta ou comentada

    • @mistermagoo1372
      @mistermagoo1372 11 หลายเดือนก่อน

      Obrigado pela gentileza de responde.
      Cheguei a conclusão que o problema da execução está no VScode, usei o colab.goolge e o programa roda sem erro.
      Muito obrigado.

    • @davicossuol211
      @davicossuol211 6 หลายเดือนก่อน

      @@mistermagoo1372 Opa irmão! A questão é que na nova versão do método .median() ele tenta resultar a mediana de todas as variáveis do dataframe, então o ideal seria que você passasse o valor True para o parâmetro numeric_only.
      Ficando dessa forma:
      df_dados.loc[df_dados['MODELO'] == 'LABORGUINI'].median(numeric_only=True)

    • @canaljesusnazareno
      @canaljesusnazareno 3 หลายเดือนก่อน

      @@davicossuol211 Tenho me perguntado o por que nos códigos do pessoal que geralmente faz esses vídeos não precisa passar median(numeric_only=True) e funciona. Quando vamos rodar acontece isso e muita gente não sabe e não é mencionado nos vídeos.