5 tipos de pré-processamento que devem ser feitos antes de modelar

แชร์
ฝัง
  • เผยแพร่เมื่อ 2 ต.ค. 2024
  • Olá, pessoal! Tudo bem?
    No vídeo de hoje vamos ver os seguintes pré-processamentos:
    - Dummy e one-hot-encoders • 5 tipos de pré-process...
    - Zero variance e near zero variance • 5 tipos de pré-process...
    - Correlação e multicolinearidade • 5 tipos de pré-process...
    - Padronização • 5 tipos de pré-process...
    - Imputação • 5 tipos de pré-process...
    Código usado no vídeo:
    github.com/sam...
    Essas são as referências:
    topepo.github....
    towardsdatasci...
    machinelearnin...
    www.algosome.c....
    en.wikipedia.o...
    Espero que tenha sido útil pra você, até mais :)
    Qualquer dúvida, sugestão ou simplesmente trocar uma ideia sobre ciência de dados, machine learning e desenvolvimento em R, sinta-se a vontade pra falar comigo nas minhas redes sociais ou por email :)
    Meus contatos:
    instagram: @samuelmacedo_r
    email: svm.macedo@gmail.com
    github: @samuelmacedo83
    twitter: @samuelmacedo83
    #rstats​ #preprocessamento​ #modelagem
    #onehotencoder #dummyvariable #dummyvariabletrap
    #nearzerovariance #caret #rstudio #multicolineardidade
    #imputação
    #datascience #cienciadedados #estatistica

ความคิดเห็น • 18

  • @jeffersoncorradini4776
    @jeffersoncorradini4776 2 ปีที่แล้ว +1

    Hoomi. Faz um curso de ETL pra ajudar a galera. Vc é fera! Abs

  • @adrianareis2756
    @adrianareis2756 3 ปีที่แล้ว +1

    Samuel, sempre nos ajudando com seus vídeos. Esse vídeo me salvou de comprar um curso para limpar dados para modelar. SUPER OBRIGADA!!!

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว

      Que bom que o vídeo foi útil pra ti ;)
      Estou aqui no que puder ajudar 😁

  • @italogoncalves8161
    @italogoncalves8161 2 ปีที่แล้ว +1

    Samuel que aula legal! Parabéns! Muito boa a sua explicação. Você não tem nenhum curso sobre Pré-procesamento? hehe

    • @samuelmacedo83
      @samuelmacedo83  2 ปีที่แล้ว

      Oi Ítalo, obrigado pelo feedback.
      Tem alguma ideia de que partes vc preferiria ver?

  • @tiagospiandorello3365
    @tiagospiandorello3365 3 ปีที่แล้ว +1

    valeu Samuel, muito obrigado por mais esse vídeo.

  • @brunoteixeira5299
    @brunoteixeira5299 3 ปีที่แล้ว +1

    Muito Bom!! Eu comecei a usar o Tidymodels, o filho mais novo do Max Kuhn, recomendo bastante!

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว +1

      Sim o tidymodels é ótimo mesmo e já está bem engatilhado. Resolvi fazer esse com o caret por já ser mais consolidado e também pq era um vídeo mais teórico. Penso em fazer um só pro tidymodels num futuro próximo 🙂

    • @brunoteixeira5299
      @brunoteixeira5299 3 ปีที่แล้ว +1

      @@samuelmacedo83
      Opa! O Tidymodels diminuiu bem, na minha opinião, a distância do R para o Python em termos de Machine Learning.
      Aguardando seu vídeo!! 😊

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว

      Concordo com vc em gênero, grau e número. O tidymodels é muito mais maleavel que o caret e já tem uma cara mais parecida o machine learning moderno. Ótimo trocar essa ideia contigo ;)

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว

      Ola, lembra que eu tinha comentado que ia fazer um video sobre tidymodels? Postei hoje th-cam.com/video/cMJW1v4T0SU/w-d-xo.html

  • @valdsonmaia4331
    @valdsonmaia4331 3 ปีที่แล้ว

    Excelente. Existe algum método no caret que substitua Null por 0 ?

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว

      Em que parte específica você se refere?

    • @valdsonmaia4331
      @valdsonmaia4331 3 ปีที่แล้ว

      @@samuelmacedo83 tenho uma coluna com valores é preciso substituir null por 0. Uso o if_na mas talvez tenham firmam melhores.

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว

      @@valdsonmaia4331 o if_na já uma ótima forma de resolver.
      Vc tb pode fazer direto no rbase usando df[df == "NULL"]

    • @valdsonmaia4331
      @valdsonmaia4331 3 ปีที่แล้ว

      @@samuelmacedo83 boa ideia. Não tinha pensado nisso. Deve ser mais rápido né.

    • @samuelmacedo83
      @samuelmacedo83  3 ปีที่แล้ว +1

      @@valdsonmaia4331 só testando, mas acredito que sim