5 tipos de pré-processamento que devem ser feitos antes de modelar
ฝัง
- เผยแพร่เมื่อ 2 ต.ค. 2024
- Olá, pessoal! Tudo bem?
No vídeo de hoje vamos ver os seguintes pré-processamentos:
- Dummy e one-hot-encoders • 5 tipos de pré-process...
- Zero variance e near zero variance • 5 tipos de pré-process...
- Correlação e multicolinearidade • 5 tipos de pré-process...
- Padronização • 5 tipos de pré-process...
- Imputação • 5 tipos de pré-process...
Código usado no vídeo:
github.com/sam...
Essas são as referências:
topepo.github....
towardsdatasci...
machinelearnin...
www.algosome.c....
en.wikipedia.o...
Espero que tenha sido útil pra você, até mais :)
Qualquer dúvida, sugestão ou simplesmente trocar uma ideia sobre ciência de dados, machine learning e desenvolvimento em R, sinta-se a vontade pra falar comigo nas minhas redes sociais ou por email :)
Meus contatos:
instagram: @samuelmacedo_r
email: svm.macedo@gmail.com
github: @samuelmacedo83
twitter: @samuelmacedo83
#rstats #preprocessamento #modelagem
#onehotencoder #dummyvariable #dummyvariabletrap
#nearzerovariance #caret #rstudio #multicolineardidade
#imputação
#datascience #cienciadedados #estatistica
Hoomi. Faz um curso de ETL pra ajudar a galera. Vc é fera! Abs
Samuel, sempre nos ajudando com seus vídeos. Esse vídeo me salvou de comprar um curso para limpar dados para modelar. SUPER OBRIGADA!!!
Que bom que o vídeo foi útil pra ti ;)
Estou aqui no que puder ajudar 😁
Samuel que aula legal! Parabéns! Muito boa a sua explicação. Você não tem nenhum curso sobre Pré-procesamento? hehe
Oi Ítalo, obrigado pelo feedback.
Tem alguma ideia de que partes vc preferiria ver?
valeu Samuel, muito obrigado por mais esse vídeo.
;)
Muito Bom!! Eu comecei a usar o Tidymodels, o filho mais novo do Max Kuhn, recomendo bastante!
Sim o tidymodels é ótimo mesmo e já está bem engatilhado. Resolvi fazer esse com o caret por já ser mais consolidado e também pq era um vídeo mais teórico. Penso em fazer um só pro tidymodels num futuro próximo 🙂
@@samuelmacedo83
Opa! O Tidymodels diminuiu bem, na minha opinião, a distância do R para o Python em termos de Machine Learning.
Aguardando seu vídeo!! 😊
Concordo com vc em gênero, grau e número. O tidymodels é muito mais maleavel que o caret e já tem uma cara mais parecida o machine learning moderno. Ótimo trocar essa ideia contigo ;)
Ola, lembra que eu tinha comentado que ia fazer um video sobre tidymodels? Postei hoje th-cam.com/video/cMJW1v4T0SU/w-d-xo.html
Excelente. Existe algum método no caret que substitua Null por 0 ?
Em que parte específica você se refere?
@@samuelmacedo83 tenho uma coluna com valores é preciso substituir null por 0. Uso o if_na mas talvez tenham firmam melhores.
@@valdsonmaia4331 o if_na já uma ótima forma de resolver.
Vc tb pode fazer direto no rbase usando df[df == "NULL"]
@@samuelmacedo83 boa ideia. Não tinha pensado nisso. Deve ser mais rápido né.
@@valdsonmaia4331 só testando, mas acredito que sim