Random Forest no R

แชร์
ฝัง
  • เผยแพร่เมื่อ 20 ก.ย. 2024
  • Neste vídeo vemos uma aplicação do algoritmo random forest em problemas de classificação e regressão. Ajustamos os hiperparâmetros e avaliamos o desempenho dos modelos.

ความคิดเห็น • 30

  • @hbviking_
    @hbviking_ 6 หลายเดือนก่อน

    Voce me salvou em um projeto, sua explicacao foi 100% perfeita, muito obrigado e nao pare com os videos por favor

    •  6 หลายเดือนก่อน

      Muito obrigada! ❤️

  • @ricardomacedo1416
    @ricardomacedo1416 6 หลายเดือนก่อน

    Obrigado pelo video! Está me ajudando muito! Grande abraço!

    •  6 หลายเดือนก่อน

      Muito obrigada pelo feedback! ❤️

  • @darwinrgv
    @darwinrgv 27 วันที่ผ่านมา

    Excelente aula. Uma dúvida: você realizou a validação cruzada e conseguiu os "melhores" hiperparametros de mtry e ntree, então criou o modelo RF. Por que você não utilizou o RF na parte de Predição, mas sim o rfFit? Tem que ser utilizado o rfFit? Pergunto pois estou testando o Random Forest com um outro dataset meu e quando uso o modelo RF (utilizando os hiperparametros da validação cruzada), obtenho melhores resultados do quê utilizando o rfFit.

  • @marlosdll
    @marlosdll 2 ปีที่แล้ว +1

    Oi letícia! Primeiramente, parabéns pelo video. Sua didática é excelente. Mas fiquei curioso com XGBoost. E onde eu vejo não fica tão claro como ficou nesse video, quado buscava sobre Random Forest. Poderia fazer um video? Agradeceria demais! Obrigado!!!!!!

    •  2 ปีที่แล้ว

      Muito obrigada! :) Está na lista de vídeos para serem preparados. ;)

  • @rafaelaminelli
    @rafaelaminelli ปีที่แล้ว

    Olá, Letícia! Primeiramente agradeço por ter disponibilizado esse conteúdo riquíssimo, me ajudou a entender bastante o algoritmo, meus parabéns! Gostaria de saber se é possível identificar quais variáveis correspondem às quantidades de vezes utilizadas na construção das árvores, obtidas pela função varUsed?

    •  ปีที่แล้ว +1

      Oi, Rafaela, as quantidades são apresentadas pela ordem das variáveis no banco de dados. Por exemplo, se aparecer: 156 98 255 254, significa que a variável explicativa da primeira coluna foi usada 156 vezes, da segunda coluna 98 vezes e assim por diante.

    • @rafaelaminelli
      @rafaelaminelli ปีที่แล้ว

      @ Ah, excelente! Muitíssimo obrigada

  • @laurarigo9916
    @laurarigo9916 2 ปีที่แล้ว +1

    Oi Letícia! Primeiramente, parabéns pelo vídeo e pela didática incrível! Muito obrigada por disponibilizar!
    Esse vídeo de comparação dos modelos que vc cita no finalzinho, também está disponível?
    Obrigada!!

    •  2 ปีที่แล้ว

      Oi, Laura, veja os vídeos aqui: th-cam.com/play/PLDoqBsM6cBJbHnTpz9T1itfHaxQdhx7b1.html

    •  2 ปีที่แล้ว

      Muito obrigada pelo feedback! ❤️

  • @Adrimegumi
    @Adrimegumi 2 ปีที่แล้ว

    Os conteúdos do canal tem me ajudado muito, obrigada!
    Letícia, sobre o Random Forest, tem alguma função que apresenta os coeficientes das variáveis para montar o modelo? Como a função summary ().

    •  2 ปีที่แล้ว +2

      Que bom, Adriana! ❤️ Infelizmente o algoritmo de random forest não gera um modelo explícito. O que você extrai de interessante são as importâncias das variáveis. Modelos explícitos são comuns com técnicas estatísticas clássicas, como a regressão logística e linear.

    • @Adrimegumi
      @Adrimegumi 2 ปีที่แล้ว

      @ Obrigada pelo esclarecimento! :)

  • @andressasoares2591
    @andressasoares2591 7 หลายเดือนก่อน

    Olá! Muito obrigada pelo conteúdo. Você disponibilizou o código em algum lugar? Em algumas linhas não é possível ler por inteiro.

    •  7 หลายเดือนก่อน

      Você encontra os scripts aqui: leticiaraposo.netlify.app/courses/analise-inteligente/

  • @ciceroeduardodesousawalter1232
    @ciceroeduardodesousawalter1232 2 ปีที่แล้ว

    Olá! A sua explicação é muito boa! Por acaso você teria o código para compartilhar? Muito obrigado!

    •  2 ปีที่แล้ว

      Veja no meu site leticiaraposo.netlify.app em Cursos -> Análise Inteligente de Dados.

  • @irinaldosouza3488
    @irinaldosouza3488 11 หลายเดือนก่อน

    Só uma dúvida! Eu vi que no seu site, na parte do Random forest têm dois bancos de dados do titanic. Uma para treinamento e outro para testes. Mas eu vi que na regressão linaer, se eu não me engano, um pacote que faz a divisão? Ou eu não entendi? Então, eu preciso alimentar esses bancos? 70% e 30%, por exemplo? e carregar os dois?

    •  11 หลายเดือนก่อน +1

      O banco do titanic já estava dividido em treino e teste. Ele foi coletado do pacote titanic do R. Mas quando você não tem seu conjunto original dividido dessa forma, normalmente destinamos 70% para treinamento e 30% para teste.

  • @hbviking_
    @hbviking_ 6 หลายเดือนก่อน

    Saberia informar como sao tratados os dados desbalanceados em ML

    •  6 หลายเดือนก่อน

      Você pode lidar de diversas formas. Uma delas é aplicar alguma técnica, como oversampling na classe minoritária ou undersampling na majoritária. Existe a técnica de SMOTE que também é bem famosa. Outra abordagem é ajustar o ponto de corte da probabilidade. Lembrando que as técnicas de balanceamento são aplicadas apenas no conjunto de treinamento.

  • @ritag.m9208
    @ritag.m9208 ปีที่แล้ว

    O que significa a função set.seed ? Porque usou o número 123? É obrigatório usar essa função?

    •  ปีที่แล้ว

      O set.seed é para garantir a reprodutibilidade do código. Normalmente usamos quando há alguma etapa que envolve sorteio no código. Se não definirmos está semente, o sorteio feito no meu computador será diferente do feito no seu. O número 123 foi o que escolhi, mas poderia ser qualquer número. Porém, para obter resultados iguais ao do vídeo, você também deve usar o 123.

    •  ปีที่แล้ว

      Veja mais sobre isto aqui: pt.stackoverflow.com/questions/372347/uso-do-seed-no-r

  • @eduardo10642
    @eduardo10642 2 ปีที่แล้ว

    Boa aula. Poderia disponibilizar o código?

    •  2 ปีที่แล้ว +1

      Todos os códigos estão no meu site leticiaraposo.netlify.app, na aba Cursos e na opção Análise Inteligente de Dados.

    • @eduardo10642
      @eduardo10642 2 ปีที่แล้ว

      @ muito obrigado, suas aulas estão me ajudando bastante.