Regressão Linear Múltipla no R

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ก.ย. 2024
  • ATENÇÃO: em 21:40 o R representa a raiz quadrado do coeficiente de determinação (R2) e não o coeficiente de correlação de Pearson.
    Análise de regressão linear múltipla utilizando o R. O script encontra-se em leticiaraposo.....

ความคิดเห็น • 39

  • @mecativa87
    @mecativa87 3 หลายเดือนก่อน

    Excelente

  • @izaiasdesouzasilva2885
    @izaiasdesouzasilva2885 2 ปีที่แล้ว

    Obrigado pelo conteúdo!

  • @jfvicentini
    @jfvicentini 2 ปีที่แล้ว

    Parabéns! Muito boa sua aula!

    •  2 ปีที่แล้ว

      Muito obrigada!

  • @automatizzaautomacaoindust6097
    @automatizzaautomacaoindust6097 3 ปีที่แล้ว

    Parabéns , você tem ótima didática.

    •  3 ปีที่แล้ว

      Obrigada! :)

  • @luisgustavobettega6438
    @luisgustavobettega6438 3 ปีที่แล้ว

    Ótima aula, Letícia! Obrigado pelo conteúdo :)

    •  3 ปีที่แล้ว

      Muito obrigada! :)

  • @iag-trader8899
    @iag-trader8899 2 ปีที่แล้ว

    Quanto tempo separados! te encontrei. Obrigado pelo conteúdo. Gostei

    •  2 ปีที่แล้ว

      Que ótimo! ☺️

  • @edivaldosampaiodossantos6074
    @edivaldosampaiodossantos6074 2 ปีที่แล้ว

    Show!!!!

  • @renatoribeiro46
    @renatoribeiro46 3 ปีที่แล้ว +1

    A sua apresentação foi muito elucidativa, mas gostaria de lhe perguntar, porque você não utilizou o BIC junto com AIC?

    •  3 ปีที่แล้ว

      Oi, Renato. Neste exemplo que dei, usei o AIC como critério de escolha do modelo, mas de fato poderíamos ter avaliado outros critérios, como o BIC. Na prática, a diferença entre eles é o tamanho da penalidade; o BIC penaliza a complexidade do modelo mais fortemente. De fato, seria mais interessante utilizar os dois critérios para selecionar o modelo. Obrigada pelo apontamento! :)

  • @leojp92
    @leojp92 3 ปีที่แล้ว +1

    A regressão começa em 16:00

  • @ViniciusAlmeida-yd1gp
    @ViniciusAlmeida-yd1gp ปีที่แล้ว

    Olá! Obrigado pelo vídeo. Quando você faz a parte de "divisão em treinamento e teste", não entendi o valor que foi usado em set.seed(123). Porque "123" ? Eu preciso fazer esse procedimento para outro modelo linear, mas não entendi se posso usar do jeito que está ou se faço alguma alteração.

    •  ปีที่แล้ว

      O set.seed é para definir a semente. Isso significa que irá garantir a reprodutibilidade do seu código. Como estamos dividindo os conjuntos de treinamento e teste de forma aleatória, precisamos que essa divisão seja a mesma, caso desejamos ver os mesmos resultados sempre que rodarmos o código. O número 123 foi uma escolha minha, mas você poderia usar qualquer número.

    • @ViniciusAlmeida-yd1gp
      @ViniciusAlmeida-yd1gp ปีที่แล้ว

      @ Consegui! Agradeço demais. No entanto, surgiu mais um problema. Na fase de "Desempenho do modelo", o comando "regr.eval()" não pode ser executado porque o pacote "DMwR" não está mais disponível. Nesse caso tem alguma outra função que eu possa usar para fazer a avaliação do desempenho?

    •  ปีที่แล้ว

      @@ViniciusAlmeida-yd1gp você pode baixar o pacote neste link: cran.r-project.org/src/contrib/Archive/DMwR/

  • @zandajunior8875
    @zandajunior8875 ปีที่แล้ว

    optimo .. muti obrigado pela esplicacao mas e quando se trata de variaveis categoricas como fasso, ??? esse metodo e mais para variaveis quantitativas!!

    •  ปีที่แล้ว

      A regressão linear é usada quando a variável resposta é numérica e segue distribuição normal. Quanto às variáveis explicativas, elas podem ser categóricas ou numéricas.

  • @amandavizona828
    @amandavizona828 3 ปีที่แล้ว

    Letícia, quando você transforma a variável resposta:
    # Aplicando sqrt na variável resposta
    Boston2$medv2

    •  3 ปีที่แล้ว

      Pode sim, mas normalmente a gente muda na variável resposta, pois a regressão linear requer uma distribuição normal desta variável.

    •  3 ปีที่แล้ว

      A ideia é ver se essa transformação torna a distribuição normal. Normalmente usa-se raiz quadrada, log…

  • @jenivalfarias6259
    @jenivalfarias6259 2 ปีที่แล้ว

    Na parte onde usa outro pacote (olsrr) pra gerar o modelo de regressão vc falou que o R está no padrão de coeficiente de Pearson, como eu faria pra fazer usando o método de Spearman? Essa parte está no minuto 21:40

    •  2 ปีที่แล้ว

      Oi! Na verdade, eu cometi um erro no vídeo. 🤦🏻‍♀️ O R ali representado é a raiz quadrada do R2 (coeficiente de determinação). Agradeço o seu comentário, pois conseguirei fazer uma errata no vídeo. O coeficiente de correlação de Pearson se dá pelo cálculo entre duas variáveis quantitativas e no vídeo estamos trabalhando com algumas variáveis preditivas para explicar a variável resposta.
      Se você quiser determinar o coeficiente de correlação, tem que ser entre duas variáveis. Você poder usar o comando cor(variável1, variável2, method = “spearman”) para encontrar a correlação de Spearman entre duas quantitativas.

    • @jenivalfarias6259
      @jenivalfarias6259 2 ปีที่แล้ว

      @ Entendi. Na verdade minha dúvida séria pra regressão em si, se seria possível nessa parte mencionada (usando esse pacote "olsrr") fazer a regressão pelo método de spearman. Ou essa regressão é independente de método?
      Então onde tá assim:
      mod_ols

    • @jenivalfarias6259
      @jenivalfarias6259 2 ปีที่แล้ว

      Não sei se isso é possível, tenho pouco conhecimento nessas análises de dados.

    •  2 ปีที่แล้ว +1

      @@jenivalfarias6259 Na verdade, o método de Spearman que você quer usar (se for a correlação) não é possível nesta função, pois é uma medida calculada a partir de duas variáveis. Nesta função, temos um modelo com várias variáveis.

    • @jenivalfarias6259
      @jenivalfarias6259 2 ปีที่แล้ว

      @ Certo, agradeço.

  • @boscao1985
    @boscao1985 3 ปีที่แล้ว

    Olá! Parabéns pela sua aula! Ótima!!!
    Estou com uma dúvida, qdo altero a variável inteira para factor há alteração do meu intercept e tbm dos meus coeficientes.
    Afinal, vc poderia me dizer se a maneira correta é deixar minha variável dummy como fator ou inteiro?

    •  3 ปีที่แล้ว +1

      Muito obrigada! :)
      Não sei se entendi direito...
      Mas qual a classificação da sua variável? Ela é qualitativa? Porque se for, tem que ser factor. E automaticamente o R converte para dummy na hora da regressão. Por exemplo, você tem a variável cor dos olhos codificada em 1, 2 e 3. Ela é categórica, logo deve ser codificada como factor. Mas se a variável é inteira por natureza, como por exemplo número de filhos, então ela deve ser codificada como numérica.
      Talvez não tenha te respondido. Se você puder falar qual a variável e como ela está, te ajudo melhor.

    • @boscao1985
      @boscao1985 3 ปีที่แล้ว

      @ Obrigado por sua atenção. Então, qdo uso uma variável dummy no spss, no stata e no excel tenho q usar 0 ou 1 e eles são lidos como valores inteiros. No R se não ser o comando as.factor, o R lê o conjunto de dados como valores inteiros e não fatores.
      Fiz as análises no SPSS, STATA e Excel e vi q há diferenças nos resultados qdo dou o comando as.factor para minha dummy no R. Porém qdo deixo como variável inteira (0 ou 1) no R os resultados entre os Softwares ficam idênticos.
      Faça o q te falei e veja que há diferenças.
      Minha dúvida fica, preciso dar o comando as.factor para minha dummy ou não? Fica a dúvida pq o melhor modelo ficou sem ser como fator, mas como inteiro.

    •  3 ปีที่แล้ว +1

      @@boscao1985 Ah, ok! Acho que entendi. Você já está com ela codificada em 0 e 1. Então no caso usa-se como inteiro mesmo. A questão é que se você tem uma variável categórica com 3 níveis (p. ex. cor dos olhos: azul, verde e castanho) e se ela não foi convertida previamente em dummy (resultando em duas novas variáveis), aí basta você codificá-la como factor e o R transformará a sua variável em dummy na hora da regressão.

    • @boscao1985
      @boscao1985 3 ปีที่แล้ว

      @ muitíssimo obrigado.

  • @bucklasek1
    @bucklasek1 2 ปีที่แล้ว

    Oi Letícia, primeiramente muito obrigado pelo vídeo! :) fui avaliar meu modelo de regressão e tive a seguinte mensagem de erro: could not find function "regr.eval" , sabe o que pode estar acontecendo? Já estou usando a library(rpart) e não entendi porque estou tendo este erro, seria outra library que eu deveria usar para a função regr.eval ? Muito obrigado!

    •  2 ปีที่แล้ว +1

      Oi! Essa função é do pacote DMwR. ;)

    • @bucklasek1
      @bucklasek1 2 ปีที่แล้ว

      @ tentei usar ela, mas pelo que eu vi este pacote foi removido e não está mais disponível, vc tem alguma outra sugestão de função/library que eu possa usar pra medir a perfomance do meu modelo? Sem ser a summary, claro ;) obg!

    •  2 ปีที่แล้ว +1

      @@bucklasek1 Você pode baixar o .zip e instalar manualmente no R. Sabe fazer isso? www2.uaem.mx/r-mirror/web/packages/DMwR/index.html

    • @bucklasek1
      @bucklasek1 2 ปีที่แล้ว

      @ Depois de muita tentativa, consegui! Era preciso instalar uns 5 pacotes antes, e dai sim o DMWR funcionava manualmente... Muito obrigado pela ajuda!!!