Regressão Linear Múltipla no R

R, Estatística e Aprendizado de Máquina

มุมมอง 4 485

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 21 ก.ย. 2024
ATENÇÃO: em 21:40 o R representa a raiz quadrado do coeficiente de determinação (R2) e não o coeficiente de correlação de Pearson.
Análise de regressão linear múltipla utilizando o R. O script encontra-se em leticiaraposo.....

ความคิดเห็น • 39

@mecativa87 3 หลายเดือนก่อน
Excelente
@izaiasdesouzasilva2885 2 ปีที่แล้ว
Obrigado pelo conteúdo!
@jfvicentini 2 ปีที่แล้ว
Parabéns! Muito boa sua aula!
2 ปีที่แล้ว
Muito obrigada!
@automatizzaautomacaoindust6097 3 ปีที่แล้ว
Parabéns , você tem ótima didática.
3 ปีที่แล้ว
Obrigada! :)
@luisgustavobettega6438 3 ปีที่แล้ว
Ótima aula, Letícia! Obrigado pelo conteúdo :)
3 ปีที่แล้ว
Muito obrigada! :)
@iag-trader8899 2 ปีที่แล้ว
Quanto tempo separados! te encontrei. Obrigado pelo conteúdo. Gostei
2 ปีที่แล้ว
Que ótimo! ☺️
@edivaldosampaiodossantos6074 2 ปีที่แล้ว
Show!!!!
@renatoribeiro46 3 ปีที่แล้ว ⁺¹
A sua apresentação foi muito elucidativa, mas gostaria de lhe perguntar, porque você não utilizou o BIC junto com AIC?
3 ปีที่แล้ว
Oi, Renato. Neste exemplo que dei, usei o AIC como critério de escolha do modelo, mas de fato poderíamos ter avaliado outros critérios, como o BIC. Na prática, a diferença entre eles é o tamanho da penalidade; o BIC penaliza a complexidade do modelo mais fortemente. De fato, seria mais interessante utilizar os dois critérios para selecionar o modelo. Obrigada pelo apontamento! :)
@leojp92 3 ปีที่แล้ว ⁺¹
A regressão começa em 16:00
@ViniciusAlmeida-yd1gp ปีที่แล้ว
Olá! Obrigado pelo vídeo. Quando você faz a parte de "divisão em treinamento e teste", não entendi o valor que foi usado em set.seed(123). Porque "123" ? Eu preciso fazer esse procedimento para outro modelo linear, mas não entendi se posso usar do jeito que está ou se faço alguma alteração.
ปีที่แล้ว
O set.seed é para definir a semente. Isso significa que irá garantir a reprodutibilidade do seu código. Como estamos dividindo os conjuntos de treinamento e teste de forma aleatória, precisamos que essa divisão seja a mesma, caso desejamos ver os mesmos resultados sempre que rodarmos o código. O número 123 foi uma escolha minha, mas você poderia usar qualquer número.
@ViniciusAlmeida-yd1gp ปีที่แล้ว
@ Consegui! Agradeço demais. No entanto, surgiu mais um problema. Na fase de "Desempenho do modelo", o comando "regr.eval()" não pode ser executado porque o pacote "DMwR" não está mais disponível. Nesse caso tem alguma outra função que eu possa usar para fazer a avaliação do desempenho?
ปีที่แล้ว
@@ViniciusAlmeida-yd1gp você pode baixar o pacote neste link: cran.r-project.org/src/contrib/Archive/DMwR/
@zandajunior8875 ปีที่แล้ว
optimo .. muti obrigado pela esplicacao mas e quando se trata de variaveis categoricas como fasso, ??? esse metodo e mais para variaveis quantitativas!!
ปีที่แล้ว
A regressão linear é usada quando a variável resposta é numérica e segue distribuição normal. Quanto às variáveis explicativas, elas podem ser categóricas ou numéricas.
@amandavizona828 3 ปีที่แล้ว
Letícia, quando você transforma a variável resposta:
# Aplicando sqrt na variável resposta
Boston2$medv2
3 ปีที่แล้ว
Pode sim, mas normalmente a gente muda na variável resposta, pois a regressão linear requer uma distribuição normal desta variável.
3 ปีที่แล้ว
A ideia é ver se essa transformação torna a distribuição normal. Normalmente usa-se raiz quadrada, log…
@jenivalfarias6259 2 ปีที่แล้ว
Na parte onde usa outro pacote (olsrr) pra gerar o modelo de regressão vc falou que o R está no padrão de coeficiente de Pearson, como eu faria pra fazer usando o método de Spearman? Essa parte está no minuto 21:40
2 ปีที่แล้ว
Oi! Na verdade, eu cometi um erro no vídeo. 🤦🏻‍♀️ O R ali representado é a raiz quadrada do R2 (coeficiente de determinação). Agradeço o seu comentário, pois conseguirei fazer uma errata no vídeo. O coeficiente de correlação de Pearson se dá pelo cálculo entre duas variáveis quantitativas e no vídeo estamos trabalhando com algumas variáveis preditivas para explicar a variável resposta.
Se você quiser determinar o coeficiente de correlação, tem que ser entre duas variáveis. Você poder usar o comando cor(variável1, variável2, method = “spearman”) para encontrar a correlação de Spearman entre duas quantitativas.
@jenivalfarias6259 2 ปีที่แล้ว
@ Entendi. Na verdade minha dúvida séria pra regressão em si, se seria possível nessa parte mencionada (usando esse pacote "olsrr") fazer a regressão pelo método de spearman. Ou essa regressão é independente de método?
Então onde tá assim:
mod_ols
@jenivalfarias6259 2 ปีที่แล้ว
Não sei se isso é possível, tenho pouco conhecimento nessas análises de dados.
2 ปีที่แล้ว ⁺¹
@@jenivalfarias6259 Na verdade, o método de Spearman que você quer usar (se for a correlação) não é possível nesta função, pois é uma medida calculada a partir de duas variáveis. Nesta função, temos um modelo com várias variáveis.
@jenivalfarias6259 2 ปีที่แล้ว
@ Certo, agradeço.
@boscao1985 3 ปีที่แล้ว
Olá! Parabéns pela sua aula! Ótima!!!
Estou com uma dúvida, qdo altero a variável inteira para factor há alteração do meu intercept e tbm dos meus coeficientes.
Afinal, vc poderia me dizer se a maneira correta é deixar minha variável dummy como fator ou inteiro?
3 ปีที่แล้ว ⁺¹
Muito obrigada! :)
Não sei se entendi direito...
Mas qual a classificação da sua variável? Ela é qualitativa? Porque se for, tem que ser factor. E automaticamente o R converte para dummy na hora da regressão. Por exemplo, você tem a variável cor dos olhos codificada em 1, 2 e 3. Ela é categórica, logo deve ser codificada como factor. Mas se a variável é inteira por natureza, como por exemplo número de filhos, então ela deve ser codificada como numérica.
Talvez não tenha te respondido. Se você puder falar qual a variável e como ela está, te ajudo melhor.
@boscao1985 3 ปีที่แล้ว
@ Obrigado por sua atenção. Então, qdo uso uma variável dummy no spss, no stata e no excel tenho q usar 0 ou 1 e eles são lidos como valores inteiros. No R se não ser o comando as.factor, o R lê o conjunto de dados como valores inteiros e não fatores.
Fiz as análises no SPSS, STATA e Excel e vi q há diferenças nos resultados qdo dou o comando as.factor para minha dummy no R. Porém qdo deixo como variável inteira (0 ou 1) no R os resultados entre os Softwares ficam idênticos.
Faça o q te falei e veja que há diferenças.
Minha dúvida fica, preciso dar o comando as.factor para minha dummy ou não? Fica a dúvida pq o melhor modelo ficou sem ser como fator, mas como inteiro.
3 ปีที่แล้ว ⁺¹
@@boscao1985 Ah, ok! Acho que entendi. Você já está com ela codificada em 0 e 1. Então no caso usa-se como inteiro mesmo. A questão é que se você tem uma variável categórica com 3 níveis (p. ex. cor dos olhos: azul, verde e castanho) e se ela não foi convertida previamente em dummy (resultando em duas novas variáveis), aí basta você codificá-la como factor e o R transformará a sua variável em dummy na hora da regressão.
@boscao1985 3 ปีที่แล้ว
@ muitíssimo obrigado.
@bucklasek1 2 ปีที่แล้ว
Oi Letícia, primeiramente muito obrigado pelo vídeo! :) fui avaliar meu modelo de regressão e tive a seguinte mensagem de erro: could not find function "regr.eval" , sabe o que pode estar acontecendo? Já estou usando a library(rpart) e não entendi porque estou tendo este erro, seria outra library que eu deveria usar para a função regr.eval ? Muito obrigado!
2 ปีที่แล้ว ⁺¹
Oi! Essa função é do pacote DMwR. ;)
@bucklasek1 2 ปีที่แล้ว
@ tentei usar ela, mas pelo que eu vi este pacote foi removido e não está mais disponível, vc tem alguma outra sugestão de função/library que eu possa usar pra medir a perfomance do meu modelo? Sem ser a summary, claro ;) obg!
2 ปีที่แล้ว ⁺¹
@@bucklasek1 Você pode baixar o .zip e instalar manualmente no R. Sabe fazer isso? www2.uaem.mx/r-mirror/web/packages/DMwR/index.html
@bucklasek1 2 ปีที่แล้ว
@ Depois de muita tentativa, consegui! Era preciso instalar uns 5 pacotes antes, e dai sim o DMWR funcionava manualmente... Muito obrigado pela ajuda!!!

ต่อไป

เล่นอัตโนมัติ