Muito bom, muito claro e explicativo. Tenho uma dúvida professor, quero fazer um estudo para avaliação da variação de uma curva. Tenho 'n' amostras desta curva, onde x é uma contagem incremental e y o valor lido/obtido em campo. Posso aplicar o R² para determinar/medir o quão estável ou nível de variação de desta curva? Pq o meu x é apenas o numero de amostras e y é a variável que estou analisando.
Implica causalidade. O R² é usado justamente para dizer se a variável X explica a mudança de valor na variável Y. Lembra quando ele disse q a regressão é sobre causalidade e a correlação n? Então, o R² é justamente o coeficiente de determinação em uma regressão linear.
Overfiting não é sobre a quantidade de acerto ou erro mas sim na capacidade do modelo conseguir generalizar o que aprendeu no treino e passar pro teste. Modelo "Overfitado" vai muito bem no treino e no teste tem um resultado horrível. Sendo assim, um modelo com 95% pode não ser Overfiting e um com 70 ser...
Olá. O termo "significativo" é usado na estatística para atestar que algo (um modelo ou regressão) é importante e não aleatório. Mas, sim, podemos ter um resultado significativo porém com baixa explicação (baixo R2). Mas o interessante mesmo é ter um resultado (modelo) significativo com alta explicação (um bom modelo) entre as variáveis em jogo (Y ~ X). Em parte isso vai depender de sua coleta de dados, se foi boa ou não, pensando que a verdade é que haja relação entre as variáveis testadas no modelo. Por outro lado, o preditor (ou os preditores) que você escolheu para tua pesquisa podem não ser o melhores para o modelo atual (explicar a variação de Y, a variável resposta) e assim o seu R2 pode ser baixo, sugerindo que outros preditores (não selecionados) explicam melhor a variação de Y. Espero ter ajudado!
Muito interessante, ótima explicação!!!
Muito bem explicado Professor, obrigado!
Excelente a aula professor !
Muito bom, muito claro e explicativo. Tenho uma dúvida professor, quero fazer um estudo para avaliação da variação de uma curva. Tenho 'n' amostras desta curva, onde x é uma contagem incremental e y o valor lido/obtido em campo. Posso aplicar o R² para determinar/medir o quão estável ou nível de variação de desta curva?
Pq o meu x é apenas o numero de amostras e y é a variável que estou analisando.
Como fazer análise estatística dos residuo ?
Olá,
O R2 alto significa alta correlação, mas não implica causalidade?
Implica causalidade. O R² é usado justamente para dizer se a variável X explica a mudança de valor na variável Y. Lembra quando ele disse q a regressão é sobre causalidade e a correlação n? Então, o R² é justamente o coeficiente de determinação em uma regressão linear.
Mas nesse caso 80% não é considerado overfiting?
Overfiting não é sobre a quantidade de acerto ou erro mas sim na capacidade do modelo conseguir generalizar o que aprendeu no treino e passar pro teste.
Modelo "Overfitado" vai muito bem no treino e no teste tem um resultado horrível. Sendo assim, um modelo com 95% pode não ser Overfiting e um com 70 ser...
O que quer dizer "significativo" Nesse exemplo? É melhor um modelo ruim pouco significativo ou o contrário? Nao entendi
Olá. O termo "significativo" é usado na estatística para atestar que algo (um modelo ou regressão) é importante e não aleatório. Mas, sim, podemos ter um resultado significativo porém com baixa explicação (baixo R2). Mas o interessante mesmo é ter um resultado (modelo) significativo com alta explicação (um bom modelo) entre as variáveis em jogo (Y ~ X). Em parte isso vai depender de sua coleta de dados, se foi boa ou não, pensando que a verdade é que haja relação entre as variáveis testadas no modelo. Por outro lado, o preditor (ou os preditores) que você escolheu para tua pesquisa podem não ser o melhores para o modelo atual (explicar a variação de Y, a variável resposta) e assim o seu R2 pode ser baixo, sugerindo que outros preditores (não selecionados) explicam melhor a variação de Y. Espero ter ajudado!