Exatamente este o objetivo. Não é substituir a escola e sim complementar aquilo que as pessoas aprendem na escola na visão de um profissional da indústria.
Muito bom Marcelo!!! Obrigado por compartilhar seu conhecimento... Faz tempo que eu estava tentanto entender isso e vc conseguiu explicar muito bem, me fazendo fixar o conceito...OBG!!!
Fico feliz pelo conteúdo ser útil. Não dou cursos, sei o mesmo que vocês e esse ano estarei compartilhando o máximo de experimentos que eu puder aqui no canal.
Na regressão você consegue fazer um teste de relacionamento entre as variáveis. Em um teste-t ou qui-quadrado você consegue fazer testes de independencia. Exemplo. Imagine que temos uma criação de leitões e eu te pergunto. Será que o comprimento dos dentes dependem do tipo de suplemento que eu dou para os leitões? Os suplementos são suco de laranja e vitamina C. A hipotese nula ou hipotese de igualdade diz que não, qualquer suplemente que você dê não fará diferença ou seja, essas variáveis são independentes uma da outra. Agora, see você estiver usando o R , tente digitar isso abaixo e executar você vai ver que o teste -t vai retornar *p-value = 0.06063* e a mensagem * true difference in means between group OJ and group VC is not equal to 0* Há diferença entre o comprimento dos dentes dos leitões tratados com vitamina C e suco de laranja. O valor de P não é tão significativo mas elas não são totalmente independentes. data("ToothGrowth") #len = comprimento do dente #supp=suplemento(vitamina c ou orange juice/suco de laranja) ToothGrowth |> head() #teste de independencia t.test(len~supp, data = ToothGrowth) Espero ter ajudado
fico feliz que o conteúdo tenha sido útil o objetivo é facilitar a vida do pesquisador e o vídeo de anova já tem th-cam.com/video/suRxLl3pCpI/w-d-xo.html
Depende do objetivo do seu modelo. a) Se o modelo for *inferencial* que é aquele onde você busca compreender a causa que influencia o fenômeno, você precisaria fazer outros testes ou reportar. Lembrando que insatisfatório vai depender do seu delta. b) Se o modelo for de *previsão* que é aquele onde você busca prever o valor futuro, com base nos dados do passado. O valor de *p* em si não exerce influência direta e sim o resultado da previsão por exemplo (RMSE ou root mean square error).
Olá, Para fazer a regressão, as variáveis devem ser relacionadas ou não? A função CORREL do excel é útil na regressão? Como saber se há uma correlação espúria? Obrigado.
1) Não, mas do ponto de vista prático é desejavel pois eu quero usar a informação pra tomar uma decisão. 2) Depende do seu objetivo, tente fazer a correlação ao quadrado...você vai achar o coeficiente de determinação. 3) Existem alguns métodos eu uso o ishikawa e 5 porquês, aprendi com os japoneses.
Olá Marcelo! que aula maravilhosa. Trabalho em um Laboratório de calibração e precisamos de uma planilha que gere a curva de regressão linear, resíduos e com alguns detalhes. Gostaria de saber se você poderia ver a possibilidade de desenvolver isso para nós como prestação de serviço. Como posso fazer para te encaminhar o que precisamos e você nos falar o valor?
Eu agradeço muito e já parabenizo pela decisão de usar modelos para suporte a decisões. A minha habilidade com planilhas é bastante limitada e devido ao meu trabalho não consigo atender a solicitação mas novamente parabenizo pela decisão. Este exemplo que fiz foi apenas um modelo simples pra mostrar para as pessoas como usar um modelo de regressão.
Ola Tulio...Sim e este mesmo. A diferença aqui e que o software faz os cálculos das médias, da inclinação e interceptação. Mas o método e este mesmo que vem do inglês least squares. A regressão linear seria o relacionamento entre as variáveis y e x enquanto os mínimos quadrados seria um dos métodos de ajuste usados.
Já tentei mas não consigo por causa do tempo limitado mas um professor que recomendo sempre é o Vitor Wilher ele tem um site chamado Análise Macro para o R. Já para aulas de estatística eu recomendo o professor Raymundo Azevedo da USP, tem muitos vídeos dele e são todos de excelente qualidade.
A quantidade de carga que ele consegue processar de uma só vez. É como um caminhão e um carro. O carro é mais ágil e prático de manobrar, mas se for carregar uma mudança ou transportar um volume grande, o caminhão é mais útil nessa situação. Não há melhor ou pior, e sim o mais adequado pra cada situação. Exemplo prático. 1. Imagine que uma empresa de seguros peça pra você analisar o risco de 120 países considerando apenas renda e expectiva de vida. 2. No excel, você precisaria fazer 120 modelos manualmente 3. No R você consegue fazer um modelo e separá-los por país com a mesma quantidade de trabalho. 4. No R se você enviar seu código para alguem no Japão, ele conseguirá sem esforço replicar seu modelo. 5. No Excel, se você mandar a planilha, certamente a pessoa vai demorar a entender quais os procedimentos que você usou. 6. Se a pessoa do outro lado do mundo não consegue replicar o seu modelo ou experimento, há uma probabilidade grande de perda de alguns milhões de dólares em conhecimento científico. É o que chamamos hoje de *reproducibility crisis*
dúvidas, a correlação é = beta ? O coeficiente de determinação é o mesmo que coeficiente angular? O erro padrão é a média de desvio dos resíduos, ou o desvio padrão da média ?
Estou pensando em fazer outro vídeo pra melhorar o entendimento mas em resumo 1. Não conheço como beta. 2. Não, o coeficiente angular é a inclinação ou (slope) 3. Erro padrão é a distância média em que os valores observados estão em relação a reta de regressão.
@@carvalhoribeiro boa noite. estudei um pouco sobre o assunto e descobri que: o coeficiente angular é o mesmo que beta, a relação entre y e x , ou seja , a inclinação da reta. o coeficiente linear é o mesmo que o intercept, a posição de y quando o x=0. os coeficientes , dependendo da area de aplicação da estatistica, variam de nome mas é a mesma coisa. tudo de acordo com o que vc mostrou no video. abrs.
@@AndreSantos-lt5sk show de bola é isso aí...e o mais importante, saber o que cada um faz e o comportamento quando os valores são alterados...tente incluir um valor alto em um ponto (outlier) pra ver como o modelo fica instavel.
1. Neste caso conforme os gastos com propaganda sobem as vendas também sobem 2. O modelo retorna que nessa relação o valor de P é menor do que 5% 3. A interpretação é: Há menos de 5% de probabilidade do crescimento das vendas serem atribuídas ao acaso, sendo assim é possível afirmar com 95% de confiança que algum fator está fazendo com que as vendas aumentem. Neste caso, é possível que seja o gasto com propaganda.
Passei 3 dias lendo sobre isso, pra você explicar em alguns minutos kkkk muuuuuito obrigada, me ajudou muito nos resultados do meu projeto
Fico feliz por ter ajudado. Boa sorte em seus projetos
Parabéns Carvalho, sensacional sua didática, faço Ciência de Dados e Inteligência Artificial, gostei muito de seus vídeos. Muitíssimo obrigado!
Fico feliz sabendo que o conteúdo foi útil. Boa sorte em sua carreira de cientista de dados e AI.
Olá professor. A explicação é boa para quem já conhece estatística. Se o objetivo do vídeo é mostrar o uso da ferramenta Excel, está perfeita.
Exatamente este o objetivo. Não é substituir a escola e sim complementar aquilo que as pessoas aprendem na escola na visão de um profissional da indústria.
Ótima explicação! Obrigado pelo conteúdo 👌
fico feliz que o conteúdo tenha sido útil pra você
Parabéns pelo conteúdo. Claro, bem estruturado e objetivo
Obrigado. fico feliz que o coteúdo tenha sido útil pra você
Explicação sensacional.
fico feliz que tenha sido útil
Muito bom Marcelo!!! Obrigado por compartilhar seu conhecimento... Faz tempo que eu estava tentanto entender isso e vc conseguiu explicar muito bem, me fazendo fixar o conceito...OBG!!!
Fico feliz que o conteúdo tenha ajudado no seu entendimento
Velho tu é muito bom explicando. Cara, se lançar curso avisa.
Fico feliz pelo conteúdo ser útil. Não dou cursos, sei o mesmo que vocês e esse ano estarei compartilhando o máximo de experimentos que eu puder aqui no canal.
Eu entendi em alguns minutos...excelente!
Obrigado
Só não entendi como interpreto os testes de independência? Como verifico se as variáveis são ou não independentes entre si.?
Na regressão você consegue fazer um teste de relacionamento entre as variáveis. Em um teste-t ou qui-quadrado você consegue fazer testes de independencia.
Exemplo. Imagine que temos uma criação de leitões e eu te pergunto. Será que o comprimento dos dentes dependem do tipo de suplemento que eu dou para os leitões? Os suplementos são suco de laranja e vitamina C. A hipotese nula ou hipotese de igualdade diz que não, qualquer suplemente que você dê não fará diferença ou seja, essas variáveis são independentes uma da outra.
Agora, see você estiver usando o R , tente digitar isso abaixo e executar você vai ver que o teste -t vai retornar *p-value = 0.06063* e a mensagem * true difference in means between group OJ and group VC is not equal to 0*
Há diferença entre o comprimento dos dentes dos leitões tratados com vitamina C e suco de laranja. O valor de P não é tão significativo mas elas não são totalmente independentes.
data("ToothGrowth")
#len = comprimento do dente
#supp=suplemento(vitamina c ou orange juice/suco de laranja)
ToothGrowth |> head()
#teste de independencia
t.test(len~supp, data = ToothGrowth)
Espero ter ajudado
@@carvalhoribeiro não consegui entender muito bem como fazer com teste t? Fazendo na mão primeiro pra depois ir pro software
Que vídeo perfeito, cara. Me ajudando em agosto de 2021.
Ótimo Conteúdo, meu ajudou muitoooooooooo
Fico feliz que o conteúdo tenha sido útil pra você
Gostei muito da explicação. Linguagem de fácil compreensão. Parabéns. Poderia gravar um vídeo de análise da Anova
fico feliz que o conteúdo tenha sido útil o objetivo é facilitar a vida do pesquisador e o vídeo de anova já tem th-cam.com/video/suRxLl3pCpI/w-d-xo.html
ótima aula!! obrigada!!
fico contente que o conteúdo tenha sido útil
Obrigado por compartilhar!
Fico contente que o conteúdo esteja sendo útil
No seu exemplo, o valor de P para a intersecção é maior que 5% (insatisfatório). O que isso significa para a robustez do modelo?
Depende do objetivo do seu modelo.
a) Se o modelo for *inferencial* que é aquele onde você busca compreender a causa que influencia o fenômeno, você precisaria fazer outros testes ou reportar. Lembrando que insatisfatório vai depender do seu delta.
b) Se o modelo for de *previsão* que é aquele onde você busca prever o valor futuro, com base nos dados do passado. O valor de *p* em si não exerce influência direta e sim o resultado da previsão por exemplo (RMSE ou root mean square error).
muito boa a explicação
Fico contente que o conteúdo tenha sido útil
Parabéns tirou muitas dúvidas minhas obrigado
fico contente que o conteúdo tenha ajudado
Como eu coloco o p-value no gráfico ali ao lado do Rquadrado?
No excel não sei. No R você consegue inserir usando o pacote ggpubr th-cam.com/video/suRxLl3pCpI/w-d-xo.html
TOPPPPPPPPPPPPPPPPPPPP. Excelente, obrigado!!!!!!!!!!!!!!!!
que bom que foi útil
Olá,
Para fazer a regressão, as variáveis devem ser relacionadas ou não? A função CORREL do excel é útil na regressão?
Como saber se há uma correlação espúria?
Obrigado.
1) Não, mas do ponto de vista prático é desejavel pois eu quero usar a informação pra tomar uma decisão.
2) Depende do seu objetivo, tente fazer a correlação ao quadrado...você vai achar o coeficiente de determinação.
3) Existem alguns métodos eu uso o ishikawa e 5 porquês, aprendi com os japoneses.
Explica muito bem, parabéns!
Que bom que foi util
Olá Marcelo! que aula maravilhosa. Trabalho em um Laboratório de calibração e precisamos de uma planilha que gere a curva de regressão linear, resíduos e com alguns detalhes. Gostaria de saber se você poderia ver a possibilidade de desenvolver isso para nós como prestação de serviço. Como posso fazer para te encaminhar o que precisamos e você nos falar o valor?
Eu agradeço muito e já parabenizo pela decisão de usar modelos para suporte a decisões. A minha habilidade com planilhas é bastante limitada e devido ao meu trabalho não consigo atender a solicitação mas novamente parabenizo pela decisão. Este exemplo que fiz foi apenas um modelo simples pra mostrar para as pessoas como usar um modelo de regressão.
Esse tipo de regressão seria o mesmo do método dos mínimos quadrados?
Ola Tulio...Sim e este mesmo. A diferença aqui e que o software faz os cálculos das médias, da inclinação e interceptação. Mas o método e este mesmo que vem do inglês least squares. A regressão linear seria o relacionamento entre as variáveis y e x enquanto os mínimos quadrados seria um dos métodos de ajuste usados.
Cara, parabens e muito obrigada, se eu conseguir o emprego te devo uma cerveja =D
Valeu...muito boa sorte em sua entrevista
Você daria aula particular por zoom, uma aula básica pra entender algumas contas estatísticas?
Já tentei mas não consigo por causa do tempo limitado mas um professor que recomendo sempre é o Vitor Wilher ele tem um site chamado Análise Macro para o R. Já para aulas de estatística eu recomendo o professor Raymundo Azevedo da USP, tem muitos vídeos dele e são todos de excelente qualidade.
@@carvalhoribeiro muito obrigado mesmo
As aulas do Raymundo são excelentes procure por "Estatística Descritiva - parte 1 USP". Acho que você vai gostar muito.
Qual seria a vantagem do R sobre o Excel?
A quantidade de carga que ele consegue processar de uma só vez. É como um caminhão e um carro. O carro é mais ágil e prático de manobrar, mas se for carregar uma mudança ou transportar um volume grande, o caminhão é mais útil nessa situação. Não há melhor ou pior, e sim o mais adequado pra cada situação. Exemplo prático.
1. Imagine que uma empresa de seguros peça pra você analisar o risco de 120 países considerando apenas renda e expectiva de vida.
2. No excel, você precisaria fazer 120 modelos manualmente
3. No R você consegue fazer um modelo e separá-los por país com a mesma quantidade de trabalho.
4. No R se você enviar seu código para alguem no Japão, ele conseguirá sem esforço replicar seu modelo.
5. No Excel, se você mandar a planilha, certamente a pessoa vai demorar a entender quais os procedimentos que você usou.
6. Se a pessoa do outro lado do mundo não consegue replicar o seu modelo ou experimento, há uma probabilidade grande de perda de alguns milhões de dólares em conhecimento científico.
É o que chamamos hoje de *reproducibility crisis*
@@carvalhoribeiro excelente explicação, muito obrigado!
Arrasou na explicação! Os 95% significam o que?
é o calcula que o excel faz considerando o intervalo de confiança
dúvidas, a correlação é = beta ?
O coeficiente de determinação é o mesmo que coeficiente angular?
O erro padrão é a média de desvio dos resíduos, ou o desvio padrão da média ?
Estou pensando em fazer outro vídeo pra melhorar o entendimento mas em resumo
1. Não conheço como beta.
2. Não, o coeficiente angular é a inclinação ou (slope)
3. Erro padrão é a distância média em que os valores observados estão em relação a reta de regressão.
@@carvalhoribeiro boa noite.
estudei um pouco sobre o assunto e descobri que:
o coeficiente angular é o mesmo que beta, a relação entre y e x , ou seja , a inclinação da reta.
o coeficiente linear é o mesmo que o intercept, a posição de y quando o x=0.
os coeficientes , dependendo da area de aplicação da estatistica, variam de nome mas é a mesma coisa.
tudo de acordo com o que vc mostrou no video.
abrs.
@@AndreSantos-lt5sk show de bola é isso aí...e o mais importante, saber o que cada um faz e o comportamento quando os valores são alterados...tente incluir um valor alto em um ponto (outlier) pra ver como o modelo fica instavel.
gracias por el vídeo.
No hay de que
Bom dia
Bom dia
Não entendi no ''valor-p''
1. Neste caso conforme os gastos com propaganda sobem as vendas também sobem
2. O modelo retorna que nessa relação o valor de P é menor do que 5%
3. A interpretação é: Há menos de 5% de probabilidade do crescimento das vendas serem atribuídas ao acaso, sendo assim é possível afirmar com 95% de confiança que algum fator está fazendo com que as vendas aumentem. Neste caso, é possível que seja o gasto com propaganda.