Excelente conteúdo, esse é um dos melhores canais que encontrei sobre analise estatística. Em alguns livros encontrei dizendo que o teste de normalidade Doornik-Hansen é ainda melhor que o teste Henze-Zirkler.
Parabéns, menina, você é boa! Sou matemático, mas estou trabalhando e estudando muito estatística. Suas aulas são objetivas e ajudam muito que quer pegar e fazer as coisas sem muita frescura. Abraço e sucesso.
Olá, Fernanda. Estou tentando executar uma MANOVA de 2 vias (Grupo e Tempo), pelo que transformei a base de dados do formato wide para o formato long. Sendo assim, eu tenho a coluna ID (que ordena os sujeitos), as colunas das duas vias (Grupo e Tempo) e 16 colunas para as outras variáveis dependentes numéricas. Desta forma, para executar o teste para a verificação do pressuposto de normalidade, estou a utilizar o seguinte código: dadosml %>% group_by(Grupo,Time) %>% doo(~mshapiro_test(.)) Ou seja, eu não fiz a seleção das colunas que você fez, pois penso que no caso do formato long isso não faça sentido. Entretanto, está a acontecer o seguinte erro: Error in `mutate()`: ℹ In argument: `data = map(.data$data, .f, ...)`. Caused by error in `map()`: ℹ In index: 1. Caused by error in `rng[2] - rng[1]`: ! non-numeric argument to binary operator Run `rlang::last_trace()` to see where the error occurred. Sabe me dizer o que pode ser? Obrigado 😊🙏
Bom dia, Fernanda! Tenho em meu banco de dados uma VI e 19 VDs. Ao rodar a distância de mahalanobis aparece o seguinte erro: "dados %>% select(1:21) %>% group_by(Grupo) %>% doo(~mahalanobis_distance(.)) Erro: Problem with `mutate()` input `data`. x sistema é computacionalmente singular: condição recíproca número = 3.91582e-19 i Input `data` is `map(.data$data, .f, ...)`." O que poderia ser? Parabéns pelo conteúdo!!!
Oi, Gillard, não tenho certeza. Dá uma olhada se em alguma dessas colunas os valores não são todos idênticos, parece que é isso que o erro está indicando. Mas o melhor é jogar esse erro no Google, que em geral você encontra alguém que postou esse erro no StackOverflow, e as pessoas ajudaram a solucionar ;)
Bom dia Fernanda! Primeiramente, parabéns pelos seus vídeos! São muito bem produzidos e muito didáticos. Tenho duas dúvidas: 1. Antes de realizar esta análise, eu deveria padronizar os dados, com média 0 e desvio 1? 2. Tem alguma restrição quanto ao número de variáveis dependentes? Tenho duas variáveis independentes e cinco independentes, todas com 4 repetições. Percebi que o teste de normalidade multivariada deste código funciona apenas quando adiciono três variáveis dependentes. Mais uma vez, parabéns pelo trabalho!
Quando que vai sair uns vídeos de modelos lineares mistos Fernanda? Do jeito que vc explica estatística, até minha sobrinha de 6 anos de idade aprende! Parabéns!
Hahaha! Amei! Mas ainda preciso estudas mais modelos lineares mistos para chegar no ponto em que eu consigo ensiná-los. Então, ainda vou gravar, mas vai demorar...
Oi Fernanda, mais um vez um ótimo vídeo. Bons vídeos fazem a gente ter dúvidas hehe O que você acha sobre a estratégia de fazer uma PCA e usar o primeiro autovalor como variável dependente em uma ANOVA? Uma vez que o autovalor é uma associação multivariada das variáveis dependentes. Vê algum problema nessa abordagem? Obrigado
Oi, Guilherme, não tenho muito o hábito de usar PCA, então, não sei dizer se haveria problema... Mas, eu pensaria por exemplo em usar modelagem de equações estruturais nessa situação... Dá uma olhada nas aulas do Bruno, do canal Psicometria Online, que ele aprofunda mais a discussão sobre esses testes.
Olá Fernanda! Parabéns pela qualidade de todos o vídeos, é uma verdadeira enciclopédia. Estou com uma dificuldade no acionamento da função "doo" , que está no Passo 3, no teste de Shapiro-Wilk. Ele me oferece a seguinte mensagem: Error in doo(., ~mshapiro_test(.)) : não foi possível encontrar a função "doo" Tentei achar essa função em outros tutoriais e não consegui. Alguém sabe o que poderia ser?
Oi, André, preciso checar porque deve ter atualizado (mas não conseguirei fazer isso hoje). Mas, já te digo que vale a pena trocar para o pacote mvn, que faz análises de normalidade multivariadas, e dá bem menos erro.
@@FernandaPeres Ok, obrigado. Me estranhou não ter achado a função "doo" nas buscas, mas como sou iniciante fico com a ideia de que houve uma busca errada no termo ou coisa parecida. Parabéns pela divulgação científica que você faz.
Olá fernanda Tudo bem, Obrigado por seus videos... Não consigo redor o script recebo a seguinte notificação de erro: Error in `mutate()`: ! Problem while computing `data = map(.data$data, .f, ...)`. Caused by error in `solve.default()`: ! system is computationally singular: reciprocal condition number = 8.82594e-27 Run `rlang::last_error()` to see where the error occurred.
Oi, Willian. Aqui está funcionando. Provavelmente é alguma alteração no código que você tenha feito, ou um problema específico com o seu banco. Mas, joga o erro e o código que não rodou (que gerou o erro) no Google, que em fóruns de discussão você encontra a resposta.
Olá, tudo bem? Seus vídeos são excelentes, estou com o seguinte erro: Erro: Problem with `mutate()` column `data`. i `data = map(.data$data, .f, ...)`. x sample size must be between 3 and 5000 Será que poderia ser pelos tratamentos não terem a mesma quantidade de observações?
Não tenho como saber exatamente o que aconteceu (recomendo dar uma olhada no StackOverflow). Mas, é possível que você tenha grupos com menos de 3 sujeitos, aí ele vai dar erro mesmo. Se você tem valor para uma determinada variável dependente, mas não para outra (nessa outra o valor é ausente), esse sujeito será eliminado da análise. Isso pode estar reduzindo o seu n a ser analisado.
@@FernandaPeres Na hora de acrescentar mais variáveis (4 numéricas e 2 categóricas) ao Teste de Henze-Zirkler para fazer a análise uni e multivariada, aparece o seguinte erro: > mvn(data = dados[,1:10], subset = "ID", "Mod", "Temp", "Cap", "Cond", "Sup", mvnTest = "hz") Error in if (cov) { : argumento não é interpretável como lógico. Você sabe como resolver esse problema?
@@juliacordeiro1212 Provavelmente o erro está aparecendo porque você inseriu variáveis categóricas. Normalidade só faz sentido para variável numérica :)
@@FernandaPeres No exemplo do vídeo você colocou mvn(data = dados [,2:4], subset = "Alcool", mvnTest = "hz"). Alcool é uma variável independente (categórica), que estava na coluna 2. As variáveis dependentes estavam nas colunas 3 e 4. Ou seja, entendi que todas as variáveis (independentes e dependentes) que você queria analisar estavam inclusas dentro do colchetes. Por isso, coloquei minhas variáveis independentes (categóricas e numéricas) listadas após o subset e inclui todas as minhas colunas de variáveis nos colchetes [,1:10]. Nas colunas 1 a 6, eu tenho variáveis independentes (4 numéricas e 2 categóricas) . Nas colunas 7 a 10, eu tenho variáveis numéricas dependentes. Eu queria olhar a normalidade multivariada entre as colunas 7 a 10 , em função dos grupos das colunas de 1 a 6. Será que estou interpretando errado?
@@juliacordeiro1212 Oi, Júlia, faz sentido o que você pensou, mas não sei se a forma de escrever a função é exatamente essa, talvez tenha que colocar as variáveis independentes em um vetor c(). Dá uma pesquisada, vai ter essa informação ou na documentação do pacote ou em fóruns (jogando no Google o erro você deve encontrar discussões boas).
Depende da premissa. O livro do Andy Field, Discovering Statistics using R, discute isso, se não me engano. Tem a opção também de usar outra análise multivariada, como análise de discriminante.
Excelente conteúdo, esse é um dos melhores canais que encontrei sobre analise estatística. Em alguns livros encontrei dizendo que o teste de normalidade Doornik-Hansen é ainda melhor que o teste Henze-Zirkler.
Fernanda, você é mil!!! Obrigado por compartilhar conhecimento!
Parabéns, menina, você é boa! Sou matemático, mas estou trabalhando e estudando muito estatística. Suas aulas são objetivas e ajudam muito que quer pegar e fazer as coisas sem muita frescura. Abraço e sucesso.
não pare por favor, estou aprendendo muito !
MARAVILHOSOOOOOOOOOOOOOOOOOOOOO. Muito didático!!!
😊♥️
Parabéns. Gosto muito dos seus vídeos, sempre nos socorrendo.
Top demais! Parabéns pelo conteúdo maravilhoso de sempre!
Parabéns Fernanda, vc tem muito talento pra ser professora...
Obrigada! Ainda bem, porque eu sou professora há 10 anos, hahaha
Olá, Fernanda. Estou tentando executar uma MANOVA de 2 vias (Grupo e Tempo), pelo que transformei a base de dados do formato wide para o formato long. Sendo assim, eu tenho a coluna ID (que ordena os sujeitos), as colunas das duas vias (Grupo e Tempo) e 16 colunas para as outras variáveis dependentes numéricas. Desta forma, para executar o teste para a verificação do pressuposto de normalidade, estou a utilizar o seguinte código:
dadosml %>% group_by(Grupo,Time) %>%
doo(~mshapiro_test(.))
Ou seja, eu não fiz a seleção das colunas que você fez, pois penso que no caso do formato long isso não faça sentido.
Entretanto, está a acontecer o seguinte erro:
Error in `mutate()`:
ℹ In argument: `data = map(.data$data, .f, ...)`.
Caused by error in `map()`:
ℹ In index: 1.
Caused by error in `rng[2] - rng[1]`:
! non-numeric argument to binary operator
Run `rlang::last_trace()` to see where the error occurred.
Sabe me dizer o que pode ser? Obrigado 😊🙏
Bom dia, Fernanda!
Tenho em meu banco de dados uma VI e 19 VDs. Ao rodar a distância de mahalanobis aparece o seguinte erro:
"dados %>% select(1:21) %>% group_by(Grupo) %>% doo(~mahalanobis_distance(.))
Erro: Problem with `mutate()` input `data`.
x sistema é computacionalmente singular: condição recíproca número = 3.91582e-19
i Input `data` is `map(.data$data, .f, ...)`."
O que poderia ser?
Parabéns pelo conteúdo!!!
Oi, Gillard, não tenho certeza. Dá uma olhada se em alguma dessas colunas os valores não são todos idênticos, parece que é isso que o erro está indicando.
Mas o melhor é jogar esse erro no Google, que em geral você encontra alguém que postou esse erro no StackOverflow, e as pessoas ajudaram a solucionar ;)
Bom dia Fernanda!
Primeiramente, parabéns pelos seus vídeos! São muito bem produzidos e muito didáticos.
Tenho duas dúvidas:
1. Antes de realizar esta análise, eu deveria padronizar os dados, com média 0 e desvio 1?
2. Tem alguma restrição quanto ao número de variáveis dependentes? Tenho duas variáveis independentes e cinco independentes, todas com 4 repetições. Percebi que o teste de normalidade multivariada deste código funciona apenas quando adiciono três variáveis dependentes.
Mais uma vez, parabéns pelo trabalho!
Qual é o vídeo que você ensina como reconfigurar os dados do excel?
E dando show no R também!!! Professora com P maiusculo!!!
Quando que vai sair uns vídeos de modelos lineares mistos Fernanda? Do jeito que vc explica estatística, até minha sobrinha de 6 anos de idade aprende! Parabéns!
Hahaha! Amei!
Mas ainda preciso estudas mais modelos lineares mistos para chegar no ponto em que eu consigo ensiná-los. Então, ainda vou gravar, mas vai demorar...
Obrigada! Qual seria o teste equivalente à MANOVA para distribuições não-normais? Uma alternativa não-paramétrica?
permanova
Oi Fernanda, mais um vez um ótimo vídeo.
Bons vídeos fazem a gente ter dúvidas hehe
O que você acha sobre a estratégia de fazer uma PCA e usar o primeiro autovalor como variável dependente em uma ANOVA?
Uma vez que o autovalor é uma associação multivariada das variáveis dependentes. Vê algum problema nessa abordagem? Obrigado
Oi, Guilherme, não tenho muito o hábito de usar PCA, então, não sei dizer se haveria problema... Mas, eu pensaria por exemplo em usar modelagem de equações estruturais nessa situação...
Dá uma olhada nas aulas do Bruno, do canal Psicometria Online, que ele aprofunda mais a discussão sobre esses testes.
Olá Fernanda! Parabéns pela qualidade de todos o vídeos, é uma verdadeira enciclopédia. Estou com uma dificuldade no acionamento da função "doo" , que está no Passo 3, no teste de Shapiro-Wilk. Ele me oferece a seguinte mensagem:
Error in doo(., ~mshapiro_test(.)) :
não foi possível encontrar a função "doo"
Tentei achar essa função em outros tutoriais e não consegui. Alguém sabe o que poderia ser?
Oi, André, preciso checar porque deve ter atualizado (mas não conseguirei fazer isso hoje).
Mas, já te digo que vale a pena trocar para o pacote mvn, que faz análises de normalidade multivariadas, e dá bem menos erro.
@@FernandaPeres Ok, obrigado. Me estranhou não ter achado a função "doo" nas buscas, mas como sou iniciante fico com a ideia de que houve uma busca errada no termo ou coisa parecida. Parabéns pela divulgação científica que você faz.
@@FernandaPeres Etapa resolvida!
Olá fernanda Tudo bem, Obrigado por seus videos... Não consigo redor o script recebo a seguinte notificação de erro:
Error in `mutate()`:
! Problem while computing `data = map(.data$data, .f, ...)`.
Caused by error in `solve.default()`:
! system is computationally singular: reciprocal condition number = 8.82594e-27
Run `rlang::last_error()` to see where the error occurred.
Oi, Willian. Aqui está funcionando.
Provavelmente é alguma alteração no código que você tenha feito, ou um problema específico com o seu banco.
Mas, joga o erro e o código que não rodou (que gerou o erro) no Google, que em fóruns de discussão você encontra a resposta.
Muito Bom Fernanda!! Esses testes são apenas para as dependentes correto ? Não precisa incluir o x no teste ?
Precisa. As independentes são inseridas na fórmula.
Olá, tudo bem?
Seus vídeos são excelentes, estou com o seguinte erro:
Erro: Problem with `mutate()` column `data`.
i `data = map(.data$data, .f, ...)`.
x sample size must be between 3 and 5000
Será que poderia ser pelos tratamentos não terem a mesma quantidade de observações?
Não tenho como saber exatamente o que aconteceu (recomendo dar uma olhada no StackOverflow).
Mas, é possível que você tenha grupos com menos de 3 sujeitos, aí ele vai dar erro mesmo.
Se você tem valor para uma determinada variável dependente, mas não para outra (nessa outra o valor é ausente), esse sujeito será eliminado da análise. Isso pode estar reduzindo o seu n a ser analisado.
Oi, Fernanda. Como eu faço para selecionar colunas que não estão em sequência?
Você pode usar uma estrutura como essa:
dados[c(2:3, 5, 9:13)]
As colunas 2 a 3, 5 e 9 a 13 seriam selecionadas.
Tem como fazer Manova de duas vias?
Sim, só adicionar mais variáveis independentes à caixa de covariável (se for numérica) ou fator (se for categórica).
@@FernandaPeres Na hora de acrescentar mais variáveis (4 numéricas e 2 categóricas) ao Teste de Henze-Zirkler para fazer a análise uni e multivariada, aparece o seguinte erro:
> mvn(data = dados[,1:10], subset = "ID", "Mod", "Temp", "Cap", "Cond", "Sup", mvnTest = "hz")
Error in if (cov) { : argumento não é interpretável como lógico.
Você sabe como resolver esse problema?
@@juliacordeiro1212 Provavelmente o erro está aparecendo porque você inseriu variáveis categóricas. Normalidade só faz sentido para variável numérica :)
@@FernandaPeres No exemplo do vídeo você colocou mvn(data = dados [,2:4], subset = "Alcool", mvnTest = "hz"). Alcool é uma variável independente (categórica), que estava na coluna 2. As variáveis dependentes estavam nas colunas 3 e 4. Ou seja, entendi que todas as variáveis (independentes e dependentes) que você queria analisar estavam inclusas dentro do colchetes.
Por isso, coloquei minhas variáveis independentes (categóricas e numéricas) listadas após o subset e inclui todas as minhas colunas de variáveis nos colchetes [,1:10]. Nas colunas 1 a 6, eu tenho variáveis independentes (4 numéricas e 2 categóricas) . Nas colunas 7 a 10, eu tenho variáveis numéricas dependentes. Eu queria olhar a normalidade multivariada entre as colunas 7 a 10 , em função dos grupos das colunas de 1 a 6.
Será que estou interpretando errado?
@@juliacordeiro1212 Oi, Júlia, faz sentido o que você pensou, mas não sei se a forma de escrever a função é exatamente essa, talvez tenha que colocar as variáveis independentes em um vetor c(). Dá uma pesquisada, vai ter essa informação ou na documentação do pacote ou em fóruns (jogando no Google o erro você deve encontrar discussões boas).
Se eu não conseguir fazer uma manova por não cumprir as premissas, o que eu poderia fazer?
Depende da premissa. O livro do Andy Field, Discovering Statistics using R, discute isso, se não me engano.
Tem a opção também de usar outra análise multivariada, como análise de discriminante.
@@FernandaPeres obrigada pela dica, mais uma vez. Eu não consigo nem rodar o mahalanobis porque acho que existe correlação entre algumas variáveis.
Eu consigo fazer manova com duas vias?
Oi, Nanda, consegue, sim! Só adaptar o script para incluir mais uma variável independente ;)