Oi! Quando o seu teste de post-hoc inclui muitas comparações, é possível que nem todas apareçam no console. Para visualizar todas, siga essas instruções: 1. Atribua um nome ao post-hoc, como por exemplo: posthoc
Oi fernanda, obrigada pelos vídeos e por essa dica! Tenho uma dúvida, como faz pra mostrar na tabela só os resultados que deram diferença estatística significativa?
@@rangelshida518 Eu tenho um vídeo sobre isso, sobre criar um gráfico com essas letras. Lá tem o código. Acho que é o penúltimo vídeo publicado no canal.
Excelente vídeo, como sempre. Além da parte prática, juntamente tem explicações teóricas dos testes, realmente fica muito mais fácil entender tudo. Parabéns.
Muito obrigado pela excelente aula, continue dando nos essas aulas....estao a ser muito uteis a Muita gente, que talvez nao tenha NEM ideia...Obrigado mesmo
Sua aula é ótima. Eu estava exatamente com o problema que você comenta no vídeo... Na conclusao do teste Kruskall-Wallis a indicação é por rejeitar Ho, porém o teste de Dunn nao pega diferença significativa entre nenhum par de tratamentos hahahah Obrigado!
Acabo de realizar todos os procedimentos com os meus dados e deu tudo certo. Voltei aqui só para agradecer pelas as explicações. Estatística não é meu forte mas entendi muita coisa vendo seu video. Obrigado mesmo.
Meu Deus mulher, você me salvou! Obrigada! Até me animou a me esforçar mais pra entender o sentido da estatística, didática incrível. Meus tempos de rodar script no R sem entender o sentido ficarão no passado! :D
Fernanda, agradeço profundamente pelos conhecimentos compartilhados por aqui, graças a você estou conseguindo analisar os dados do meu TCC de forma rápida e eficiente, muito obrigado! 😄✌️
Muitíssimo obrigada! Sua didática é maravilhosa, sua voz é doce mas firme e a linha de raciocínio que tu usas para ensinar é fantástica! rsrs até uma criatura que não tem talento pra estatística, como eu, consegue acompanhar todo o raciocínio! 🥰🥰🥰🥰
Que achado! Muito obrigada pela didática e metodologia! Me salvou na escrita da dissertação!!!!!!! parabéns pelo conhecimento e tranquilidade ao ensinar!
Oi Fernanda, algumas dúvidas: 1. Não teria que testar a normalidade e usar o teste somente se a distribuição não normal? 2. Se a distribuição não for normal em pelo menos um dos grupos e for normal para os outros, devo considerar não normal? 3. Se encontrar valores de outliers extremos por exemplo, devo prosseguir com Kruskal Wallis? E se os outliers extremos aparecessem na ANOVA? Obrigado, seus vídeos são muito didáticos e suas respostas excelentes, parabéns pelo trabalho!!!
1. Sim, é que o foco do vídeo é ensinar esse teste. Mas, via de regra, se a variável dependente é numérica e há normalidade, usamos a ANOVA, que terá mais poder nesse cenário. Kruskal-Wallis vai fazer sentido para dados não-normais ou variável dependente ordinal (ele é excelente para esse caso). 2. Se a distribuição não for normal para um grupo, consideramos que há violação do pressuposto de normalidade. O ideal é avaliar a normalidade dos resíduos (comento isso na aula de ANOVA). 3. Outliers extremos geralmente implicam em não-normalidade. Testes não-paramétricos lidam bem melhor com valores discrepantes que os paramétricos.
olá boa noite. no canal TV nupelia vc pode acompanhar um curso de confecção de gráficos no R. ELe está sendo produzido durante essa pandemia para todos.
muito bom a explicação, a gente nota que vc faz um roteiro e consegue ir direto ao ponto. usei muito seus videos no mestrado e muito mais agora no doutorado
Olá, bom dia! Obrigada, excelente aula. Estou com algumas dúvidas: 1) O teste de Kruskal Wallis deve ser aplicado apenas para dados que possuem uma mesma distribuição? 2) É necessário avaliar homogeneidade das variâncias para aplicação do teste de Kruskal Wallis? 3) Como selecionar o modelo de ajuste do p? Obrigada!
@Fernanda Peres, desculpe-me perguntar novamente. Será que há algo errado no teste de Kruskal-Wallis que realizei, pois em alguns casos foram retornados os seguintes valores: qui-quadrado (38.473) e p-valor (2.244e-08), qui-quadrado (27.405) e p-valor (4.842e-06) e qui-quadrado (41.894) e p-valor (4.225e-09). Mais uma vez, muito obrigado pela atenção e ajuda!
Oi! Não tem nada errado... O valor de p está em notação científica, é um valor beeem pequeno. Se quiser desativar a notação científica, roda o código: options(scipen=999) Antes de rodar o código do Kruskal-Wallis :)
Não conheço nenhum artigo... Em geral li sobre isso em livros (o "Descobrindo a estatística usando o SPSS", do Andy Field, por exemplo, é bem bom). Mas deve existir, só dar uma pesquisada. No Instagram eu tenho dois posts discutindo qual teste escolher, de acordo com a sua variável. instagram.com/estatisticaaplicada
Mais uma excelente aula! Muito obrigada! Fiquei com algumas dúvidas caso seja possível responder... No caso de a diferença realmente estar na distribuição dos dados nos diferentes grupos, o que devemos fazer? A diferença detectada pelo teste é legítima? Ou nesse caso, há algum outro teste mais adequado para fazer a comparação dos dados nos diferentes grupos? Desde já muito obrigada!!
Obrigada pelo conteúdo! Sobre a parte que vc disse ao final que muitos perguntam, quando o Kruskal detecta e o póst hoc não, vc teria alguma literatura para indicar que discute um pouco mais sobre ?
Oi Fernanda, suas aulas são muito boas e já assisti várias! Um detalhe: em 7:18, vc fala que a hipótese nula do Kruskall Wallis é que as medianas são iguais. Li em algum lugar que o Kruskall Wallis testa uma pseudo mediana e avalia diferenças de médias de ordens (postos). É verdade? Qual a diferença? Muito obrigada!
Hahahah! Obrigada! Para o Kruskal-Wallis, a recomendação que eu vejo é o post-hoc de Dunn. O Dunnett eu conheço para médias (ensino na aula de ANOVA). Até pesquisei, achei uma fonte que diz que o Dunnett pode ser aplicado após Kruskal-Wallis, mas não encontrei uma função no R para isso, e tô duvidando um pouco dessa fonte. O próprio autor do Real Statistics (um suplemento de análise estatística para Excel) tinha nomeado um dos post-hocs como Dunnett e se corrigiu dizendo que é um post-hoc diferente, de Steel (nos comentários desse post: real-statistics.com/one-way-analysis-of-variance-anova/kruskal-wallis-test/follow-up-tests-kruskal-wallis/). Encontrei pessoas sugerindo que a correção do valor de p do Dunn seja ajustada para incluir apenas as comparações com o controle (stats.stackexchange.com/questions/500723/dunn-test-and-specific-comparisons).
oi Fernanda tenho aprendido muito contigo, parabéns pelo trabalho ! uma perguntinha: posso substituir os contrastes ortogonais pelo teste de dunn ? se não, poderia fazer um video explicando ? obrigado
Oi Fernanda, boa noite! Obrigada pelo script e pelas explicações muito claras. Porém, estou com uma dúvida. Meus dados resultaram exatamente no oposto do que vc deu como exemplo, ou seja, no Kruskal Wallis, o p foi maior que 0,05 porém houve diferenças entre os grupos (que era o esperado) pelo Dunn-Bonferroni. O que isso significa e como devo relatar em meu trabalho? Posso tranquilamente mostrar em tabela essas diferenças encontradas entre grupos mesmo com esse valor de p no Kruskal? Muito grata!
Oi, Maria, o Dunn-Bonferroni é um post hoc, que deve ser feito apenas quando o Kruskal-Wallis é estatisticamente significativo. Então, o ideal é apenas reportar que não houve diferença.
Boa noite professora, excelente aula como sempre. Fiquei com uma dúvida na questão dos histogramas, pelo o que eu entendi para usar um teste não paramétrico é importante que os histogramas apresentem variações diferentes, pois então isso significa que eles tem diferentes medianas. Por outro lado se meus histogramas apresentarem variações parecidas seria então melhor usar um teste paramétrico. É isso mesmo? Agradeço desde já sua ajuda! Muitoo obrigado.
Oi, não é bem isso, Matheus! A discussão é sobre como o teste não-paramétrico não compara medianas, ele compara a distribuição como um todo. Só dá para dizermos que ele está comparando medianas se as curvas tiverem formatos idênticos. Mas, a escolha segue sendo: se atendeu aos pressupostos do paramétrico, fazemos o paramétrico; caso contrário, uma opção é fazer o não-paramétrico.
Porque a distribuição H se aproxima da qui-quadrado quando há mais que cinco por grupo. Dá para achar umas discussões legais sobre isso no StackOverflow.
Oi Fer, mais uma vez, obrigada pelo conteúdo disponibilizado! Está sendo essencial para o meu desenvolvimento em R. Fiquei com dúvidas relacionado à descrição dos resultados do post-hoc de Dunn. Ali no texto você colocou dados que não consegui identificar a origem ao acompanhar o resultado do teste. Poderia me explicar melhor??😵💫
Nicole, o que tá no texto é exatamente o que está no post-hoc de Dunn: controle é diferente dos demais grupos. As medianas e amplitude interquartil vieram da estatística descritiva, não aparece na saída do post-hoc de Dunn mesmo. Aparecem na análise descritiva que eu fiz antes.
Fernanda, tenho duas perguntinhas: 1) Ao executar o teste de Kruskal Wallis, o p valor já é corrigido para múltiplas comparações por default ou esse ajuste pelo método Bonferroni só deve ser feito no post hoc (e por isso vc explicitou no código)? 2) Vc tbm recomenda Bonferroni no post-hoc para o teste qui-quadrado?
Oi, Laís, a correção só é feita no post-hoc porque ela é uma correção para múltiplas comparações. No caso do teste de Kruskal-Wallis só tem um valor de p, não tem necessidade de correção. Mas no post-hoc, como os grupos são comparados dois a dois, há várias. Aí a necessidade da correção surge. O qui-quadrado não tem um post-hoc. O que a gente consegue fazer é uma análise dos resíduos padronizados, como eu explico no vídeo.
Oi Fernanda. Meu nome é Edson. Parabéns pelo trabalho. Sou estudante de doutorado, seus vídeos estão me ajudando muito. Não consigo baixar esse vídeo. Poderias, por favor, disponibilizar.
Fernanda, estou com um probleminha... Meu p-valor no Kruskal-Wallis foi de 0,03 mas após o Bonferroni, o console não mostra o p.adj e p.adj.signif. Teria alguma explicação para isso? O comentário do console foi "...with 2 more variables: p.adj , # p.adj.signif "
@@FernandaPeres Como a mensagem foi basicamente essa que coloquei acima, tirei um print do "erro" e te enviei no direct da sua página do IG. Caso você possa olhar depois, vai me ajudar muito a entender o que aconteceu por aqui. Mas desde já, te agradeço! Você me salvou nesse semestre!!
Em geral, Kendall é recomendada para amostras menores (n < 30) e quando há muitos empates (valores iguais). Caso contrário, recomenda-se o Spearman. Mas isso não é um consenso. Há referência dizendo que o Kendall é mais confiável que o Spearman mesmo em amostras maiores. Acho que não tem uma resposta errada, o importante é saber justificar sua escolha. Veja o artigo "User's guide to correlation coefficient".
Oi Fernanda, tudo bem? Preciso inserir as famosas "letrinhas" nos gráficos boxplot (sim, é verdade!!), considerando o teste de KW e os post-hocs. Vi que existe um pacote "easyanova" que faz isso. Tem as opções de teste e, ao escolher, já vem o resultado com o rank gerando as letras. O problema é que tenho muitas variáveis e pelo tutorial q vi, teria q fazer uma por vez. Então, a dúvida é como fazer com que o rank bonferroni do seu script já venha com as letras e não somente c a significância.. entendeu? kk Agradeço
Oi, Verônica. Tem como fazer isso automaticamente. Dá uma procurada pelo pacote cld. Tem tutoriais bons (em inglês) na internet. Mas, você terá mesmo que fazer um por variável. Os testes são feitos para cada variável dependente. Para fazer de forma mais automática, só se você gerar um loop...
Ei, Fernanda!! Gosto sempre de assistir os seus vídeos, inclusive ler os seus comentários. Você tem uma excelente didática e explica tudo muito bem. Tenho uma dúvida quanto aos histogramas. Como posso colocar o eixo y em frequência relativa, mas em % e não densidade? Usei o comando freq=FALSE, mas não apareceu em %.
Oi, Karen, obrigada!! ❤️ Se os dados já estão em porcentagem (ex.: 0,03), então é uma questão de formatar o número. Você consegue isso adicionando a seguinte camada ao ggplot: scale_y_continuous(labels = scales::percent_format(decimal.mark = ",", big.mark = ".") Vou explicar isso com detalhes nos próximos vídeos da série de ggplot2 que to postando por aqui :)
Ei, @@FernandaPeres obrigada pelo retorno!!Os dados não estão em porcentagem. Mas irei usar o comando sugerido e ficar de olho nos próximos vídeos da série de ggplot2. :)
Fernanda, parabéns pela iniciativa do canal! Gostaria de saber se o Kruskal-Wallis é o método recomendado para analisar os seguintes dados ou se existe outro melhor para esse fim: PRIORIDADE TREINAMENTOS Nenhuma Nunca Baixa Raramente Média Às vezes Alta Sempre Meu objetivo é analisar se há diferença entre a frequência de TREINAMENTOS entre membros de projetos de acordo com a PRIORIDADE. Por exemplo, membros de projetos com PRIORIDADE "Alta" recebem TREINAMENTOS com maior frequência dos que fazem parte de projetos com PRIORIDADE "Baixa"? Abraço!
Como nesse caso você tem duas variáveis ordinais, uma opção seria fazer uma correlação não paramétrica (Spearman ou Kendall) para ver a associação entre elas. Tem vídeo sobre elas (Correlação Bivariada no SPSS). Mas você pode usar o Kruskal-Wallis. Só que nesse caso sua variável de agrupamento não seria considerada uma variável ordinal, e sim nominal. Mas a variável dependente continuaria sendo tratada como ordinal. Abraços!
Profa Fernanda! Fiquei na dúvida se este teste poderia ser usado no banco de dados 4 para comparar os 275 indivíduos nos 3 tipos de convulsão, ou seja, se existe diferença no tratamento entre os 3 grupos (pré tratamento, semana 1 e semana 6), pois a disposição do banco de dados é diferente do demonstrado nesse exercício. Gostaria de comparar mais de 2 grupos com a disposição do BD idêntica ao BD4.
Não pode. O Kruskal-Wallis serve apenas para amostras independentes. No Banco de dados 4 temos amostras relacionadas (informações que vem do mesmo indivíduo). Recomendo uma live que eu participei com as R Ladies que eu faço essa discussão mais teórica, está na playlist de vídeos teóricos aqui do canal ;)
Ótimo vídeo! Duas dúvidas: 1) É necessário fazer algum tratamento de outliers? 2) Caso eu tenha três grupos muito distintos em termos de tamanho (n1 = 33, n2 = 818, n3 = 156) existe problema? A variância deles é bem próxima. Desde já, obrigado!
Não é necessário fazer nenhum tratamento para outlier. Veja que eu nem chequei se há outliers nos dados, porque como o Kruska-Wallis é um teste não-paramétrico, ele se baseia em postos (ranks) e não sofre influência desses valores discrepantes. Também não há problema em fazê-lo com grupos de tamanhos diferentes. O fato de ele ser baseado em postos o torno robusto a isso também.
Não sei se entendi. Mas indicar as diferenças entre grupos por letras não é errado, e pode ser feito para testes paramétricos e não-paramétricos. O último vídeo que eu publiquei no canal explica isso.
Olá Fernanda, obrigado pela aula. Existe alguma referência bibliográfica que você recomenda para descrever os testes e justificar suas escolhas? Agradeço!
Gosto bastante dos livros do Andy Field, tanto o para SPSS quanto o para o R: Descobrindo a estatística usando o SPSS e Discovering Statistics using R.
Oi, Silvana, você consegue essa informação pelo teste post hoc de Dunn, que eu ensino no vídeo. Com os valores de p de cada comparação 2 a 2 você sabe quais diferem :)
Oi! Ao invés de identificar cada grupo em cada linha, se lançasse os dados de cada grupo por colunas, o R também rodaria o teste? Ou tem de ser no formato que vc usou? Grato.
Oi, Jorge. Precisa ser no formato que eu usei... Alguns testes (vamos falar disso semana que vem, para a ANOVA com medidas repetidas) requerem que o banco esteja no formato que você mencionou. Mas até onde eu sei, o Kruskal-Wallis só funciona com o banco no formato que eu usei.
Olá, Fernanda! Parabéns pelo trabalho novamente, venho aprendendo muito com você. Me surgiu uma dúvida, quando eu faço um teste de Tukey, por exemplo, eu consigo diferenciar se os grupos diferiram entre si através do padrão 'a, b, c, ab' etc. Haveria como extrair uma informação no mesmo sentido com o Kruskal?
também estou com essa dúvida, Isabella.. Conseguiu resolver? @Fernanda Peres, teria alguma forma de obter essa informação por letras no teste de Kruskal-Wallis?
Creio q a resposta seja não. O kruskal é semelhante ao teste F, ele só diz se tem diferença entre os fatores. Para saber onde está a diferença vc tem q fzr o pos hoc com outro teste (de comparaçao entre os fatores). Ou seja, quem vai "indicar as letrinhas" é o teste pos hoc escolhido. No caso dessa aula da prof Fernanda (muito boa inclusive rs) o pos hoc usado ñ indica as letrinhas mas indica os pares diferentes, essa informação já é o suficiente para vc adicionar as letrinhas manualmente no papel rs Talvez tenha como dar um comando no R para o pos hoc indicar as letrinhas, mas eu desconheço rs por isso faço na mão msm kkk
Ei, Fernanda! Eu fiz o teste de kruskal e houve diferença significativa entre os grupos dos meus dados. Quando executei o teste de dunn, não apareceu qual a fonte da variação. Nesse caso, eu posso fazer o teste de dunn sem ajustar o valor de p? Parabéns pelos vídeos, tem me ajudado muito!!! Muito obrigada! Abraços
Oi, Alana. De fato, isso às vezes acontece. Porque o post-hoc é mais conservador que o teste do Kruskal-Wallis. Uma opção é estudar se esse é o melhor post hoc para o seu caso (tem várias outras opções, inclusive que vem do mesmo pacote que eu usei para o teste de Dunn, então dá pra dar uma olhada na documentação do pacote). Mas não dá pra usar o valor de p não ajustado, porque isso infla muito a taxa de erro do tipo I (eu tenho essa discussão sobre o problema de fazer múltiplas comparações no Instagram, se te interessar: instagram.com/estatisticaaplicada) O que eu sugiro, se você quiser usar I post hoc de Dunn, é reportar que o Kruskal-Wallis foi significante, o post hoc não detectou diferenças, e as medianas são x, y e z. Abraços!
Estou adorando seus vídeos. Pode me responder uma dúvida? Estou fazendo meu TCC com escala Likert. E preciso comparar as respostas de homens e mulheres. Nesse caso, por exemplo, eu tenho várias perguntas, onde cada indivíduo tem uma pontuação que pode variar de 1 a 5. Eu quero ver se há diferença na resposta de homens e mulheres nestas perguntas... Eu devo usar Mann-Witney, certo? Fiquei em dúvida se deveria usar Mann-Witney ou Kruskal-Wallis. Eu ia usar o Kruskal, mas agora não sei. Porque eu só tenho 2 variáveis independentes, que estão dentro de "Gênero", que são "homem" e "mulher". Eu tentei usar o Kruskal para ver se existe uma diferença geral, mas dá um erro, imagino que eu não possa usar várias perguntas ao mesmo tempo, tendo que usar uma por uma, estou certo?
Oi, Luddy. Sim, se só há duas categorias na sua variável independente (homens x mulheres), o correto e fazer um Mann-Whitney. Mas, eles só vão analisar uma questão por vez. Análise de questionário é sempre algo complexo. Dá para usar análise fatorial confirmatória, por exemplo, para analisar esses dados. Essa técnica analisaria todos de uma vez. Mas, é uma análise bem mais complexa (se não me engano, no canal Psicometristas Brasil tem esse tutorial).
Fernanda, tenho vistos teses e dissertações que apresentam os resultados de Kruskal-Wallis em médias e desvio-padrão ao invés de mediana e intervalo interquartil. Isso faz sentido ou deve ser mesmo em mediana?
Então, esse é um erro comum. Eu mesma, quando gravei o vídeo de SPSS, acho que não reparei e olhei para as médias. Mas não é o mais adequado. Porque usamos esses testes quando a distribuição não é normal, ou contem outliers. Nesses casos, a média não é uma boa representação do conjunto de dados. A mediana representa mais adequadamente. E, se a média não é uma boa representação, o desvio padrão (que é calculado com base nela) também não será. O melhor é mesmo usar mediana e amplitude interquartil. Já vi gente sendo criticada em defesas por mostrar a média e ter usado um teste não paramétrico.
Parabéns pela aula! Eu estou trabalhando com um n=3. Utilizei os teste não paramétricos por causa de o n ser muito pequeno. Mas estou na dúvida de como realizar a analise descritiva, se uso média ou mediana, pois o teste de normalidade e de variância aceitaram a hipótese nula. Gostaria da sua opinião.
Olá! Como eu posso fazer o teste de Kruskal-Wallis e Dunn no R para um experimento fatorial? Eu consegui gerar resultado com kruskal.test(Variável resposta ~ Fator 1 + Fator 2 , data = Dados), porém não conseguir fazer de jeito nenhum para o teste de Dunn. Tentei mudar minha tabela de dados para, ao invés de duas colunas abordando cada fator, uma coluna (ex: |Fator1eFator2| Variável resposta|) e deu um resultado diferente para Krustal-Wallis que não sei se está correto.
Olá Fernanda!! Muito bom seu vídeo, bem claro. Só me surgiu uma dúvida: porque o p.adj é o ideal para ver a significância e não o p? ns que dizer não significativo, né?! Desde já obrigada pela aula e paraéns!!
Obrigada, Evelyn! É que o p não ajustado não está corrigido para as múltiplas comparações. As múltiplas comparações aumentam a chance de erro do tipo I (deixa de ser o valor de alfa, 5%). Para resolver esse problema e manter o erro do tipo I em 5% é feito esse ajuste. O ns significa não significante mesmo. Abraços!
Boa tarde Fernanda. Parabéns pelo excelente trabalho. Estou com uma dúvida. Você sabe como colocar carácteres subscrito e sobrescrito nos eixos dos gráficos?
Obrigada, Gabriel! Não sei... Tem que dar uma olhada na documentação dos labs (os labels de eixos) do ggplot2. Também vale a pena jogar a dúvida em inglês no Google, que alguém no StackOverflow já deve ter tido essa dúvida e já deve ter sido resolvida por lá...
@@FernandaPeres sempre prestativa. Fernanda, agora estou com outro problemas. Após gerar os histogramas tentei adicionar a curva de distribuição, mas não consegui. Teria como adicionar curva aos histogramas? Sabe como posso adicionar?
@@DanielGomes-cb3uk Nunca fiz isso. Mas tem uns tutoriais bons: www.statmethods.net/graphs/density.html stackoverflow.com/questions/20078107/overlay-normal-curve-to-histogram-in-r E tem também uma função do pacote rcompanion que parece fazer isso de forma mais simples: rdrr.io/cran/rcompanion/man/plotNormalHistogram.html
Espero que vc me responda, estou fazendo tudo certinho mas aparece que meu objeto não pode ser encontrado ao iniciar o teste de Kruskal > kruskal.test(Origem ~ Nota, date = dados1) Error in eval(predvars, data, env) : objeto 'Origem' não encontrado
Olhando rapidamente, você cometeu um pequeno erro no "date" que deveria ser "data"... Caso essa alteração não resolva, verifique o seu banco de dados, para certificar-se que as variáveis estão escritas da mesma forma que foram explicitadas no argumento da função.
Olá!! Parabéns pela qualidade dos seus vídeos! Finalmente tenho conseguido entender como utilizar o R para análises. Mas estou com uma dúvida... tenho sete grupos para comparar, como se faz para mostrar o restante das linhas quando termino de executar o teste de Dunn? Desde já, obrigada pelas aulas!!!
Professora! Se eu quero analisar a relação entre duas variáveis, sendo uma quantitativa e outra ordinal, posso dividir a ordinal em categorias (ou seja, tornando a ordem irrelevante) e analisar com o teste kruskal wallis? Existe um teste específico para avaliar associação entre variavel ordinal e quantitativa? Ou, ainda, neste contexto a variável ordinal poderia ser considerada quantitativa, de mandeira que aplicaria teste t (caso normal) ou u (caso outra distribuição)?
Nesse caso, faz mais sentido fazer uma correlação que permita variável ordinal (ex.: Spearman). Eu explico como escolher o teste nesse vídeo: th-cam.com/users/liveEtV3_3aN884?feature=share.
Nessa parte: # Passo 5: Análise descritiva dos dados dados %>% group_by(Grupo) %>% get_summary_stats(BC, Pressao, type = "median_iqr") como eu deveria substituir meus dados, levando em consideração que só tenho tempo ~temperatura ? Só tenho um fator. Meus dados são sobre tempo de desenvolvimento de um inseto em diferentes temperaturas. Se puder me ajudar, agradeço.
Oi, eu também só tenho um fator, o grupo. Então, temperatura entra o lugar do grupo. A diferença é que eu tenho duas variáveis dependentes, BC e pressão, e coloquei as duas separadas por vírgula. Você vai colocar (tempo, type="median_iqr". Mas, certifique-se de que o seu delineamento não é de medidas repetidas. Se for, esse não é o teste adequado.
Oi Fernanda. Excelente vídeo. Mas estou com um problema: a função dunn_test não existe na versão de R q eu tenho (4.0.3) e sim dunn.test. Acredito que seja a mesma coisa mas não estou sabendo usar. por favor, teria como vc me ajudar? Agradeço
Oi, ela existe, sim. É que você precisa instalar e carregar o pacote rstatix. Essa função vem desse pacote (se tiver dúvidas na instalação de pacotes, tenho vídeos no começo da playlist ensinando). A função dunn.test provavelmente faz a mesma coisa, mas não é pipe friendly, aí você não vai conseguir usar da mesma forma que eu usei. Melhor instalar o rstatix. Mesmo porque ele tem várias outras funções muito úteis.
Oi! Quando o seu teste de post-hoc inclui muitas comparações, é possível que nem todas apareçam no console.
Para visualizar todas, siga essas instruções:
1. Atribua um nome ao post-hoc, como por exemplo:
posthoc
Maravilha. Procurei em vários fóruns uma alternativa para essa questão. Obg, Fernanda!
Oi fernanda, obrigada pelos vídeos e por essa dica! Tenho uma dúvida, como faz pra mostrar na tabela só os resultados que deram diferença estatística significativa?
@@marinamendes8013 você tem como fazer um filter em cima desse dataframe gerado, selecionando apenas para p < 0,05.
Bom dia, pessoal
Vocês sabem algum pacote no R que coloca a letrinha? Onde houve diferença significava?
Obrigado!
@@rangelshida518 Eu tenho um vídeo sobre isso, sobre criar um gráfico com essas letras. Lá tem o código. Acho que é o penúltimo vídeo publicado no canal.
Excelente vídeo, como sempre. Além da parte prática, juntamente tem explicações teóricas dos testes, realmente fica muito mais fácil entender tudo.
Parabéns.
Muito obrigado pela excelente aula, continue dando nos essas aulas....estao a ser muito uteis a Muita gente, que talvez nao tenha NEM ideia...Obrigado mesmo
Seus vídeos estão me ajudando demais!!!
Sua aula é ótima. Eu estava exatamente com o problema que você comenta no vídeo... Na conclusao do teste Kruskall-Wallis a indicação é por rejeitar Ho, porém o teste de Dunn nao pega diferença significativa entre nenhum par de tratamentos hahahah Obrigado!
Obrigado pela explicação! Muito esclarecedor!
Acabo de realizar todos os procedimentos com os meus dados e deu tudo certo. Voltei aqui só para agradecer pelas as explicações. Estatística não é meu forte mas entendi muita coisa vendo seu video. Obrigado mesmo.
Excelente professora!!!!
Muito obrigada por esse vídeo, você salvou a minha vida!!
Meu Deus mulher, você me salvou! Obrigada!
Até me animou a me esforçar mais pra entender o sentido da estatística, didática incrível. Meus tempos de rodar script no R sem entender o sentido ficarão no passado! :D
Fernanda, agradeço profundamente pelos conhecimentos compartilhados por aqui, graças a você estou conseguindo analisar os dados do meu TCC de forma rápida e eficiente, muito obrigado! 😄✌️
Muitíssimo obrigada! Sua didática é maravilhosa, sua voz é doce mas firme e a linha de raciocínio que tu usas para ensinar é fantástica! rsrs até uma criatura que não tem talento pra estatística, como eu, consegue acompanhar todo o raciocínio! 🥰🥰🥰🥰
Excelente apresentação no video. Você é muito didática, paciente e objetiva. Aprendo muito com você. Obrigada.👏👏👏👏
Obrigada!!! 😍😍😍
Que achado!
Muito obrigada pela didática e metodologia!
Me salvou na escrita da dissertação!!!!!!!
parabéns pelo conhecimento e tranquilidade ao ensinar!
Ótimo vídeo Fernanda. Parabéns. Abraço.
A forma com que você apresenta os dados e os scripts e junto com a explicação são muito bons. Muito obrigado pela didática e metodologia!
Você é Incrível Mulher! Muito obrigada por produzir esses conteúdos \o/\o/\o/
Excelente! Estou sempre tirando minhas dúvidas por aqui rsrs. Obrigado.
Conheci seu canal hoje! Parabéns! Estou amando! Você explica muito bem! Obrigada!
Muito obrigada!! ♥️
Estava precisando aprender análises não parâmetricas, seu canal caiu do céu para mim, parabéns pelo conteúdo.
Que ótimo!! Obrigada!
Suas aulas são um presente!! Tenho aprendido MUUUITO com elas!! Muito grato por tanto!!
Que talento para ensinar. Parabéns e muito obrigado pela aula!
Muito obrigado Fernanda... pela primeira vez eu entendi o R
Fernanda, muito obrigado pelo trabalho! Muito valioso, abração!
Você é perfeita, entenda!
Hahahahaha ❤️
Fernanda, você é ótima! Excelente vídeo, super bem explicado. Se puder, continue, seus vídeos estão me ajudando muito. Obrigada :D
Obrigada!! Vou continuar sim ♥️
Oi Fernanda, algumas dúvidas:
1. Não teria que testar a normalidade e usar o teste somente se a distribuição não normal?
2. Se a distribuição não for normal em pelo menos um dos grupos e for normal para os outros, devo considerar não normal?
3. Se encontrar valores de outliers extremos por exemplo, devo prosseguir com Kruskal Wallis? E se os outliers extremos aparecessem na ANOVA?
Obrigado, seus vídeos são muito didáticos e suas respostas excelentes, parabéns pelo trabalho!!!
Faltou mais uma:
4. Também não precisa verificar a homogeneidade das variâncias?
Compartilho da mesma dúvida 2.
1. Sim, é que o foco do vídeo é ensinar esse teste. Mas, via de regra, se a variável dependente é numérica e há normalidade, usamos a ANOVA, que terá mais poder nesse cenário. Kruskal-Wallis vai fazer sentido para dados não-normais ou variável dependente ordinal (ele é excelente para esse caso).
2. Se a distribuição não for normal para um grupo, consideramos que há violação do pressuposto de normalidade. O ideal é avaliar a normalidade dos resíduos (comento isso na aula de ANOVA).
3. Outliers extremos geralmente implicam em não-normalidade. Testes não-paramétricos lidam bem melhor com valores discrepantes que os paramétricos.
Parabéns pelos vídeos sobre R! Que venham muitos mais sobre esse assunto! Curioso para ver sobre como fazer correlação de Pearson e Spearman no R
Me ajudou muito com minha iniciação científica. Muito obrigado!
Entendi melhor após o vídeo, grato
Perfeito! Explicação maravilhosa, didática excelente, vídeo ótimo. Ajuda muito!
Você é ótima! Melhores explicações, super conteúdo!!! Parabéns e muuuito obrigada 💖 #Gratidão
Obrigadaaa ♥️
Perfeito!! Aulas sobre gráficos (ggplot) seriam ótimas!!!
olá boa noite. no canal TV nupelia vc pode acompanhar um curso de confecção de gráficos no R. ELe está sendo produzido durante essa pandemia para todos.
@@hugolimakirsten muito obrigado!!!
Atualmente tem uma playlist beeeem completa sobre ggplot2: th-cam.com/play/PLOw62cBQ5j9X5eOavzeu9CaHMO6TFsPkY.html
Grata pelos ensinamentos!!!
Parabéns pelo vídeo, muito obrigada!
muito bom a explicação, a gente nota que vc faz um roteiro e consegue ir direto ao ponto. usei muito seus videos no mestrado e muito mais agora no doutorado
Obrigada! :)
Vc simplesmente salvou meu dia hoje, obrigada
É osso, há que se dedicar muito pra não se confundir... Mas sua aula é muito boa, Parabéns!
Bom dia professora!
Vc teria como me recomendar uma literatura que aprofunda sobre o assunto por gentileza?
Aula maravilhosa! Muitissimo obrigada! Me ajudou muito
Excelente aula! Obrigada!
Obrigada! ♥️
Parabéns! Excelente o vídeo.
Muito Obrigado
Olá, bom dia! Obrigada, excelente aula.
Estou com algumas dúvidas:
1) O teste de Kruskal Wallis deve ser aplicado apenas para dados que possuem uma mesma distribuição?
2) É necessário avaliar homogeneidade das variâncias para aplicação do teste de Kruskal Wallis?
3) Como selecionar o modelo de ajuste do p?
Obrigada!
Obrigado por tanto!
QUE AULA
@Fernanda Peres, desculpe-me perguntar novamente. Será que há algo errado no teste de Kruskal-Wallis que realizei, pois em alguns casos foram retornados os seguintes valores: qui-quadrado (38.473) e p-valor (2.244e-08), qui-quadrado (27.405) e p-valor (4.842e-06) e qui-quadrado (41.894) e p-valor (4.225e-09). Mais uma vez, muito obrigado pela atenção e ajuda!
Oi! Não tem nada errado... O valor de p está em notação científica, é um valor beeem pequeno. Se quiser desativar a notação científica, roda o código:
options(scipen=999)
Antes de rodar o código do Kruskal-Wallis :)
@@FernandaPeres Nem sei mais como agradecer :)
Prezada, parabéns pelo trabalho. Poderia gravar uma série sobre Modelagem de Equações Estruturais no R.
@Fernanda Peres Você recomenda algum artigo onde são explicados os critérios de escolha dos testes estatísticos? Obrigado mais uma vez!
Não conheço nenhum artigo... Em geral li sobre isso em livros (o "Descobrindo a estatística usando o SPSS", do Andy Field, por exemplo, é bem bom). Mas deve existir, só dar uma pesquisada.
No Instagram eu tenho dois posts discutindo qual teste escolher, de acordo com a sua variável.
instagram.com/estatisticaaplicada
@@FernandaPeres Ótimo livro por sinal, me ajudou bastante.
Obrigada pelo vÍdeo.
show! parabéns
Mais uma excelente aula! Muito obrigada! Fiquei com algumas dúvidas caso seja possível responder... No caso de a diferença realmente estar na distribuição dos dados nos diferentes grupos, o que devemos fazer? A diferença detectada pelo teste é legítima? Ou nesse caso, há algum outro teste mais adequado para fazer a comparação dos dados nos diferentes grupos? Desde já muito obrigada!!
Fernanda, tudo bem? Você sabe qual seria o teste não paramétrico correspondente à MANOVA de duas vias?
Obrigada pelo conteúdo!
Sobre a parte que vc disse ao final que muitos perguntam, quando o Kruskal detecta e o póst hoc não, vc teria alguma literatura para indicar que discute um pouco mais sobre ?
MUITO OBRIGADO POR ESSE VÍDEO> ME AJUDOU MUITO!
Ótimo video, mas tenho somente dois fatores (extratos x crescimento) e gostaria que houvesse uma comparação entre todos os extratos. Tenho como anormal, porque houve crescimento zero, por isso decidi pelo teste de Kruskal. Só que não consigo visualizar todos os resultados:
A comparação é feita entre todos? Tenho alguns resultados identicos entre si. Há problema?
glimpse(dados)
Rows: 30
Columns: 2
$ tratamentos Glifosato_Conc_1, Glifosato_Conc_1, ...
$ germinacao_cm 0.7500, 0.7000, 0.8000, 0.8000, 0.70...
> kruskal.test(germinacao_cm ~ tratamentos, data = dados)#qui quadrado; df=grau de liberdade; valor de p; p dunn_test(germinacao_cm ~ tratamentos, data = dados, p.adjust.method = "bonferroni")
# A tibble: 45 x 9
.y. group1 group2 n1 n2 statistic p p.adj
*
1 germ~ Extra~ Extra~ 3 3 3.39 6.98e-4 0.0314
2 germ~ Extra~ Extra~ 3 3 0 1.00e+0 1
3 germ~ Extra~ Extra~ 3 3 2.87 4.08e-3 0.183
4 germ~ Extra~ Extra~ 3 3 0 1.00e+0 1
5 germ~ Extra~ Extra~ 3 3 1.77 7.74e-2 1
6 germ~ Extra~ Glifo~ 3 3 1.22 2.21e-1 1
7 germ~ Extra~ Glifo~ 3 3 1.11 2.68e-1 1
8 germ~ Extra~ Teste~ 3 3 2.31 2.10e-2 0.947
9 germ~ Extra~ Teste~ 3 3 2.17 3.03e-2 1
10 germ~ Extra~ Extra~ 3 3 -3.39 6.98e-4 0.0314
# ... with 35 more rows, and 1 more variable:
# p.adj.signif
> dados %>% group_by(tratamentos)%>%get_summary_stats(germinacao_cm, type = "median_iqr")
# A tibble: 10 x 5
tratamentos variable n median iqr
1 Extrato_A_Conc_1 germinacao_cm 3 0 0
2 Extrato_A_Conc_2 germinacao_cm 3 1.85 0.075
3 Extrato_B_Conc_1 germinacao_cm 3 0 0
4 Extrato_B_Conc_2 germinacao_cm 3 1.6 0.075
5 Extrato_C_Conc_1 germinacao_cm 3 0 0
6 Extrato_C_Conc_2 germinacao_cm 3 1.35 0.35
7 Glifosato_Conc_1 germinacao_cm 3 0.75 0.05
8 Glifosato_Conc_2 germinacao_cm 3 0.7 0.05
9 Testemunha_Conc_1 germinacao_cm 3 1.4 0.25
10 Testemunha_Conc_2 germinacao_cm 3 1.35 0.15
Oi Fernanda, suas aulas são muito boas e já assisti várias! Um detalhe: em 7:18, vc fala que a hipótese nula do Kruskall Wallis é que as medianas são iguais. Li em algum lugar que o Kruskall Wallis testa uma pseudo mediana e avalia diferenças de médias de ordens (postos). É verdade? Qual a diferença? Muito obrigada!
FErnanda, entenda, você é maravilhosa! Me ajudou muito. Mas fiquei com uma duvida, posso fazer o post-hoc com Dunnettpor exemplo?
Hahahah! Obrigada!
Para o Kruskal-Wallis, a recomendação que eu vejo é o post-hoc de Dunn. O Dunnett eu conheço para médias (ensino na aula de ANOVA). Até pesquisei, achei uma fonte que diz que o Dunnett pode ser aplicado após Kruskal-Wallis, mas não encontrei uma função no R para isso, e tô duvidando um pouco dessa fonte. O próprio autor do Real Statistics (um suplemento de análise estatística para Excel) tinha nomeado um dos post-hocs como Dunnett e se corrigiu dizendo que é um post-hoc diferente, de Steel (nos comentários desse post: real-statistics.com/one-way-analysis-of-variance-anova/kruskal-wallis-test/follow-up-tests-kruskal-wallis/).
Encontrei pessoas sugerindo que a correção do valor de p do Dunn seja ajustada para incluir apenas as comparações com o controle (stats.stackexchange.com/questions/500723/dunn-test-and-specific-comparisons).
oi Fernanda tenho aprendido muito contigo, parabéns pelo trabalho ! uma perguntinha: posso substituir os contrastes ortogonais pelo teste de dunn ? se não, poderia fazer um video explicando ? obrigado
Boa noite! Excelente vídeo. Tem como fazer teste Kruskal-Wallis para experimento fatorial?
Acho q ñ!
Mas vc poderia usar o procedimento ART, do pacote ARTool do R, ele faz ANOVA de fatoriais.
Oi Fernanda, boa noite! Obrigada pelo script e pelas explicações muito claras. Porém, estou com uma dúvida. Meus dados resultaram exatamente no oposto do que vc deu como exemplo, ou seja, no Kruskal Wallis, o p foi maior que 0,05 porém houve diferenças entre os grupos (que era o esperado) pelo Dunn-Bonferroni. O que isso significa e como devo relatar em meu trabalho? Posso tranquilamente mostrar em tabela essas diferenças encontradas entre grupos mesmo com esse valor de p no Kruskal? Muito grata!
Oi, Maria, o Dunn-Bonferroni é um post hoc, que deve ser feito apenas quando o Kruskal-Wallis é estatisticamente significativo. Então, o ideal é apenas reportar que não houve diferença.
Boa noite professora, excelente aula como sempre. Fiquei com uma dúvida na questão dos histogramas, pelo o que eu entendi para usar um teste não paramétrico é importante que os histogramas apresentem variações diferentes, pois então isso significa que eles tem diferentes medianas. Por outro lado se meus histogramas apresentarem variações parecidas seria então melhor usar um teste paramétrico. É isso mesmo? Agradeço desde já sua ajuda! Muitoo obrigado.
Oi, não é bem isso, Matheus! A discussão é sobre como o teste não-paramétrico não compara medianas, ele compara a distribuição como um todo. Só dá para dizermos que ele está comparando medianas se as curvas tiverem formatos idênticos.
Mas, a escolha segue sendo: se atendeu aos pressupostos do paramétrico, fazemos o paramétrico; caso contrário, uma opção é fazer o não-paramétrico.
Obrigado, professora!
Muito bom!!
Oii, Fernanda! Me tira uma dúvida, por favor. Por que a estatística teste do Kruskal no R é o qui quadrado?
Porque a distribuição H se aproxima da qui-quadrado quando há mais que cinco por grupo. Dá para achar umas discussões legais sobre isso no StackOverflow.
@@FernandaPeres Obrigado!
Oi Fer, mais uma vez, obrigada pelo conteúdo disponibilizado! Está sendo essencial para o meu desenvolvimento em R. Fiquei com dúvidas relacionado à descrição dos resultados do post-hoc de Dunn. Ali no texto você colocou dados que não consegui identificar a origem ao acompanhar o resultado do teste. Poderia me explicar melhor??😵💫
Nicole, o que tá no texto é exatamente o que está no post-hoc de Dunn: controle é diferente dos demais grupos. As medianas e amplitude interquartil vieram da estatística descritiva, não aparece na saída do post-hoc de Dunn mesmo. Aparecem na análise descritiva que eu fiz antes.
Bom dia, pessoal
Vocês sabem algum pacote no R que coloca a letrinha? Onde houve diferença significava?
Obrigado!
Fernanda, o que seria "All groups should have identical shape distributions", todos os grupos terem formas identicas, como assim?
Fernanda, os seus vídeos são muito bons. Mas para complementar os resultados estatísticos, você poderia completar com o tamanho de efeito! :D
Bom dia!
Quando geramos muitos resultados dos testes como esses, tem alguma forma de exportar por tabela direto?
Porque eles saem separados...
Fernanda, tenho duas perguntinhas: 1) Ao executar o teste de Kruskal Wallis, o p valor já é corrigido para múltiplas comparações por default ou esse ajuste pelo método Bonferroni só deve ser feito no post hoc (e por isso vc explicitou no código)? 2) Vc tbm recomenda Bonferroni no post-hoc para o teste qui-quadrado?
Oi, Laís, a correção só é feita no post-hoc porque ela é uma correção para múltiplas comparações. No caso do teste de Kruskal-Wallis só tem um valor de p, não tem necessidade de correção. Mas no post-hoc, como os grupos são comparados dois a dois, há várias. Aí a necessidade da correção surge.
O qui-quadrado não tem um post-hoc. O que a gente consegue fazer é uma análise dos resíduos padronizados, como eu explico no vídeo.
@@FernandaPeres aaaaaaah! Troquei as bolas todas hahaha Obg, Fernanda! Salvando sempre hehe
Oi Fernanda.
Meu nome é Edson.
Parabéns pelo trabalho.
Sou estudante de doutorado, seus vídeos estão me ajudando muito.
Não consigo baixar esse vídeo. Poderias, por favor, disponibilizar.
Fernanda, estou com um probleminha... Meu p-valor no Kruskal-Wallis foi de 0,03 mas após o Bonferroni, o console não mostra o p.adj e p.adj.signif. Teria alguma explicação para isso?
O comentário do console foi "...with 2 more variables: p.adj , # p.adj.signif "
Quantos grupos você tem?
@@FernandaPeres 4 grupos
@@duka15052011 Você pode colar o erro todo, para eu ver se consigo identificar o que é?
@@FernandaPeres Como a mensagem foi basicamente essa que coloquei acima, tirei um print do "erro" e te enviei no direct da sua página do IG. Caso você possa olhar depois, vai me ajudar muito a entender o que aconteceu por aqui. Mas desde já, te agradeço! Você me salvou nesse semestre!!
No caso do ensaio ser em blocos. Precisa considerar os blocos no teste?
@Fernanda Peres, no exemplo que citei, você recomendaria testar a correlação não paramétrica por "Spearman" ou "Kendall"?
Em geral, Kendall é recomendada para amostras menores (n < 30) e quando há muitos empates (valores iguais). Caso contrário, recomenda-se o Spearman. Mas isso não é um consenso. Há referência dizendo que o Kendall é mais confiável que o Spearman mesmo em amostras maiores. Acho que não tem uma resposta errada, o importante é saber justificar sua escolha. Veja o artigo "User's guide to correlation coefficient".
@@FernandaPeres Muitíssimo obrigado!!!
Oi Fernanda, tudo bem? Preciso inserir as famosas "letrinhas" nos gráficos boxplot (sim, é verdade!!), considerando o teste de KW e os post-hocs. Vi que existe um pacote "easyanova" que faz isso. Tem as opções de teste e, ao escolher, já vem o resultado com o rank gerando as letras. O problema é que tenho muitas variáveis e pelo tutorial q vi, teria q fazer uma por vez. Então, a dúvida é como fazer com que o rank bonferroni do seu script já venha com as letras e não somente c a significância.. entendeu? kk Agradeço
Oi, Verônica. Tem como fazer isso automaticamente. Dá uma procurada pelo pacote cld. Tem tutoriais bons (em inglês) na internet.
Mas, você terá mesmo que fazer um por variável. Os testes são feitos para cada variável dependente. Para fazer de forma mais automática, só se você gerar um loop...
Ei, Fernanda!! Gosto sempre de assistir os seus vídeos, inclusive ler os seus comentários. Você tem uma excelente didática e explica tudo muito bem. Tenho uma dúvida quanto aos histogramas. Como posso colocar o eixo y em frequência relativa, mas em % e não densidade? Usei o comando freq=FALSE, mas não apareceu em %.
Oi, Karen, obrigada!! ❤️
Se os dados já estão em porcentagem (ex.: 0,03), então é uma questão de formatar o número.
Você consegue isso adicionando a seguinte camada ao ggplot:
scale_y_continuous(labels = scales::percent_format(decimal.mark = ",", big.mark = ".")
Vou explicar isso com detalhes nos próximos vídeos da série de ggplot2 que to postando por aqui :)
Ei, @@FernandaPeres obrigada pelo retorno!!Os dados não estão em porcentagem. Mas irei usar o comando sugerido e ficar de olho nos próximos vídeos da série de ggplot2. :)
@@karenotoni7819 Tenta esse código!
ggplot(data = dados) +
geom_histogram(aes(x = Orcamento, y = ..count../sum(..count..)),
bins = 30) +
scale_y_continuous(labels = scales::percent_format(decimal.mark = ",",
big.mark = ".",
accuracy = 1))
@@FernandaPeres deu super certo. Ficou maravilhoso!!! Obrigada!!! :)
Fernanda, parabéns pela iniciativa do canal!
Gostaria de saber se o Kruskal-Wallis é o método recomendado para analisar os seguintes dados ou se existe outro melhor para esse fim:
PRIORIDADE TREINAMENTOS
Nenhuma Nunca
Baixa Raramente
Média Às vezes
Alta Sempre
Meu objetivo é analisar se há diferença entre a frequência de TREINAMENTOS entre membros de projetos de acordo com a PRIORIDADE.
Por exemplo, membros de projetos com PRIORIDADE "Alta" recebem TREINAMENTOS com maior frequência dos que fazem parte de projetos com PRIORIDADE "Baixa"?
Abraço!
Como nesse caso você tem duas variáveis ordinais, uma opção seria fazer uma correlação não paramétrica (Spearman ou Kendall) para ver a associação entre elas. Tem vídeo sobre elas (Correlação Bivariada no SPSS). Mas você pode usar o Kruskal-Wallis. Só que nesse caso sua variável de agrupamento não seria considerada uma variável ordinal, e sim nominal. Mas a variável dependente continuaria sendo tratada como ordinal. Abraços!
@@FernandaPeres Muitíssimo obrigado pelos esclarecimentos. Tem como testar a correlação não paramétrica (Spearman ou Kendall) no R? Abraço!
Profa Fernanda! Fiquei na dúvida se este teste poderia ser usado no banco de dados 4 para comparar os 275 indivíduos nos 3 tipos de convulsão, ou seja, se existe diferença no tratamento entre os 3 grupos (pré tratamento, semana 1 e semana 6), pois a disposição do banco de dados é diferente do demonstrado nesse exercício. Gostaria de comparar mais de 2 grupos com a disposição do BD idêntica ao BD4.
Não pode. O Kruskal-Wallis serve apenas para amostras independentes. No Banco de dados 4 temos amostras relacionadas (informações que vem do mesmo indivíduo).
Recomendo uma live que eu participei com as R Ladies que eu faço essa discussão mais teórica, está na playlist de vídeos teóricos aqui do canal ;)
Lembrei na verdade são grupos pareados! O mesmo indivíduo avaliado 3x
Ótimo vídeo! Duas dúvidas:
1) É necessário fazer algum tratamento de outliers?
2) Caso eu tenha três grupos muito distintos em termos de tamanho (n1 = 33, n2 = 818, n3 = 156) existe problema? A variância deles é bem próxima.
Desde já, obrigado!
Não é necessário fazer nenhum tratamento para outlier. Veja que eu nem chequei se há outliers nos dados, porque como o Kruska-Wallis é um teste não-paramétrico, ele se baseia em postos (ranks) e não sofre influência desses valores discrepantes.
Também não há problema em fazê-lo com grupos de tamanhos diferentes. O fato de ele ser baseado em postos o torno robusto a isso também.
Imaginei isso mesmo devido aos ranks! Muito obrigado pelo esclarecimento! Vc é 10! :)
Fernanda, é errado utilizar letras (como testes paramétricos) para separar os grupos de médias?
Não sei se entendi. Mas indicar as diferenças entre grupos por letras não é errado, e pode ser feito para testes paramétricos e não-paramétricos. O último vídeo que eu publiquei no canal explica isso.
Olá Fernanda, obrigado pela aula. Existe alguma referência bibliográfica que você recomenda para descrever os testes e justificar suas escolhas? Agradeço!
Gosto bastante dos livros do Andy Field, tanto o para SPSS quanto o para o R: Descobrindo a estatística usando o SPSS e Discovering Statistics using R.
@@FernandaPeres muito obrigado!!
Olá Fernanda, você está salvando minha dissertação rsrs
Oi, Silvana, você consegue essa informação pelo teste post hoc de Dunn, que eu ensino no vídeo. Com os valores de p de cada comparação 2 a 2 você sabe quais diferem :)
Oi! Ao invés de identificar cada grupo em cada linha, se lançasse os dados de cada grupo por colunas, o R também rodaria o teste? Ou tem de ser no formato que vc usou? Grato.
Oi, Jorge. Precisa ser no formato que eu usei... Alguns testes (vamos falar disso semana que vem, para a ANOVA com medidas repetidas) requerem que o banco esteja no formato que você mencionou. Mas até onde eu sei, o Kruskal-Wallis só funciona com o banco no formato que eu usei.
Olá, Fernanda! Parabéns pelo trabalho novamente, venho aprendendo muito com você. Me surgiu uma dúvida, quando eu faço um teste de Tukey, por exemplo, eu consigo diferenciar se os grupos diferiram entre si através do padrão 'a, b, c, ab' etc. Haveria como extrair uma informação no mesmo sentido com o Kruskal?
também estou com essa dúvida, Isabella.. Conseguiu resolver?
@Fernanda Peres, teria alguma forma de obter essa informação por letras no teste de Kruskal-Wallis?
Creio q a resposta seja não.
O kruskal é semelhante ao teste F, ele só diz se tem diferença entre os fatores. Para saber onde está a diferença vc tem q fzr o pos hoc com outro teste (de comparaçao entre os fatores). Ou seja, quem vai "indicar as letrinhas" é o teste pos hoc escolhido. No caso dessa aula da prof Fernanda (muito boa inclusive rs) o pos hoc usado ñ indica as letrinhas mas indica os pares diferentes, essa informação já é o suficiente para vc adicionar as letrinhas manualmente no papel rs
Talvez tenha como dar um comando no R para o pos hoc indicar as letrinhas, mas eu desconheço rs por isso faço na mão msm kkk
Ei, Fernanda! Eu fiz o teste de kruskal e houve diferença significativa entre os grupos dos meus dados. Quando executei o teste de dunn, não apareceu qual a fonte da variação. Nesse caso, eu posso fazer o teste de dunn sem ajustar o valor de p?
Parabéns pelos vídeos, tem me ajudado muito!!! Muito obrigada!
Abraços
Oi, Alana. De fato, isso às vezes acontece. Porque o post-hoc é mais conservador que o teste do Kruskal-Wallis. Uma opção é estudar se esse é o melhor post hoc para o seu caso (tem várias outras opções, inclusive que vem do mesmo pacote que eu usei para o teste de Dunn, então dá pra dar uma olhada na documentação do pacote).
Mas não dá pra usar o valor de p não ajustado, porque isso infla muito a taxa de erro do tipo I (eu tenho essa discussão sobre o problema de fazer múltiplas comparações no Instagram, se te interessar: instagram.com/estatisticaaplicada)
O que eu sugiro, se você quiser usar I post hoc de Dunn, é reportar que o Kruskal-Wallis foi significante, o post hoc não detectou diferenças, e as medianas são x, y e z.
Abraços!
Estou adorando seus vídeos. Pode me responder uma dúvida?
Estou fazendo meu TCC com escala Likert. E preciso comparar as respostas de homens e mulheres.
Nesse caso, por exemplo, eu tenho várias perguntas, onde cada indivíduo tem uma pontuação que pode variar de 1 a 5. Eu quero ver se há diferença na resposta de homens e mulheres nestas perguntas...
Eu devo usar Mann-Witney, certo? Fiquei em dúvida se deveria usar Mann-Witney ou Kruskal-Wallis. Eu ia usar o Kruskal, mas agora não sei. Porque eu só tenho 2 variáveis independentes, que estão dentro de "Gênero", que são "homem" e "mulher".
Eu tentei usar o Kruskal para ver se existe uma diferença geral, mas dá um erro, imagino que eu não possa usar várias perguntas ao mesmo tempo, tendo que usar uma por uma, estou certo?
Oi, Luddy. Sim, se só há duas categorias na sua variável independente (homens x mulheres), o correto e fazer um Mann-Whitney.
Mas, eles só vão analisar uma questão por vez.
Análise de questionário é sempre algo complexo. Dá para usar análise fatorial confirmatória, por exemplo, para analisar esses dados. Essa técnica analisaria todos de uma vez. Mas, é uma análise bem mais complexa (se não me engano, no canal Psicometristas Brasil tem esse tutorial).
Que massa. Obrigado!
Ainda vou ver todos os seus vídeos :D
Fernanda, tenho vistos teses e dissertações que apresentam os resultados de Kruskal-Wallis em médias e desvio-padrão ao invés de mediana e intervalo interquartil. Isso faz sentido ou deve ser mesmo em mediana?
Então, esse é um erro comum. Eu mesma, quando gravei o vídeo de SPSS, acho que não reparei e olhei para as médias. Mas não é o mais adequado. Porque usamos esses testes quando a distribuição não é normal, ou contem outliers. Nesses casos, a média não é uma boa representação do conjunto de dados. A mediana representa mais adequadamente. E, se a média não é uma boa representação, o desvio padrão (que é calculado com base nela) também não será. O melhor é mesmo usar mediana e amplitude interquartil. Já vi gente sendo criticada em defesas por mostrar a média e ter usado um teste não paramétrico.
@@FernandaPeres , muito boa sua explicação. Valeu!
@@FernandaPeres fernanda, mediana é a mesma coisa que o "posto médio" no SPSS quando vc roda o mann-whitney, por exemplo?
Parabéns pela aula! Eu estou trabalhando com um n=3. Utilizei os teste não paramétricos por causa de o n ser muito pequeno. Mas estou na dúvida de como realizar a analise descritiva, se uso média ou mediana, pois o teste de normalidade e de variância aceitaram a hipótese nula. Gostaria da sua opinião.
Se você usou um teste não-paramétrico, faz sentido reportar a mediana ;)
@@FernandaPeres muito obrigada!
Olá! Como eu posso fazer o teste de Kruskal-Wallis e Dunn no R para um experimento fatorial? Eu consegui gerar resultado com kruskal.test(Variável resposta ~ Fator 1 + Fator 2 , data = Dados), porém não conseguir fazer de jeito nenhum para o teste de Dunn. Tentei mudar minha tabela de dados para, ao invés de duas colunas abordando cada fator, uma coluna (ex: |Fator1eFator2| Variável resposta|) e deu um resultado diferente para Krustal-Wallis que não sei se está correto.
Não existe Kruskal-Wallis para dois fatores.
Olá Fernanda!! Muito bom seu vídeo, bem claro. Só me surgiu uma dúvida: porque o p.adj é o ideal para ver a significância e não o p? ns que dizer não significativo, né?! Desde já obrigada pela aula e paraéns!!
Obrigada, Evelyn! É que o p não ajustado não está corrigido para as múltiplas comparações. As múltiplas comparações aumentam a chance de erro do tipo I (deixa de ser o valor de alfa, 5%). Para resolver esse problema e manter o erro do tipo I em 5% é feito esse ajuste. O ns significa não significante mesmo. Abraços!
@@FernandaPeres Obrigada, querida! Você é ótimaaaa!! bjão
Boa tarde Fernanda. Parabéns pelo excelente trabalho. Estou com uma dúvida. Você sabe como colocar carácteres subscrito e sobrescrito nos eixos dos gráficos?
Obrigada, Gabriel!
Não sei... Tem que dar uma olhada na documentação dos labs (os labels de eixos) do ggplot2. Também vale a pena jogar a dúvida em inglês no Google, que alguém no StackOverflow já deve ter tido essa dúvida e já deve ter sido resolvida por lá...
@@FernandaPeres Consegui. boxplot(CO2Caat ~ Grupo, data = dados,
ylab = expression("CO"[2]* "Flux Caatinga"))
@@DanielGomes-cb3uk Que ótimo! Obrigada por compartilhar a solução!
@@FernandaPeres sempre prestativa. Fernanda, agora estou com outro problemas. Após gerar os histogramas tentei adicionar a curva de distribuição, mas não consegui. Teria como adicionar curva aos histogramas? Sabe como posso adicionar?
@@DanielGomes-cb3uk Nunca fiz isso. Mas tem uns tutoriais bons:
www.statmethods.net/graphs/density.html
stackoverflow.com/questions/20078107/overlay-normal-curve-to-histogram-in-r
E tem também uma função do pacote rcompanion que parece fazer isso de forma mais simples:
rdrr.io/cran/rcompanion/man/plotNormalHistogram.html
Oi fernanda, tudo bom? Se eu quiser comparar a amplitude dos dados invés da mediana, como fazer?
Não conheço um teste que compare a amplitude... Talvez exista, mas nunca ouvi falar...
Espero que vc me responda, estou fazendo tudo certinho mas aparece que meu objeto não pode ser encontrado ao iniciar o teste de Kruskal
> kruskal.test(Origem ~ Nota, date = dados1)
Error in eval(predvars, data, env) : objeto 'Origem' não encontrado
Olhando rapidamente, você cometeu um pequeno erro no "date" que deveria ser "data"... Caso essa alteração não resolva, verifique o seu banco de dados, para certificar-se que as variáveis estão escritas da mesma forma que foram explicitadas no argumento da função.
@@reinaldomatheusreisribeiro5894 obrigado amigo, eu achei esse erro no mesmo dia algumas horas dps kkkk. Era exatamente isso
Olá!! Parabéns pela qualidade dos seus vídeos! Finalmente tenho conseguido entender como utilizar o R para análises. Mas estou com uma dúvida... tenho sete grupos para comparar, como se faz para mostrar o restante das linhas quando termino de executar o teste de Dunn? Desde já, obrigada pelas aulas!!!
Oi, Thaciana. Nesse caso, você pode atribuir um nome ao post-hoc e pedir a visualização com a função View() do dplyr.
Exemplo:
posthoc
@@FernandaPeres Arrasou!!! Fiz aqui e deu certo. Obrigada!
alguém fez para um fatorial? e para dbc tenho que colocar variável independe + blocos do lado direito?
Professora!
Se eu quero analisar a relação entre duas variáveis, sendo uma quantitativa e outra ordinal, posso dividir a ordinal em categorias (ou seja, tornando a ordem irrelevante) e analisar com o teste kruskal wallis?
Existe um teste específico para avaliar associação entre variavel ordinal e quantitativa? Ou, ainda, neste contexto a variável ordinal poderia ser considerada quantitativa, de mandeira que aplicaria teste t (caso normal) ou u (caso outra distribuição)?
Nesse caso, faz mais sentido fazer uma correlação que permita variável ordinal (ex.: Spearman). Eu explico como escolher o teste nesse vídeo: th-cam.com/users/liveEtV3_3aN884?feature=share.
@@FernandaPeres muito obrigado!
Nessa parte:
# Passo 5: Análise descritiva dos dados
dados %>% group_by(Grupo) %>%
get_summary_stats(BC, Pressao, type = "median_iqr")
como eu deveria substituir meus dados, levando em consideração que só tenho tempo ~temperatura ?
Só tenho um fator.
Meus dados são sobre tempo de desenvolvimento de um inseto em diferentes temperaturas.
Se puder me ajudar, agradeço.
Oi, eu também só tenho um fator, o grupo. Então, temperatura entra o lugar do grupo. A diferença é que eu tenho duas variáveis dependentes, BC e pressão, e coloquei as duas separadas por vírgula. Você vai colocar (tempo, type="median_iqr".
Mas, certifique-se de que o seu delineamento não é de medidas repetidas. Se for, esse não é o teste adequado.
@@FernandaPeres Não é de medidas repetidas! Ainda bem euaheuae. Valeu, deu certo aqui. Parabéns pelo ótimo trabalho! Ganhou um inscrito.
Oi Fernanda. Excelente vídeo. Mas estou com um problema: a função dunn_test não existe na versão de R q eu tenho (4.0.3) e sim dunn.test. Acredito que seja a mesma coisa mas não estou sabendo usar. por favor, teria como vc me ajudar? Agradeço
Oi, ela existe, sim. É que você precisa instalar e carregar o pacote rstatix. Essa função vem desse pacote (se tiver dúvidas na instalação de pacotes, tenho vídeos no começo da playlist ensinando).
A função dunn.test provavelmente faz a mesma coisa, mas não é pipe friendly, aí você não vai conseguir usar da mesma forma que eu usei. Melhor instalar o rstatix. Mesmo porque ele tem várias outras funções muito úteis.
@@FernandaPeres Obrigada. Instalei o rstatix e deu tudo certo!
Boa tarde! Como resolver quando o grupo é uma variável quantitativa, por exemplo níveis de nitrogênio?
Aí ele não é uma variável de grupo. Provavelmente você teria que fazer uma correlação.
Boa tarde, não estou conseguindo baixar o script e nem o banco de dados para acompanhar a aula.
Acabei de testar aqui e os links estão funcionando. É só clicar no link e depois em baixar.