Nosso Deus! Gostei demais Fernanda! Parabéns! Que Jesus Te abençoe e Te guarde. Show demais! Uso sempre o Stata, mas vou passar a usar o SPSS por sua causa. Se puder, faça um vídeo de logit com dados em painel. Seria muito bom. Abraços.
Só nao consegui gerar o gráfico da curva S. Você sabe como gerá-la no SPSS? É justamente a curva que está no canto superior direito da imagem do vídeo.
Bom dia Fernanda, muito boa sua explicação! Parabéns!!!!! Gostaria de saber se posso alterar o tempo de observância dos meus dados para a variável dicotômica sem impactar minha modelagem?
Fernanda, suas aulas me ajudam muiiiiito. Excelente didática. Gostaria, se possível que vc explicasse um pouco sobre como montar uma tabela com esses resultados da regressão logística binária e como interpretar os resultados. Por exemplo, a interpretação vai ser sempre com base na categoria referência que indicamos no programa??
Oi, Sâmia, tudo bem? Sim, a interpretação da odds ratio (OR) vai sempre depender da categoria de referência. Em geral, os artigos reportam as ORs, as vezes em tabela, as vezes em texto corrido. Mas adorei a sugestão, vou incluir um vídeo com interpretação de OR e exemplos de como se reporta regressão logística nos vídeos que estou programando gravar. Fico feliz que o canal te ajude! Abraços!
Fernanda, preciso de um HELP, urgente... A questão da escolha da categoria de referência, na caixa de diálogo da variável categórica na logistica: vc optou por "Primeiro", que significa no seu exemplo referenciar pelo FUMANTE (o risco potencial), que vc codificou como 1 na hora de preencher o valor da variável. Se na hora de preencher eu faço o contrário codifiquei como zero a minha resposta positiva para a exposição/ risco, eu simplesmente opto pela categoria de referência última? É isso? Outra questão na mesma dificuldade: eu tenho a variável categórica "estudo" com mais de uma resposta : e codifico zero para pessoas sem nenhum estudo, 1 para quem tem ensino fundamental, 2 quem tem ensino médio, 3 ensino superior. Quem está sendo a minha categoria de referência quando eu escolho Primeiro? Quem é a referencia quando escolho último? Estou feito louca pra entender e não encontro. Please, HELPPPPPP Super agradecida!
Olá Fernanda, como sempre aula muito didática, completa e clara. Surgiram algumas dúvidas. 1. Há um critério que devemos usar para utilizar a variável independente categórica com relação ao número de ocorrências? Pergunto isso porque por exemplo tenho um banco de dados com 272 registros, sendo 44 variáveis dependentes e uma variável dependente todas dicotômicas. Porém ocorrem algumas situações em que uma variável tem por exemplo 270 "Sim" e 2 "Não", neste caso o "Não" representa menos de 1% da amostra (0,74% mais precisamente). Como podemos ver a ocorrência é muito baixa e se formos criar uma mostra de treino e outra de teste a possibilidade de gerar um subamostra com 0 ocorrência para "Sim" ou para "Não" é possível. Seria bom fazer um pré-processamento e eliminar variáveis com por exemplo menos de 10% de ocorrência em uma dos dois valores "Sim"/"Não"? Queria saber o critério ideal, ninguém explica isso, sei que não é bom ficar tirando variáveis do estudo, mas esse é um problema comum eu acredito.
Oi, Elias. Então, pelo que você está me dizendo, tô entendendo que o seu foco é usar esses dados para previsão, certo? O foco desse vídeo nem é esse, é apenas identificar os fatores associados a uma determinada variável dependente dicotômica. Pode ver que eu nem separo a amostra em treino e teste. Essa história de separar a amostra é mais o foco do Data Science. Eu sei o básico, mas não tô por dentro da literatura para te dizer qual a proporção sugerida. Tem técnicas para minimizar essas problemas de desbalanceamento, como undersampling e oversampling. Mas, elas são mais focadas na variável dependente. Não sei dizer o quanto o desbalanceamento na dependente irá impactar na previsão (mas imagino que impacte).
Fernanda, então a regressão logistica só tem 2 pressupostos (N e ausência de multicolinearidade)? devo reportar a ausência de multicolinearidade no artigo com os valores de tolerance e VIF ? obrigado novamente!
Oi Fernanda, boa tarde. Parabéns pelo canal. Tenho aprendido muito por aqui. Dúvida: você poderia me indicar algum material / vídeo explicando como tratar dados desbalanceados na regressão logística, usando o SPSS ? Vi alguns vídeos sobre undersampling, oversampling, smote até ponderação na classe minoritária, mas a maioria em python. Estou tendo muita dificuldade em localizar videos que também expliquem como fazer a hold-out ( separação da base de dados de treino do modelo e teste ) nem validação/teste ( KFOLD -N) para regressão logística usando o SPSS. Se puder me ajudar com alguma indicação de material, te agradeço imensamente. Quem sabe vc mesma não consiga elaborar um material sobre esses assuntos quando tiver um tempinho ( fica a sugestão para o canal) ;o). Muito obrigada, Heloísa
Parabéns pelas excelente aulas professora, queria le perguntar como fazer o efito do acercamento na janela de um programa exemplo neste video nos minutos 3.26, 5.08 Também quando vai interpretar os resultados é feito um hacercamento até a tabela de resultados que se deseja discutir min 4.02. Obrigado
boa noite professora, eu queria fazer a pergunta de como se faz a analize de variaveis dummy no SPSS para variaveis preditoras de 3 categorias nominales, agraceco muito sua resposta.
Olá, Fernanda. Parabéns pela iniciativa de realizar estes vídeos. Uma pergunta: na regressão logística multinomial, os pressupostos são os mesmos da regressão logística binária? Você poderia fazer um vídeo com regressão logística multinomial? Grato pela atenção e muito obrigado!
Oi Fernanda! Muito obrigada pela disponibilização destes vídeos. Estou fazendo um projeto de pesquisa e preciso aprender omo fazer regressão logística multivariável. Você tem um vídeo sobre este tópico? Muito obrigada!
Olá Fernanda, tudo bem?/ Pode me ajudar? Eu estou precisando analisar dados de uma coorte retrospectiva par analisar predição de mortalidade, minha variável dependente é óbito (dicotômica), mas eu tenho várias variáveis independentes com mais de 2 categorias e todas foram categorizadas e além disso tenho muitos dados missing, você consegue me ajudar a saber qual análise exatamente devo fazer?
Fernanda, excelente. Sou da área de Engenharia Elétrica e estou com muitas dúvidas no meu tcc. Poderia te mandar as duvidas pelo e mail? Ficaria extremamente agradecido. Estou trabalhando com regressão logística
Obrigada, Fernanda! Suas aulas são maravilhosas. Estão ajudando muito na dissertação. Tenho uma dúvida: meu banco de dados tem 25 variáveis independentes. O ideal é colocar todas elas no modelo, ou fazer uma pré-seleção daquelas que seriam significantes. Li em um site da UFVJM que faria qui-quadrado uma a uma com a variável dependente, e selecionaria as que tivessem p< 0,20. Destas, faria uma regressão logística binomial uma a uma, e selecionaria as com p< 0,10. E estas então colocaria no modelo da regressão logística binomial. Mas não achei em mais nenhum lugar falando isto, aí fiquei na dúvida. Desde já agradeço
Oi, Carolina, tudo bem? Olha, não acho que essa sugestão do site seja um consenso... O mais recomendado é a escolha das variáveis que vão compor o modelo ser baseada em razões teóricas. Minha sugestão (e que é a sugestão do Andy Field, no livro Descobrindo a estatística usando o SPSS) é montar modelos hierárquicos, como o que eu ensino no vídeo, com a inserção das variáveis se baseando na teoria (o que faz mais sentido teórico, com base na literatura disponível, que esteja associado à variável dependente). E, muitas vezes, é recomendado manter as variáveis independentes não significativas no modelo, porque o efeito das outras variáveis independentes fica controlado por elas.
Olá Fernanda, suas aulas são ótimas e me ajudam muito. Tenho algumas dúvidas: Tem como fazer regressão logística com dados em painel no SPSS? Estou trabalhando com variáveis independentes de escalas diferentes, é melhor logaritmizar essas variáveis? Tenho também uma variável independente categórica com 6 categorias, na tabela de variáveis da equação, a Sig. foi acima de 0,05 para algumas dessas categorias e abaixo de 0,05 para outras, consigo utilizar essa variável independente na análise e considero como significativa?
Na prática, não vai fazer muita diferença. Ao trocar a categoria, o beta será oposto (se era positivo, vai ficar negativo) e a OR ficará invertida (1/OR). Até onde eu sei, o SPSS não permite selecionar a categoria de referência, e sempre vai usar a maior categoria (no meu caso, como era 0 e 1, ele escolheu a 1) como referência. Mas, para resolver esse problema, você pode recodificar. Por exemplo, colocar os valores 1 como zero, e vice-versa.
Oi, Marta, recomendo que você assista ao vídeo mais recente, que eu deixei no primeiro comentário desse vídeo aqui. Nele eu detalho toda essa questão de categoria de referência.
Olá, Fernanda! Parabéns pelo canal. Seus vídeos são muito objetivos e práticos. Ajudam demais! Fiquei com uma dúvida sobre a variável de referência para covariáveis categóricas. O SPSS sempre considerará como primeira categoria a mais frequente daquela variável, é isso? Fiquei com dúvida se é isso mesmo, ou se software considera a primeira categoria que eu defini, por exemplo, 0 = não, 1 = sim, sendo nesse caso o 0 a primeira categoria. Agradeço antecipadamente! Abraços
Olá Fernanda! Na sua aula você optou por não realizar a análise considerando no modelo a interação entre as duas variáveis. Caso você fizesse, como deveríamos interpretar esta interação? Neste caso, o modelo considera as duas variáveis simultaneamente? Se estamos falando em fatores de risco, consideraria além do hábito de fumar também o fator estresse para prever o aumento de chance? Obrigada pela sua atenção e parabéns pelas suas aulas que são excelentes!
Oi, Patrícia, obrigada! Então, você interpreta a interação da regressão logística da mesma forma que a da ANOVA: entende que o efeito de uma variável independente depende da outra variável independente. Eu tenho vídeo sobre ANOVA de duas vias aqui que talvez te ajude a interpretar. E também tenho um post sobre interpretação de interação lá no Instagram: instagram.com/estatisticaaplicada Em geral, quando tem efeito da interação, analisamos só ela, e não os efeitos separados. Mas o modelo incluindo as duas variáveis, sem a interação, já está considerando o efeito das duas. O que ele não considera é que o efeito de uma depende da outra.
@@FernandaPeres Entendi, Fernanda! Vou rever a aula sobre ANOVA e analisar com base no que estou pesquisando. Mais uma vez, muito obrigada pela atenção!
Oi Fernanda! Estou em dúvida quanto ao melhor método para minhas análises. Você teria alguma referência bibliográfica que pudesse me orientar neste sentido?
Oi, Patrícia, tudo bem? Eu gosto do livro do Andy Field (Descobrindo a estatística usando o SPSS). Tem em português e é uma leitura leve. Eu também tenho vários posts teóricos no Instagram :)
@@FernandaPeres Oi Fernanda! Tudo bem, obrigada! Espero que também esteja bem...Agradeço a dica! Encontrei também uma outra referência que já me auxiliou um pouco: Using Multivariate Statistics - Tabachnick & Fidell.
Fernanda, eu segui os seus vídeos pra montar um modelo de regressão logística mas não dividi os blocos ( as variáveis independente), fiz todas em um único bloco ( 3 variáveis ). Isso foi a única coisa que eu fiz de forma diferente. Eu terei erros no meu modelo?
Não, Gisélia. Essa é a grande vantagem. A variável dependente precisa ser dicotômica, mas as independentes podem ser de qualquer tipo. Fico feliz que meu trabalho te ajude :)
Olá, Fernanda!! Muito obrigado pelos vídeos! Está me ajudando muuuuito! Só ficou uma dúvida: para o teste de multicolinearidade, se minha variável dependente é do tipo "sequência", como farei o teste, visto que o SPSS informa que "Variáveis de sequência não são permitidas na lista"? A variável que estou usando é: se determinada empresa suaviza (sim ou não) seus resultados. Acredito que seja da mesma natureza do que você usou.
O SPSS não permite analisar variáveis de sequência. Tem que codificar antes de inserir no programa. Eu explico isso nos dois primeiros vídeos da playlist de SPSS.
Até é, em um gráfico sigmoidal. Mas esse gráfico não será muito informativo. O mais comum é descrever os coeficientes em uma tabela (o beta, odds ratio). Também é possível colocar a tabela de confusão (que mostra os acertos e erros do modelo para cada uma das categorias).
Olá Fernanda, em relação a essa regressão ela é binária por sempre usar duas variáveis independentes, a cada momento que gerar a estatísticas? Outra dúvida se o odds ration estiver entre um IC 95% com valores negativos significa que o resultado é inversamente proporcional? desde já grato.
Oi, Roberto. Ela chama binária porque a variável dependente é uma variável dicotômica (uma variável categórica que apresenta apenas duas categorias, daí vem o binária). A odds ratio não pode ser negativa. A variável está associada a diminuição da chance quando o valor está entre 0 e 1. Eu tenho uma explicação teórica de odds ratio no video 2 de regressão logística multinomial, talvez ajude. Abraços!
Oi, Amanda. Que bom que os vídeos estão te ajudando! Comecei a trabalhar com o R mais recentemente, e estou planejando vídeos semelhantes a esses, mas todos no R. Se inscreve no canal para receber notificações quando eu publicar. Abraços!
assisto sua aulas e gosto bastante: peço se pode me ajudar resolver este A partir de uma amostra de 20.000 dados, foram definidas três subamostras: uma para construção do modelo (8.000 dados) e duas para validação, cada uma com 6.000 dados. meu email: linolrj@gmail.com
Dúvidas quanto à categoria de referência? Esse vídeo explica isso em detalhes: th-cam.com/video/R3f_iRhU7Tk/w-d-xo.html
Muito boa sua aula profa.
Já é a segunda vez que assisto e sempre aprendo algo novo. parabéns.
Fernanda seu canal informativo é maravilhoso, está me salvando a vida na pós graduação! Meus Parabéns e obrigado!!
Salve Fernanda, democratizando conhecimento. Show.
Você é otima, não imagina o quanto está me ajudando
melhor canal do youtube em pelo menos 4 linguas
A melhor explicação que já vi sobre regressão logística! Muito show! Parabéns!
Parabéns Fernanda, é de pessoas como você que precisamos....
Seus vídeos são top....
Nosso Deus! Gostei demais Fernanda! Parabéns! Que Jesus Te abençoe e Te guarde. Show demais! Uso sempre o Stata, mas vou passar a usar o SPSS por sua causa. Se puder, faça um vídeo de logit com dados em painel. Seria muito bom. Abraços.
Fernanda, seus vídeos são maravilhosos, sempre que me bate alguma dúvida recorro ao seu canal. Obrigada!!!
ótimo vídeo! parabéns e obrigado por partilhar seu conhecimento!
Era bom ter um AMEI aqui... ficou muito bom! Parabéns...
Fico feliz que você tenha gostado, Paulo! :)
Só nao consegui gerar o gráfico da curva S. Você sabe como gerá-la no SPSS? É justamente a curva que está no canto superior direito da imagem do vídeo.
Paulo Ricardo Gorayeb, não sei gerá-la no SPSS. Vou fazer uns testes aqui e te respondo!
Excelente! Muito obrigada! Ajudou muito!!
Caramba, perfeito, obrigado pela aula.
Bom dia Fernanda, muito boa sua explicação! Parabéns!!!!! Gostaria de saber se posso alterar o tempo de observância dos meus dados para a variável dicotômica sem impactar minha modelagem?
Que cuidado e dedicação. Obrigada.
Ola Fernanda! Seus videos são ótimos e ajudam muito. Pode dizer como utilizar as variaveis de controle na RL. Obrigada
Muito bom!
Tem algum vídeo que fale do método Backward?
Não tenho. Mas você consegue ler um pouco a respeito no livro do Andy Field (Descobrindo a estatística usando o SPSS).
Parabéns Fernanda pelo seu excelente trabalho!!! Vc tem algum vídeo onde discuta especificamente os modelos Probit e Logit, usando o SPSS?
Obrigada, João! Não tenho vídeos de modelo probit... Só logit (que é esse)...
Muito boa a sua aula, Fernanda
Parabéns
Ferrnanda, parabens. Aprendi muito com voce. Como fazer curva Roc a partir da Regressao logistica no SPSS? desde á, agradeço.
Como fazer o diagnóstico de colinearidade para amostra complexa ?
Fernanda, suas aulas me ajudam muiiiiito. Excelente didática. Gostaria, se possível que vc explicasse um pouco sobre como montar uma tabela com esses resultados da regressão logística binária e como interpretar os resultados. Por exemplo, a interpretação vai ser sempre com base na categoria referência que indicamos no programa??
Oi, Sâmia, tudo bem? Sim, a interpretação da odds ratio (OR) vai sempre depender da categoria de referência. Em geral, os artigos reportam as ORs, as vezes em tabela, as vezes em texto corrido. Mas adorei a sugestão, vou incluir um vídeo com interpretação de OR e exemplos de como se reporta regressão logística nos vídeos que estou programando gravar.
Fico feliz que o canal te ajude!
Abraços!
Fernanda, preciso de um HELP, urgente... A questão da escolha da categoria de referência, na caixa de diálogo da variável categórica na logistica: vc optou por "Primeiro", que significa no seu exemplo referenciar pelo FUMANTE (o risco potencial), que vc codificou como 1 na hora de preencher o valor da variável. Se na hora de preencher eu faço o contrário codifiquei como zero a minha resposta positiva para a exposição/ risco, eu simplesmente opto pela categoria de referência última? É isso?
Outra questão na mesma dificuldade: eu tenho a variável categórica "estudo" com mais de uma resposta : e codifico zero para pessoas sem nenhum estudo, 1 para quem tem ensino fundamental, 2 quem tem ensino médio, 3 ensino superior. Quem está sendo a minha categoria de referência quando eu escolho Primeiro? Quem é a referencia quando escolho último? Estou feito louca pra entender e não encontro. Please, HELPPPPPP
Super agradecida!
Muito bom o vídeo. Tu pode indicar a referência que trata do número de casos por variável independente?
Olá Fernanda, como sempre aula muito didática, completa e clara.
Surgiram algumas dúvidas.
1. Há um critério que devemos usar para utilizar a variável independente categórica com relação ao número de ocorrências?
Pergunto isso porque por exemplo tenho um banco de dados com 272 registros, sendo 44 variáveis dependentes e uma variável
dependente todas dicotômicas.
Porém ocorrem algumas situações em que uma variável tem por exemplo 270 "Sim" e 2 "Não",
neste caso o "Não" representa menos de 1% da amostra (0,74% mais precisamente).
Como podemos ver a ocorrência é muito baixa e se formos criar uma mostra de treino e outra de teste a possibilidade de
gerar um subamostra com 0 ocorrência para "Sim" ou para "Não" é possível.
Seria bom fazer um pré-processamento e eliminar variáveis com por exemplo menos de 10% de ocorrência em uma dos dois valores "Sim"/"Não"?
Queria saber o critério ideal, ninguém explica isso, sei que não é bom ficar tirando variáveis do estudo, mas esse é um problema comum eu acredito.
Oi, Elias. Então, pelo que você está me dizendo, tô entendendo que o seu foco é usar esses dados para previsão, certo? O foco desse vídeo nem é esse, é apenas identificar os fatores associados a uma determinada variável dependente dicotômica. Pode ver que eu nem separo a amostra em treino e teste.
Essa história de separar a amostra é mais o foco do Data Science. Eu sei o básico, mas não tô por dentro da literatura para te dizer qual a proporção sugerida. Tem técnicas para minimizar essas problemas de desbalanceamento, como undersampling e oversampling. Mas, elas são mais focadas na variável dependente. Não sei dizer o quanto o desbalanceamento na dependente irá impactar na previsão (mas imagino que impacte).
Fernanda, então a regressão logistica só tem 2 pressupostos (N e ausência de multicolinearidade)? devo reportar a ausência de multicolinearidade no artigo com os valores de tolerance e VIF ? obrigado novamente!
Oi Fernanda, boa tarde. Parabéns pelo canal. Tenho aprendido muito por aqui. Dúvida: você poderia me indicar algum material / vídeo explicando como tratar dados desbalanceados na regressão logística, usando o SPSS ? Vi alguns vídeos sobre undersampling, oversampling, smote até ponderação na classe minoritária, mas a maioria em python. Estou tendo muita dificuldade em localizar videos que também expliquem como fazer a hold-out ( separação da base de dados de treino do modelo e teste ) nem validação/teste ( KFOLD -N) para regressão logística usando o SPSS. Se puder me ajudar com alguma indicação de material, te agradeço imensamente. Quem sabe vc mesma não consiga elaborar um material sobre esses assuntos quando tiver um tempinho ( fica a sugestão para o canal) ;o). Muito obrigada, Heloísa
Parabéns pelas excelente aulas professora, queria le perguntar como fazer o efito do acercamento na janela de um programa exemplo neste video nos minutos 3.26, 5.08
Também quando vai interpretar os resultados é feito um hacercamento até a tabela de resultados que se deseja discutir min 4.02. Obrigado
Eu dei um zoom no vídeo pelo programa de edição. Atualmente uso o shotcut, mas nessa época usava o Active Presenter.
@@FernandaPeres entendi, muito obrigado pela dica. Eu achava q daba para fazer isso em aula em ao vivo. Muito obrigado mesmo.
boa noite professora, eu queria fazer a pergunta de como se faz a analize de variaveis dummy no SPSS para variaveis preditoras de 3 categorias nominales, agraceco muito sua resposta.
Vai sair vídeo sobre isso em breve!
Mas você encontra vídeos bons em inglês.
Olá, Fernanda. Parabéns pela iniciativa de realizar estes vídeos. Uma pergunta: na regressão logística multinomial, os pressupostos são os mesmos da regressão logística binária? Você poderia fazer um vídeo com regressão logística multinomial? Grato pela atenção e muito obrigado!
Agora eu fiz, rs. Está na playlist de SPSS.
Oi Fernanda! Muito obrigada pela disponibilização destes vídeos. Estou fazendo um projeto de pesquisa e preciso aprender omo fazer regressão logística multivariável. Você tem um vídeo sobre este tópico? Muito obrigada!
Ainda não, mas vai sair (se tudo der certo) essa semana!!
@@FernandaPeres Nossa, que bom! Agradeço demais!
parabéns!!!!!!!!!!!!!!!!
Olá Fernanda, tudo bem?/ Pode me ajudar? Eu estou precisando analisar dados de uma coorte retrospectiva par analisar predição de mortalidade, minha variável dependente é óbito (dicotômica), mas eu tenho várias variáveis independentes com mais de 2 categorias e todas foram categorizadas e além disso tenho muitos dados missing, você consegue me ajudar a saber qual análise exatamente devo fazer?
Fernanda, excelente. Sou da área de Engenharia Elétrica e estou com muitas dúvidas no meu tcc. Poderia te mandar as duvidas pelo e mail? Ficaria extremamente agradecido. Estou trabalhando com regressão logística
Fernanda, ótima aula!
Mas o que significam os números na coluna do estresse?
Oi, Vitor! Que bom que gostou da aula. Esses números são uma escala de estresse (quanto maior, maior o estresse). Mas são números inventados.
Obrigada, Fernanda! Suas aulas são maravilhosas. Estão ajudando muito na dissertação.
Tenho uma dúvida: meu banco de dados tem 25 variáveis independentes. O ideal é colocar todas elas no modelo, ou fazer uma pré-seleção daquelas que seriam significantes.
Li em um site da UFVJM que faria qui-quadrado uma a uma com a variável dependente, e selecionaria as que tivessem p< 0,20. Destas, faria uma regressão logística binomial uma a uma, e selecionaria as com p< 0,10. E estas então colocaria no modelo da regressão logística binomial.
Mas não achei em mais nenhum lugar falando isto, aí fiquei na dúvida. Desde já agradeço
Oi, Carolina, tudo bem? Olha, não acho que essa sugestão do site seja um consenso... O mais recomendado é a escolha das variáveis que vão compor o modelo ser baseada em razões teóricas. Minha sugestão (e que é a sugestão do Andy Field, no livro Descobrindo a estatística usando o SPSS) é montar modelos hierárquicos, como o que eu ensino no vídeo, com a inserção das variáveis se baseando na teoria (o que faz mais sentido teórico, com base na literatura disponível, que esteja associado à variável dependente). E, muitas vezes, é recomendado manter as variáveis independentes não significativas no modelo, porque o efeito das outras variáveis independentes fica controlado por elas.
@@FernandaPeres Muito obrigada!!! Vou começar a ler o livro.
Muito obrigada por estes vídeos!!!
Fiquei com uma dúvida: como é que o modelo de regressão logística binária lida com os casos omissos?
Ele faz uma deleção listwise: se uma das células for um valor ausente, a linha toda é excluída do modelo.
Tinha a mesma dúvida.
Olá Fernanda, suas aulas são ótimas e me ajudam muito. Tenho algumas dúvidas: Tem como fazer regressão logística com dados em painel no SPSS?
Estou trabalhando com variáveis independentes de escalas diferentes, é melhor logaritmizar essas variáveis?
Tenho também uma variável independente categórica com 6 categorias, na tabela de variáveis da equação, a Sig. foi acima de 0,05 para algumas dessas categorias e abaixo de 0,05 para outras, consigo utilizar essa variável independente na análise e considero como significativa?
Olá Como fazer para determinar na variável dependente a referência na qual quero me basear para fazer o teste? Ou não fará diferença?
Na prática, não vai fazer muita diferença. Ao trocar a categoria, o beta será oposto (se era positivo, vai ficar negativo) e a OR ficará invertida (1/OR). Até onde eu sei, o SPSS não permite selecionar a categoria de referência, e sempre vai usar a maior categoria (no meu caso, como era 0 e 1, ele escolheu a 1) como referência. Mas, para resolver esse problema, você pode recodificar. Por exemplo, colocar os valores 1 como zero, e vice-versa.
@@FernandaPeres muito obrigada.
@@FernandaPeres o intervalo de confiança também será invertido?
@@luanagabrielledefrancaferr957 Sim, porque como será outra OR, o intervalo de confiança para ela será alterado.
Quando escolhemos a categoria de referência, a primeira categoria é o primeiro item ou o que mais se repete? Não entendi essa parte. Obrigada:)
Oi, Marta, recomendo que você assista ao vídeo mais recente, que eu deixei no primeiro comentário desse vídeo aqui. Nele eu detalho toda essa questão de categoria de referência.
Olá, Fernanda! Parabéns pelo canal. Seus vídeos são muito objetivos e práticos. Ajudam demais!
Fiquei com uma dúvida sobre a variável de referência para covariáveis categóricas. O SPSS sempre considerará como primeira categoria a mais frequente daquela variável, é isso? Fiquei com dúvida se é isso mesmo, ou se software considera a primeira categoria que eu defini, por exemplo, 0 = não, 1 = sim, sendo nesse caso o 0 a primeira categoria.
Agradeço antecipadamente!
Abraços
Oi, Luis. Ele considera a que você seleciona (primeira ou última), considerando como primeira a de menor valor no momento que você codificou.
@@FernandaPeres Perfeito. Muito obrigado mais uma vez!
Olá, esse modelo eu posso chamar de modelo log lin?
Não. Esse modelo é o logístico binário.
@@FernandaPeres Você tem vídeos sobre modelos log lin? E parabéns pelo trabalho!
Consigo o SPSS free ou somente pagando ?
Fernanda ,boa noite
Estou amando as suas aulas mas tenho uma dúvida: existe outra plataforma que eu consiga baixar as planilhas ?
Olá Fernanda! Na sua aula você optou por não realizar a análise considerando no modelo a interação entre as duas variáveis. Caso você fizesse, como deveríamos interpretar esta interação? Neste caso, o modelo considera as duas variáveis simultaneamente? Se estamos falando em fatores de risco, consideraria além do hábito de fumar também o fator estresse para prever o aumento de chance? Obrigada pela sua atenção e parabéns pelas suas aulas que são excelentes!
Oi, Patrícia, obrigada! Então, você interpreta a interação da regressão logística da mesma forma que a da ANOVA: entende que o efeito de uma variável independente depende da outra variável independente. Eu tenho vídeo sobre ANOVA de duas vias aqui que talvez te ajude a interpretar. E também tenho um post sobre interpretação de interação lá no Instagram: instagram.com/estatisticaaplicada
Em geral, quando tem efeito da interação, analisamos só ela, e não os efeitos separados.
Mas o modelo incluindo as duas variáveis, sem a interação, já está considerando o efeito das duas. O que ele não considera é que o efeito de uma depende da outra.
@@FernandaPeres Entendi, Fernanda! Vou rever a aula sobre ANOVA e analisar com base no que estou pesquisando. Mais uma vez, muito obrigada pela atenção!
Oi Fernanda! Estou em dúvida quanto ao melhor método para minhas análises. Você teria alguma referência bibliográfica que pudesse me orientar neste sentido?
Oi, Patrícia, tudo bem? Eu gosto do livro do Andy Field (Descobrindo a estatística usando o SPSS). Tem em português e é uma leitura leve. Eu também tenho vários posts teóricos no Instagram :)
@@FernandaPeres Oi Fernanda! Tudo bem, obrigada! Espero que também esteja bem...Agradeço a dica! Encontrei também uma outra referência que já me auxiliou um pouco: Using Multivariate Statistics - Tabachnick & Fidell.
@@patricialima1623 Sim! Também gosto bastante desse livro!
Oi, Fernanda! Estou aqui mais uma vez pra te agradecer pelos vídeos extremamente esclarecedores
Fernanda, eu segui os seus vídeos pra montar um modelo de regressão logística mas não dividi os blocos ( as variáveis independente), fiz todas em um único bloco ( 3 variáveis ). Isso foi a única coisa que eu fiz de forma diferente. Eu terei erros no meu modelo?
Oi, Fernanda. Não. Como eu explico no vídeo, são formas diferentes de construir os modelos. Eu usei o método hierárquico.
Ola Fernanda, sou sua fã! Uma dúvida, as variáveis independentes precisam ser dicotômicas também na regressão logística?
Não, Gisélia. Essa é a grande vantagem. A variável dependente precisa ser dicotômica, mas as independentes podem ser de qualquer tipo.
Fico feliz que meu trabalho te ajude :)
Olá, Fernanda!! Muito obrigado pelos vídeos! Está me ajudando muuuuito!
Só ficou uma dúvida: para o teste de multicolinearidade, se minha variável dependente é do tipo "sequência", como farei o teste, visto que o SPSS informa que "Variáveis de sequência não são permitidas na lista"?
A variável que estou usando é: se determinada empresa suaviza (sim ou não) seus resultados. Acredito que seja da mesma natureza do que você usou.
O SPSS não permite analisar variáveis de sequência. Tem que codificar antes de inserir no programa. Eu explico isso nos dois primeiros vídeos da playlist de SPSS.
Oi, Fernanda! É possível representar em um gráfico a regressão logística?
Até é, em um gráfico sigmoidal. Mas esse gráfico não será muito informativo. O mais comum é descrever os coeficientes em uma tabela (o beta, odds ratio). Também é possível colocar a tabela de confusão (que mostra os acertos e erros do modelo para cada uma das categorias).
Olá Fernanda, em relação a essa regressão ela é binária por sempre usar duas variáveis independentes, a cada momento que gerar a estatísticas? Outra dúvida se o odds ration estiver entre um IC 95% com valores negativos significa que o resultado é inversamente proporcional? desde já grato.
Oi, Roberto. Ela chama binária porque a variável dependente é uma variável dicotômica (uma variável categórica que apresenta apenas duas categorias, daí vem o binária). A odds ratio não pode ser negativa. A variável está associada a diminuição da chance quando o valor está entre 0 e 1.
Eu tenho uma explicação teórica de odds ratio no video 2 de regressão logística multinomial, talvez ajude.
Abraços!
Fernanda, muito obrigada pelos seus vídeos. Vc trabalha com o programa R? Caso sim, pensa em fazer vídeos utilizando o R?
Oi, Amanda. Que bom que os vídeos estão te ajudando! Comecei a trabalhar com o R mais recentemente, e estou planejando vídeos semelhantes a esses, mas todos no R. Se inscreve no canal para receber notificações quando eu publicar. Abraços!
Um ano depois, a resposta agora é sim, rs. Tem uma playlist com o curso em R :)
#RegressãoLogística
assisto sua aulas e gosto bastante: peço se pode me ajudar resolver este A partir de
uma amostra de 20.000 dados, foram definidas três subamostras: uma para construção do
modelo (8.000 dados) e duas para validação, cada uma com 6.000 dados.
meu email: linolrj@gmail.com