Analisando os DADOS do questionário SOCIOECONÔMICO do ENEM por ESTADO | Análise de dados #6

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ก.ย. 2024
  • Nesse vídeo, Kizzy continua a análise exploratória dos microdados do #ENEM olhando para as primeiras duas questões do questionário socioeconômico respondido pelos candidatos do ENEM de 2018, mas agora observando a tendência por ESTADOS.
    Para fazer isso, utilizamos Python, claro, jupyter notebook, o do método WHERE pacote pandas e o pyplot do matplotlib.
    ****Link para NOSSA LISTA de e-mails: bit.ly/pgdinamica1 *********
    👉Se inscreva no canal para acompanhar todo o conteúdo e nos siga nas outras redes:
    *Instagram: @dinamicaprogramacao @kizzy_terra @ hallpaz
    *Twitter: @pgdinamica @kizzyterra @hallpaz
    * Curta a Programação Dinâmica no facebook: program...
    * Confira os artigos no Python Café: pythoncafe.com.br
    #AnáliseDeDados

ความคิดเห็น • 43

  • @JaaoPonte
    @JaaoPonte 5 ปีที่แล้ว +14

    Mesmo já sabendo python e tudo mais, parei pra assistir esse vídeo só pela maneira super clara de explicar, hahaha
    É muito legal ver que existem canais com conteúdo desse nível!

    • @pgdinamica
      @pgdinamica  5 ปีที่แล้ว +2

      Oi João, fico feliz! Me dedico bastante para criar exemplos didáticos que possam deixar os vídeos interessantes 😉

  • @alexandreFerreira-fb2gs
    @alexandreFerreira-fb2gs 5 ปีที่แล้ว +1

    Quem diria q aprenderia fazer analise de dados de forma tão fácil... só vc mesmo... brigadoooooo!!!

  • @humbertoluzoliveira
    @humbertoluzoliveira 2 ปีที่แล้ว +2

    Olá Kizzy!
    Realmente muito show essas aulas sobre análise de dados. Parabéns!
    Gostei tanto que resolvi estudar e aprende com essa análise dos dados de ENEM. Gostaria de saber se é possível adicionar ao código uma regra para selecionar os dados e o gráfico das notas do ENEM dos cinco estados que foram as notas melhoras (notas mais altas) os cinco estados piores (mais baixas). Deve ter como, poderia dar uma dica?
    Valeu, te agradeço!

  • @guifrsx1
    @guifrsx1 4 ปีที่แล้ว +1

    Suas dicas como "/", tem me ajudado muito e cada vez mais estou acompanhando seu canal.

  • @alextrevis3608
    @alextrevis3608 4 ปีที่แล้ว +1

    EXCELENTE CANAL! Vejo todos os vídeos de vocês. São dois excelentes professores, com uma didática peculiar!!

  • @lucasdscavalcante
    @lucasdscavalcante 5 ปีที่แล้ว +1

    Todo domingo eu fico ansioso pelo episódio do masterchef e pela série da Kizzy

    • @pgdinamica
      @pgdinamica  5 ปีที่แล้ว +2

      To muito prestigiada :) por aqui também adoramos Masterchef \o/

  • @ycarobatalha4215
    @ycarobatalha4215 4 ปีที่แล้ว

    Eu amo que vocë explica tudo isso com uma voz que traz muita paz! Amo kk

  • @raniel0511
    @raniel0511 3 ปีที่แล้ว

    Assistido ✔️
    Muito legal ver o progresso da série 😃

  • @BruceFonseca1
    @BruceFonseca1 2 ปีที่แล้ว

    Kyzzy, parabéns pelo conteúdo compartilhado!
    Adoro seus videos!!!

    • @pgdinamica
      @pgdinamica  2 ปีที่แล้ว

      Muito obrigada 😊

  • @JoaoVitor-sn5ow
    @JoaoVitor-sn5ow 5 ปีที่แล้ว +2

    Caralho,sensacional sua maneira de explicar.Parabéns!

  • @zeuus10
    @zeuus10 4 ปีที่แล้ว

    Kizzy , Top!

  • @everton4135
    @everton4135 9 หลายเดือนก่อน

    Aproveitando as férias da faculdade para fazer uma revisão de pandas. Kizzy, será que é possível fazer as mesmas análises usando processamento em paralelo de GPUs com a biblioteca Rapids da NVidia?

  • @jherfson
    @jherfson 2 ปีที่แล้ว

    Que video incrível !!!!Obrigado!!

  • @clenio_moura
    @clenio_moura 5 ปีที่แล้ว

    Seus vídeos são sempre muito didáticos. Parabéns!!! e estou no aguardo pela sequencia dos vídeos.

  • @noceunaotempao
    @noceunaotempao 3 ปีที่แล้ว

    obrigado.

  • @Jusssa
    @Jusssa 3 ปีที่แล้ว +1

    Gostei muito do canal! Parabéns!!! Kizzy, gostaria de lhe perguntar qual método posso utilizar para criar uma tabela que me apresente a totalidade de três variáveis. Ex: Sexo x Cor_Raca x UF . O que estou tentando fazer é apresentar nas linhas da tabela a primeira variável; nas colunas, a segunda variável com seu heading 0 a 5 representando cada cor_raca e por último que esse cruzamento das duas variáveis se repetisse para cada estado. (Isso é possível no Python?)
    Obrigado pelo conteúdo disponibilizado.

  • @juliooliveira8117
    @juliooliveira8117 4 ปีที่แล้ว +1

    Fantástico!

  • @karinnecristina3167
    @karinnecristina3167 5 ปีที่แล้ว

    Mais um vídeo da hora.

  • @Thejunior844
    @Thejunior844 4 ปีที่แล้ว +2

    Ola rodei o comando e me retornou esse erro, nao tenho experiencia com o pandas
    KeyError Traceback (most recent call last)
    in
    1 socEconSelecionado.filter(items=['NU_NOTA_NOTA_REDACAO','NO_Q001', 'SG_UF_RESIDENCIA'])\
    2 .where(socEconSelecionado.SG_UF_RESIDENCIA == 'RJ')\
    ----> 3 .groupby('NO_Q001')\
    4 .mean().sort_values(by='NU_NOTA_REDACAO', ascending=False)
    C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\frame.py in groupby(self, by, axis, level, as_index, sort, group_keys, squeeze, observed)
    5808 group_keys=group_keys,
    5809 squeeze=squeeze,
    -> 5810 observed=observed,
    5811 )
    5812
    C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\groupby\groupby.py in __init__(self, obj, keys, axis, level, grouper, exclusions, selection, as_index, sort, group_keys, squeeze, observed, mutated)
    407 sort=sort,
    408 observed=observed,
    --> 409 mutated=self.mutated,
    410 )
    411
    C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\groupby\grouper.py in get_grouper(obj, key, axis, level, sort, observed, mutated, validate)
    596 in_axis, name, level, gpr = False, None, gpr, None
    597 else:
    --> 598 raise KeyError(gpr)
    599 elif isinstance(gpr, Grouper) and gpr.key is not None:
    600 # Add key to exclusions
    KeyError: 'NO_Q001'

    • @zhwzh_
      @zhwzh_ 3 ปีที่แล้ว

      tive o mesmo problema agora

    • @zhwzh_
      @zhwzh_ 3 ปีที่แล้ว

      resolvi, faltou colocar colchetes no groupby, alem dos parenteses

  • @carolrawn
    @carolrawn 9 หลายเดือนก่อน

    diva

    • @pgdinamica
      @pgdinamica  9 หลายเดือนก่อน

      Obrigada!

  • @jpsamarino3
    @jpsamarino3 4 ปีที่แล้ว

    Parabéns pelo conteúdo e a didática , gostaria de saber como usar o Join na biblioteca pandas , não achei conteúdo no seu canal sobre isso. Obrigado

    • @pgdinamica
      @pgdinamica  4 ปีที่แล้ว +2

      Oi João, dá uma olhada nos exemplos aqui: pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.join.html

  • @leandroamorim5688
    @leandroamorim5688 4 ปีที่แล้ว

    Como eu faço para criar um gráfico mostrando a média das cinco notas e ai fazer um relação com a escolaridade dos pais de acordo com a renda mensal, alguém pode me ajudar? Como sou iniciante, já tentei de várias formas e não consegui.

  • @afonsoportugal3656
    @afonsoportugal3656 3 ปีที่แล้ว

    Daria para estimar a escolaridade dos pais de quem preencheu H pela nota do ENEM.

  • @paulohenriquews
    @paulohenriquews 4 ปีที่แล้ว

    Alguém poderia me ajudar: Eu gerei um filtro com as médias da Nota da Redação dos participantes onde a mãe 'Nunca Estudou', e depois a mãe 'Completou a Pós-graduação.'
    dados_socioeconomicos.filter(items=['SG_UF_RESIDENCIA','NU_NOTA_REDACAO','NO_Q002'])\
    .where(dados_socioeconomicos.NO_Q002 == 'Nunca Estudou',)\
    .groupby(['SG_UF_RESIDENCIA','NO_Q002'])\
    .mean().sort_values(by='NU_NOTA_REDACAO', ascending=True)
    dados_socioeconomicos.filter(items=['SG_UF_RESIDENCIA','NU_NOTA_REDACAO','NO_Q002'])\
    .where(dados_socioeconomicos.NO_Q002 == 'Completou a Pós-graduação.')\
    .groupby(['SG_UF_RESIDENCIA','NO_Q002'])\
    .mean().sort_values(by='NU_NOTA_REDACAO', ascending=True)
    Sempre me dá o resultado com 3 colunas: SG_UF_RESIDENCIA, NO_Q002, NU_NOTA_REDACAO.
    Eu gostaria de pegar o primeiro resultado SG_UF_RESIDENCIA, NO_Q002, NU_NOTA_REDACAO ('Nunca Estudou'') e colocar ao lado do segundo resultado G_UF_RESIDENCIA, NO_Q002, NU_NOTA_REDACAO ('Completou a Pós-graduação') e gerar um Dataframe.

    • @pgdinamica
      @pgdinamica  4 ปีที่แล้ว

      Oi Paulo, você pode usar o método concat para isso. Dá uma olhada aqui: pandas.pydata.org/pandas-docs/stable/reference/api/pandas.concat.html