tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
df[lst] = df[lst].astype("float") esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size() agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro: 'DataFrame' object has no attribute 'Month' Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'. fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução df.rename(columns={'month': 'Month'}, inplace=True) basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo. e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month'] df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False) # Defina 'Month' como índice df = df.set_index('Month')
Conteúdo bacana, mas falta uma explicação mais técnica sobre a aplicação de cada método usado na estrutura do código. Afinal, Ctrl+c/Ctrl+v não ensina nada a ninguém.
Quer se tornar um analista de dados de sucesso? Conheça a plataforma da Data Marketing: www.datamarketingdigital.com.br 😀
Faz uma serie irmao, com varios projetos, seria otimo para nos que estamos aprendendo.
Opa! Ótimo vídeo, aprendi bastante. Deu pra ter uma idéia do dia a dia de uma Analista e colocar em prática algumas tarefas. Parabéns e obrigado!
Parabéns! Vídeo MUITO bom! 👏🏼👏🏼 só uma dica, aumenta um pouco o close no código quando for explicar, ficará melhor pra visualizar.
muito show essa didática ,vou até favoritar pra quando passar pra python aqui
Boaaa Alan =D
Excelente! Faça mais videos assim por favor!!!!
tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
Esse curso ta muito bom, parabéns
Excelente vídeo, obrigada por compartilhar!
de nada =D
Sensacional!!!
Muito bom, obrigado por compartilhar
Eu que agradeço
Mais um inscrito, vou estudar, gostei muito das strings. Estou tentando entender...
Ótimo vídeo!! Faça mais, por favor!
Pode deixarrr!!
Parabéns pelo vídeo. Muito obrigado
top de mais , faz um video de portfólio para engenharia de dados ! Prfv
anotado! trazer algo voltado para automatização
sensacional !!! faz mais.
Showww acho que esse video é inédito, parabéns e obrigado. Quanto tempo demorou na prática para fazer esse desafio?
Esse projeto foi algo em torno de 5 horas mas divido em dois dias.
Uma solução mais enxuta para o tratamento de dados:
df.columns = [str(i).lower() for i in df.columns] #deixando colunas em minúsculo
#substituindo registros inválidos por null
df = df.replace('%', '', regex = True)
df = df.replace(',', '', regex = True)
df = df.replace('-', '', regex = True)
df = df.replace('', np.nan)
df = df.replace('MAY90', np.nan)
df = df.dropna() #excluindo registros inválidos
df.isnull().sum() #verificando se ainda há nulos
#convertendo para float
lst = df.columns[1:]
df[lst] = df[lst].astype('float')
df.dtypes
boa!! sempre vai ter mais de uma forma de chegar no mesmo resultado =)
@@DataMarketingo meu ta indicando erro na linha df = df.replace('%', ' ', regex=true)
Também tô usando google colab
@@lewis_jogaJá passou muito tempo 😅😅...
Mas o erro estava no "true" tem que ser "True"
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
@@BrunaSantos-yo2ug fiquei na msm dúvida
Muito bom👏
Obrigado🥰
df[lst] = df[lst].astype("float")
esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
Quando ocorrem os problemas e a gente busca entender como resolver é quando mais aprendemos 😉 seja bem vinda
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
por que o df.info não roda no vscode?
Muito bom!!
Brabo meu nobre!
Obrigado Romulo =D
Muito bom! Sugestão de melhoria: faça vídeos menores.
muito bom
Obrigado Diego!
dica... aumentar em 20% a fonte, meu monitor é gigante e a fonte está pequena, da pra ler, mas iria facilitar a visualização
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size()
agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro:
'DataFrame' object has no attribute 'Month'
Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'.
fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução
df.rename(columns={'month': 'Month'}, inplace=True)
basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo.
e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month']
df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False)
# Defina 'Month' como índice
df = df.set_index('Month')
Dica: Use zoom em seus códigos. A letra é muito pequena, o que pode desestimular pessoas a assistirem aos seus vídeos.
Mas faltou dar zoom no conteúdo ficou muito difícil visualizar
Conteúdo ótimo, mas ficou muito pequeno, ainda mais com fundo branco que pena.
Conteúdo bacana, mas falta uma explicação mais técnica sobre a aplicação de cada método usado na estrutura do código. Afinal, Ctrl+c/Ctrl+v não ensina nada a ninguém.