tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
df[lst] = df[lst].astype("float") esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size() agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro: 'DataFrame' object has no attribute 'Month' Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'. fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução df.rename(columns={'month': 'Month'}, inplace=True) basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo. e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month'] df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False) # Defina 'Month' como índice df = df.set_index('Month')
Quer se tornar um analista de dados de sucesso? Conheça a plataforma da Data Marketing: www.datamarketingdigital.com.br 😀
Faz uma serie irmao, com varios projetos, seria otimo para nos que estamos aprendendo.
Ótimo vídeo!! Faça mais, por favor!
Pode deixarrr!!
Opa! Ótimo vídeo, aprendi bastante. Deu pra ter uma idéia do dia a dia de uma Analista e colocar em prática algumas tarefas. Parabéns e obrigado!
muito show essa didática ,vou até favoritar pra quando passar pra python aqui
Boaaa Alan =D
Parabéns! Vídeo MUITO bom! 👏🏼👏🏼 só uma dica, aumenta um pouco o close no código quando for explicar, ficará melhor pra visualizar.
Esse curso ta muito bom, parabéns
tô precisando fazer um projeto de extensão da faculdade de topicos de big data em python e esse video abriu minha mente para o como vou fazer o projeto
Sensacional!!!
Muito bom, obrigado por compartilhar
Eu que agradeço
Excelente! Faça mais videos assim por favor!!!!
Excelente vídeo, obrigada por compartilhar!
de nada =D
Mais um inscrito, vou estudar, gostei muito das strings. Estou tentando entender...
sensacional !!! faz mais.
Parabéns pelo vídeo. Muito obrigado
top de mais , faz um video de portfólio para engenharia de dados ! Prfv
anotado! trazer algo voltado para automatização
Muito bom! Sugestão de melhoria: faça vídeos menores.
Uma solução mais enxuta para o tratamento de dados:
df.columns = [str(i).lower() for i in df.columns] #deixando colunas em minúsculo
#substituindo registros inválidos por null
df = df.replace('%', '', regex = True)
df = df.replace(',', '', regex = True)
df = df.replace('-', '', regex = True)
df = df.replace('', np.nan)
df = df.replace('MAY90', np.nan)
df = df.dropna() #excluindo registros inválidos
df.isnull().sum() #verificando se ainda há nulos
#convertendo para float
lst = df.columns[1:]
df[lst] = df[lst].astype('float')
df.dtypes
boa!! sempre vai ter mais de uma forma de chegar no mesmo resultado =)
@@DataMarketingo meu ta indicando erro na linha df = df.replace('%', ' ', regex=true)
Também tô usando google colab
@@lewis_jogaJá passou muito tempo 😅😅...
Mas o erro estava no "true" tem que ser "True"
não entendi o tratamento do MAY90, é porque esta fora do padrão que é primeira letra maiuscula e demais minusculas? mas como saber isso se o dataframe for mto grande?
@@BrunaSantos-yo2ug fiquei na msm dúvida
df[lst] = df[lst].astype("float")
esse nan desse nem a pau nao aponta erro de sintaxe anterior .... dureza porem um desafio mt mt mt empolgante estou amando o que eu escolhi ser ! apaixonada pelo video o cara é so XABLAU DOS DADOS
Quando ocorrem os problemas e a gente busca entender como resolver é quando mais aprendemos 😉 seja bem vinda
to com dificuldade nessa mesma linha, é como se houvesse algum caractere que é string e não pode ser convertido em float por algum motivo@@DataMarketing
Muito bom👏
Obrigado🥰
Showww acho que esse video é inédito, parabéns e obrigado. Quanto tempo demorou na prática para fazer esse desafio?
Esse projeto foi algo em torno de 5 horas mas divido em dois dias.
por que o df.info não roda no vscode?
Brabo meu nobre!
Obrigado Romulo =D
Nesse case pode realizar algum tipo de consulta, ou teria que lembrar a sintaxe toda na prática? Pq eu até consigo realizar análise ou criar modelos de ML na prática, mas ainda sou muito dependente da documentação então não tenho muita confiança em aplicar pra vagas
muito bom
Obrigado Diego!
Muito bom!!
dica... aumentar em 20% a fonte, meu monitor é gigante e a fonte está pequena, da pra ler, mas iria facilitar a visualização
Qual a finalidade dessa parte do código ? "df.replace('MAY90', np.nan)" sei que ele está substituindo os valores de "MAY90" por NaN. Mas não localizei nenhum dado com essa informação ("MAY90"), antes da transformação.
enrosquei na mesma coisa, "acho" que pq o mês esta no padrão iniciando em maiculusco e depois minusculo, tipo: May90, eu achei que com o codigo agrupado = df.groupby([Month']).size()
agrupado visualizaria mas são muitas informações... não sei como verificar esse tipo de informação num df mto grande
Mas faltou dar zoom no conteúdo ficou muito difícil visualizar
Não estou conseguindo converter a coluna Month para data. fiz o código igualzinho e da esse erro:
'DataFrame' object has no attribute 'Month'
Estou usando Jupyter
Opa não sei se você conseguiu arrumar o erro depois de 1 ano né kkkkkk mas eu tive o mesmo erro, quebrei a cabeça pra entender(sou iniciante) e entendi que na tabela ta month com 'm' e não 'Month' com o 'M'.
fiz esse codigo aqui, se alguém em 2024 tiver o mesmo erro tente essa solução
df.rename(columns={'month': 'Month'}, inplace=True)
basicamente aqui eu to procurando pela coluna 'month' e trocando para Month. e LEMBRE-SE de usar o inplace pq ele é o que vai deixar salvo.
e aqui é como o cara no vídeo fez, mas para mim funcionou botando dentro de [] como uma lista. Então ve ai se o seu funciona como df.Month ou se df['Month']
df['Month'] = pd.to_datetime(df['Month'].str.upper(), format="%b%y", yearfirst=False)
# Defina 'Month' como índice
df = df.set_index('Month')
Dica: Use zoom em seus códigos. A letra é muito pequena, o que pode desestimular pessoas a assistirem aos seus vídeos.
Conteúdo ótimo, mas ficou muito pequeno, ainda mais com fundo branco que pena.