Você não vai acreditar como o ETL pode ser FÁCIL com o Spark

แชร์
ฝัง
  • เผยแพร่เมื่อ 8 ก.พ. 2025
  • 🔥 Você quer dominar o mundo da Engenharia de Dados? Neste vídeo, eu revelo como construir um processo ETL impecável usando Microsoft Azure e Spark Databricks! Não perca, clique em 'Assistir' agora! 🔥"
    "Você está pronto para elevar sua carreira em Engenharia de Dados a um novo patamar? 🔥 Aprenda como construir um processo de Extração, Transformação e Carga (ETL) usando Microsoft Azure e Spark Databricks! Este vídeo é para qualquer profissional ou entusiasta em tecnologia que deseja criar pipelines de dados robustos e eficientes. Vamos mostrar como otimizar seu workflow em Engenharia de Dados, explorando cada etapa do ETL do início ao fim. 🚀"
    Descubra como se tornar um Engenheiro de Dados com o Método Data Pro:
    metododatapro....
    Covid dataset: www.kaggle.com...
    #engenhariadedados #pyspark #microsoftazure

ความคิดเห็น • 38

  • @Codifike
    @Codifike  2 หลายเดือนก่อน +1

    Descubra como se tornar um Engenheiro de Dados com o Método Data Pro:
    metododatapro.codifike.com.br/

  • @irislenesilveira7662
    @irislenesilveira7662 24 วันที่ผ่านมา

    aula maravilhosa

    • @Codifike
      @Codifike  23 วันที่ผ่านมา

      Que bom que gostou! 😊

  • @danilocod
    @danilocod 2 หลายเดือนก่อน +1

    Parabéns pelo video, direto ao ponto!
    Valeu!

    • @Codifike
      @Codifike  2 หลายเดือนก่อน

      Eu que agradeço

  • @thiagolopes5496
    @thiagolopes5496 ปีที่แล้ว +2

    Professor, não faltou o sr. criar a tabela para receber o bronze?

  • @flaviocarvalhokato6109
    @flaviocarvalhokato6109 ปีที่แล้ว +1

    Excelente conteúdo! Obrigado por compartilhar seu conhecimento.

  • @leonardolima389
    @leonardolima389 4 หลายเดือนก่อน

    Que sorte ter encontrado seu canal, muito bom!

    • @Codifike
      @Codifike  4 หลายเดือนก่อน

      Muito obrigado 😊

  •  5 หลายเดือนก่อน

    Parabéns pelo conteúdo.

    • @Codifike
      @Codifike  5 หลายเดือนก่อน

      Muito obrigado

  • @RIQ3D
    @RIQ3D ปีที่แล้ว +1

    Faça um tutorial básico de Azure :D

  • @emersoncosta4168
    @emersoncosta4168 ปีที่แล้ว

    Muito bom mestre!

    • @Codifike
      @Codifike  ปีที่แล้ว

      Obrigado pelo elogio

  • @marceloDATA
    @marceloDATA 9 หลายเดือนก่อน

    Conteúdo sensacional!!!

  • @luizssilvaa
    @luizssilvaa ปีที่แล้ว

    Muuuito bom, parabens!!

  • @pedrod.santos7745
    @pedrod.santos7745 8 หลายเดือนก่อน

    deu até vontade de virara engenheiro de dados kkkkk parabéns pela aula, muito boa

    • @Codifike
      @Codifike  8 หลายเดือนก่อน

      Valeu obrigado

  • @caiquemascanha
    @caiquemascanha ปีที่แล้ว +2

    Faz um vídeo usando AWS

    • @Codifike
      @Codifike  ปีที่แล้ว +1

      Boa ideia

  • @luksfive
    @luksfive 9 หลายเดือนก่อน

    Parabéns pelo conteúdo. Um duvida que tenho é se eu conseguiria trabalhar com uma fonte de dados em PDF, tenho algumas monografias em pdf e gostaria de extrair algumas informações e armazenar em um banco de dados SQL.

    • @Codifike
      @Codifike  9 หลายเดือนก่อน

      Dá sim, mas é bem chato pode usar essa lib aqui github.com/chrismattmann/tika-python

  • @gutierres98
    @gutierres98 6 หลายเดือนก่อน

    Professor tudo bem? Quando vc faz o upload dos arquivos e comenta que "na sua empresa ja vai vir pronto" vc quer dizer por exemplo um processo de Apache Airflow? sou novato e estou tentando encaixar as ideias

    • @Codifike
      @Codifike  6 หลายเดือนก่อน +1

      O que eu quis dizer foi que provavelmente na sua empresa, o arquivo que será processado, já estará no diretório ou em algum local específico para o seu processo de etl executar. No exemplo do vídeo eu fiz esse processo de upload manual, mas isso será feito de maneira automática. O airflow será poderá ser usado para orquestrar cada passo do processo.

  • @LouvoresPauloRicardo
    @LouvoresPauloRicardo 4 หลายเดือนก่อน

    Data de "naiscimento" by Carioquês :D

  • @guilhermerodrigues8777
    @guilhermerodrigues8777 3 หลายเดือนก่อน

    uma pergunta, por que eu simplesmente não utilizaria o pandas neste caso?

    • @Codifike
      @Codifike  3 หลายเดือนก่อน

      Pois o pandas nao trabalha com dados em paralelo

  • @LozarTX
    @LozarTX ปีที่แล้ว +1

    caramba na hr que comecei a estudar spark jkkkk

    • @Codifike
      @Codifike  ปีที่แล้ว

      Show. Bons estudos

  • @nettoflorestal
    @nettoflorestal 4 หลายเดือนก่อน +1

    Igual ao colega abaixo,, também encontrei um erro na criação da tabela externa. Vi outras pessoas reportando no Stack também, mas nenhuma solução funcionou aqui...
    [RequestId=61bdb970-001b-4f0f-b23e-efafafbe346d ErrorClass=INVALID_PARAMETER_VALUE] GenerateTemporaryPathCredential uri /mnt/azuredatabrickssinas/silver/sinas_fontes is not a valid URI. Error message: INVALID_PARAMETER_VALUE: Missing cloud file system scheme.

    • @vitormello5910
      @vitormello5910 2 หลายเดือนก่อน

      Fala amigo, tudo bem? Estou com o mesmo erro, você conseguiu encontrar uma solução?

  • @mozjdmconnection
    @mozjdmconnection ปีที่แล้ว +1

    Excelente video, mas estou com um erro
    [RequestId=61bdb970-001b-4f0f-b23e-efafafbe346d ErrorClass=INVALID_PARAMETER_VALUE] GenerateTemporaryPathCredential uri /mnt/azuredatabrickssinas/silver/sinas_fontes is not a valid URI. Error message: INVALID_PARAMETER_VALUE: Missing cloud file system scheme.

    • @nettoflorestal
      @nettoflorestal 4 หลายเดือนก่อน

      Também cheguei nesse ponto e ainda não consegui resolver. Conseguiu uma solução?

    • @josepaulo9054
      @josepaulo9054 3 หลายเดือนก่อน

      @@nettoflorestal eu tb