Creating an ETL Data Pipeline on Google Cloud with Cloud Data Fusion & Airflow - Part 1

แชร์
ฝัง
  • เผยแพร่เมื่อ 13 ธ.ค. 2024

ความคิดเห็น • 52

  • @rajeshiyer4999
    @rajeshiyer4999 4 หลายเดือนก่อน +1

    Thanks Vishal for the detailed pipeline design and development video. Great job.

  • @AR-by2lk
    @AR-by2lk 8 หลายเดือนก่อน

    Thank You Vishal for doing this. It will be definitely a great help! Kudos to you!

  • @LMGaming0
    @LMGaming0 4 หลายเดือนก่อน

    Very simple and well explained, thanks!

  • @royal_dsz
    @royal_dsz 2 หลายเดือนก่อน

    Thanks Vishal, this was very helpful

  • @zikoalexis2751
    @zikoalexis2751 9 หลายเดือนก่อน +1

    Thank you for the help

  • @asifshaharia2756
    @asifshaharia2756 3 หลายเดือนก่อน

    Im facing some problem. In my cloud fusion some of the field in phone_number, ssn is missing. And data of birth and password column is completely empty. Could you please help me troubleshoot it?

  • @basavrajningadali4919
    @basavrajningadali4919 4 หลายเดือนก่อน

    not getting mask data option in wrangler

  • @selvaarul8258
    @selvaarul8258 6 หลายเดือนก่อน +1

    awesome video, can you create complete composer airflow video for this one

    • @techtrapture
      @techtrapture  6 หลายเดือนก่อน

      Seperate playlist for Composer
      Cloud Composer - Airflow on GCP: th-cam.com/play/PLLrA_pU9-Gz22Zml5mxcszG4A9ecqWtd4.html

  • @abhisheknaidu8877
    @abhisheknaidu8877 7 หลายเดือนก่อน

    i am getting more environment error while connecting data fusion and python code has error

  • @lug__aman
    @lug__aman 24 วันที่ผ่านมา

    sir i have alot of csv data in my postgreSQL db i want to tranfer that data to bigquery with real-time data stream/processing which service I need to use can you please give me some context, I new in DE my company give me task

    • @techtrapture
      @techtrapture  23 วันที่ผ่านมา

      th-cam.com/video/L4Ad7RQYv4o/w-d-xo.html

    • @techtrapture
      @techtrapture  23 วันที่ผ่านมา

      You can use datastream
      th-cam.com/video/L4Ad7RQYv4o/w-d-xo.html

    • @lug__aman
      @lug__aman 23 วันที่ผ่านมา

      @@techtrapture but postgres me problem ho rhi replication ki kese krna h ye replication

  • @lmarwarl
    @lmarwarl 6 หลายเดือนก่อน +1

    Amazing video, unfortunately I have problems creating my cloud composer environment, maybe because I am in a free trial.
    I get this error after create the environment:
    CREATE operation on this environment failed 49 minutes ago with the following error message:
    Some of the GKE pods failed to become healthy. Please check the GKE logs for details, and retry the operation.

    • @Abracadanz00
      @Abracadanz00 6 หลายเดือนก่อน

      I'm having the same issue, any idea how to resolve it?

    • @lmarwarl
      @lmarwarl 6 หลายเดือนก่อน

      @@Abracadanz00 Nothing yet, but after searching a lot I read a post from Google that says you have to activate your billing account in GCP before creating the cloud composer environment.

    • @paranoya733
      @paranoya733 5 หลายเดือนก่อน

      @@Abracadanz00 If you want to use shorter free pipeline in this part 14:57 cut off these part: Cloud Composer, Cloud Storage, Cloud Data Fusion, BigQuery, and replace them with free short pipelines: google sheets (data) -> Looker Studio. If you extract API data, in google sheets add extension called "API Connector" configure it (search in youtube) -> looker studio

  • @vikascbr
    @vikascbr 3 หลายเดือนก่อน

    Thanks very helpful

  • @basavrajningadali4919
    @basavrajningadali4919 4 หลายเดือนก่อน

    i am not able to create composer env

  • @adijos92
    @adijos92 9 หลายเดือนก่อน

    cloud composer environment showing error and image version not showing while creating environment manually..is their any update

    • @adijos92
      @adijos92 9 หลายเดือนก่อน

      please reply on that

  • @anonymous8038-c4m
    @anonymous8038-c4m 5 หลายเดือนก่อน +1

    Fusion is not parsing the salary and many fields although they are in the csv

  • @TeekawinKirdsaeng
    @TeekawinKirdsaeng 8 หลายเดือนก่อน

    How to use gcloud in vs code?
    Error: gcloud : The term 'gcloud' is not recognized as the name of a cmdlet, function, script file, or operable program. Check the spelling of the name, or if a path was included, verify that the path is correct
    and try again

    • @techtrapture
      @techtrapture  8 หลายเดือนก่อน +1

      Install Google cloud SDK in your system . Use below link
      cloud.google.com/sdk/docs/install#windows

  • @yishanzhan6066
    @yishanzhan6066 8 หลายเดือนก่อน

    I got these errors "Cannot load filesystem: java.util.ServiceConfigurationError: org.apache.hadoop.fs.FileSystem: Provider org.apache.hadoop.hdfs.web.HftpFileSystem not found. Can not load the default value of `spark.yarn.isHadoopProvided` from `org/apache/spark/deploy/yarn/config.properties` with error, java.lang.NullPointerException. Using `false` as a default value." Any clues on how to fix it?

    • @figh761
      @figh761 8 หลายเดือนก่อน

      did you fix this

    • @akshaymantena6699
      @akshaymantena6699 5 หลายเดือนก่อน

      I'm also getting the same error, Did you fix it?

    • @Daswinian
      @Daswinian หลายเดือนก่อน

      I thinks it's permission issue. Try adding the following roles to the compute service account your datafusion uses
      Dataproc Service Agent
      Dataproc Worker
      Editor
      Service Account User

  • @TheIlyasqazi
    @TheIlyasqazi 25 วันที่ผ่านมา

    Can you please create another video to show how we can download excel data from sharepoint site. And load this data in BigQuery. And make this as daily job. Also it is possible to do this entire process through code using Terraform. Thanks

    • @techtrapture
      @techtrapture  25 วันที่ผ่านมา +1

      You came up with project requirements not video 😀

    • @TheIlyasqazi
      @TheIlyasqazi 20 วันที่ผ่านมา

      😂

    • @TheIlyasqazi
      @TheIlyasqazi 20 วันที่ผ่านมา

      I heard this kind of real time requirement for many places and many forum. So thought to share with if you could help. But same time I am also trying. Thanks for all educational videos.

    • @sivaramsathiamoorthi87
      @sivaramsathiamoorthi87 2 วันที่ผ่านมา

      @@techtrapture Bro please it will be great of you if you provide this 😄🙏

    • @aiwinmanuel7313
      @aiwinmanuel7313 14 ชั่วโมงที่ผ่านมา

      I would suggest using automation tools like Blue Prism for this.

  • @abdulfasith7905
    @abdulfasith7905 6 หลายเดือนก่อน

    Nice video, can you create a pipeline using server / serverless dataproc.?

  • @SasankPasupuleti
    @SasankPasupuleti 5 วันที่ผ่านมา

    Do a project for elt as well

    • @techtrapture
      @techtrapture  5 วันที่ผ่านมา +1

      Sure ,soon will do it

    • @techtrapture
      @techtrapture  3 วันที่ผ่านมา +1

      Here you Go -
      th-cam.com/video/rIUWbSXjKe4/w-d-xo.html

  • @renvils
    @renvils 6 หลายเดือนก่อน

    Great video as always ! Can you do make a timestamp for this video ?

  • @Alfred_vinci
    @Alfred_vinci 9 หลายเดือนก่อน

    in place of Airflow i want to use Mage ai.

  • @promitdutta3029
    @promitdutta3029 9 หลายเดือนก่อน +1

    composer shows "This environment has errors"

  • @fatallny
    @fatallny 7 หลายเดือนก่อน

    thank you!!

  • @punk77777
    @punk77777 9 หลายเดือนก่อน

    kindly make this kind of pipeline ETL video with the {GCS-->(COMPOSER---DATAFLOW)--->BIGQUERY}

    • @techtrapture
      @techtrapture  9 หลายเดือนก่อน +1

      It's already there
      th-cam.com/video/UXJxcWgxwu0/w-d-xo.html

    • @VthePeople4156
      @VthePeople4156 9 หลายเดือนก่อน

      Please explain total project 3-5 sentences for interview purpose
      Like
      what is the flow of project,
      Which gcp services used for project
      How u developed all different modules by using all different GCP services...

    • @Rajdeep6452
      @Rajdeep6452 9 หลายเดือนก่อน

      @@VthePeople4156 Cant you see and tell? Does he have to spoon feed you now? your parents still wash your ass?

    • @VthePeople4156
      @VthePeople4156 9 หลายเดือนก่อน

      @@Rajdeep6452 yes

    • @Rajdeep6452
      @Rajdeep6452 9 หลายเดือนก่อน

      @@VthePeople4156 idiot xD

  • @flosrv3194
    @flosrv3194 6 หลายเดือนก่อน +1

    its written gcloud is not an executable so your login stuff doesnt work with everyone and you did stuffs before without telling it in video. please next time show everything from scratch, i mean for real, not saying but doing it in reality too

    • @techtrapture
      @techtrapture  6 หลายเดือนก่อน

      Apologies if I missed. You need to install gcloud/ cloud SDK first to execute your command.