Build a poor man’s data lake from scratch with DuckDB

แชร์
ฝัง
  • เผยแพร่เมื่อ 26 ม.ค. 2025

ความคิดเห็น •

  • @GeorgePampalis
    @GeorgePampalis หลายเดือนก่อน +3

    Please consider doing an updated version of this video, perhaps using Delta Tables as a storage format!

    • @dagsterio
      @dagsterio  หลายเดือนก่อน

      Thanks for the call out George! Just added to our content planning calendar

  • @vikramtatke5930
    @vikramtatke5930 9 หลายเดือนก่อน +3

    As a person with just 2 years of experience my mind was blown watching this.
    I am a single person writing code in my department so I don't have any seniors to learn from but I'm leading a data engineering project that deals with terabytes of data and each request is multiple times larger than the server's RAM and multiple such requests need to be processed in parallel to complete stuff in time.
    Also, we have the tiniest possible budget to aggregate 25 to 30 columns and billions of rows every day. Also, we need to cut down on costs.
    This was super helpful.

  • @marcosoliveira8731
    @marcosoliveira8731 ปีที่แล้ว +1

    Really good stuff! A lot of good ideas.

  • @tobiaspucher9597
    @tobiaspucher9597 7 หลายเดือนก่อน

    Awesome!!! Please more!

  • @alembics
    @alembics 2 ปีที่แล้ว +1

    Great video, thanks!

  • @ImperialTerrain
    @ImperialTerrain 2 ปีที่แล้ว +1

    thank you pete

  • @gw1284
    @gw1284 ปีที่แล้ว +2

    Thanks for this demo. Can you comment on what role polars may play in this?

    • @hwy9nightkid
      @hwy9nightkid ปีที่แล้ว +1

      polars is akin to pandas or spark dataframes.. a way to organize your tables of data , if im not mistaken

    • @marcosoliveira8731
      @marcosoliveira8731 ปีที่แล้ว

      As pandas alternative.

  • @gauravlotekar660
    @gauravlotekar660 2 ปีที่แล้ว

    aawwwseome.