Core Databricks: Understand the Hive Metastore

แชร์
ฝัง
  • เผยแพร่เมื่อ 15 ส.ค. 2023
  • A core part of the Databricks ecosystem is the Hive Metastore which enables Spark SQL. But how does Hive work and how do you use it? How does Hive relate to the new Unity Catalog? Join me as I answer these questions and more.
    Support Me on Patreon Community and Watch this Video without Ads!
    www.patreon.com/bePatron?u=63...
    Link to slides, data, and code (Databricks Notebook in dbc format):
    github.com/bcafferky/shared/b...
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 29

  • @andrewpotts9948
    @andrewpotts9948 9 วันที่ผ่านมา

    That's the right level of detail that I needed. Well explained. Thank you.

  • @haseebjehangir3249
    @haseebjehangir3249 8 หลายเดือนก่อน +5

    Finally a video on databricks hive metastore which is well explained, thanks Bryan

  • @kvin007
    @kvin007 9 หลายเดือนก่อน +1

    Love the direct and clear content! Keep it going!

  • @soumyavema6515
    @soumyavema6515 8 หลายเดือนก่อน +2

    Pretty clear ...very much needed before exploring Unity catalog ....Waiting for the next

  • @JLRocco43
    @JLRocco43 9 หลายเดือนก่อน +2

    I was just pondering on doing a deep dive in this today and reading a lot of docs and then you put out the video 😂 awesome work Bryan!

  • @martalopezjurado
    @martalopezjurado 8 หลายเดือนก่อน +1

    I love this video!! thanks a lot.
    Waiting for the unity catalog video!

  • @etianemarcelino5706
    @etianemarcelino5706 9 หลายเดือนก่อน

    Great content... Like always

  • @danhai7276
    @danhai7276 9 หลายเดือนก่อน

    Great video, waiting for the next one unity catalog.🙌

    • @BryanCafferky
      @BryanCafferky  9 หลายเดือนก่อน

      Yeah. There's a lot to Unity Catalog. Also doing Databricks AI Assistant which is very cool.

  • @sujitunim
    @sujitunim 8 หลายเดือนก่อน

    Thanks Bryan for this amazing session

  • @renegade_of_funk
    @renegade_of_funk 9 หลายเดือนก่อน

    You’re doing the Lord’s work. 👌

  • @mehulkhare8278
    @mehulkhare8278 2 หลายเดือนก่อน

    Thanks for making it simple to understand.

    • @BryanCafferky
      @BryanCafferky  2 หลายเดือนก่อน

      You're Welcome! Glad it helped.

  • @rabeMa
    @rabeMa 5 หลายเดือนก่อน

    Deadly clear, awesome 👌👌👌💯💯💯

  • @nargesrokni6348
    @nargesrokni6348 8 หลายเดือนก่อน

    very good explanation, thank you very much man

  • @vinit.khandelwal
    @vinit.khandelwal 7 หลายเดือนก่อน

    This gave real good idea

  • @ravinarang6865
    @ravinarang6865 หลายเดือนก่อน

    Very Good.

  • @fundu78
    @fundu78 5 หลายเดือนก่อน

    Superb! thank you.

  • @benjaminwootton
    @benjaminwootton 8 หลายเดือนก่อน +1

    Good video. Though I understand Hive Metastore, it confuses me why everything in data has a dependency on it. For instance, Iceberg seems to need it for everything even though it’s supposed to be a self describing table format.

    • @BryanCafferky
      @BryanCafferky  7 หลายเดือนก่อน

      Technically, you don't need the Hive metastore to read Delta tables. But it provides a look up to where the table is physically stored. Otherwise, you need to provide the full path to the storage location. It also stores schemas for files that don't have built-in schemas like CSV and Text files.

  • @pal3201
    @pal3201 5 หลายเดือนก่อน +1

    Can you tell us when are you releasing your take on Unity Catalog ? Looking forward to it.

    • @BryanCafferky
      @BryanCafferky  5 หลายเดือนก่อน

      So many things to cover these days. Hopefully, soon. Thanks!

  • @jbab9618
    @jbab9618 2 หลายเดือนก่อน +1

    Hi @BryanCafferky if CSV file meta data is change then hive metastore automatically update metadata in hive store, is it right else we can do any steps for refresh metadata ?

    • @BryanCafferky
      @BryanCafferky  2 หลายเดือนก่อน +1

      A Hive table definition over a CSV file is read only and to get the meta data reloaded, I believe you would need to drop and re-create the table.