Ủa Database, Datalake, Data Warehouse là gì ? Giải thích bởi Senior Data Engineer

แชร์
ฝัง
  • เผยแพร่เมื่อ 5 ก.ย. 2024
  • Chào các bạn, ở video này mình giải thích cho về các khái niệm siêu cơ bản của Data Engineer: Database - Datalake và Data Warehouse nha. Bonus thêm DataMart và vai trò của Data Engineer, Data Analytics, Data Scientist khi làm việc với hệ thống nữa.
    Một số thuật ngữ mà mình sử dụng: OLTP, OLAP, Snowflake, Star Schema, Data Modeling
    Fanpage: dataguy...
    About me: www.calvinio.c...
    Chúc mọi người xem video vui vẻ.
    🐻 a b o u t 🐻
    Mình tốt nghiệp thạc sĩ tại đại học quốc gia Singapore chuyên ngành Data Science (Khoa học dữ liệu). Mình từng làm Data Scientist được khoảng 2.5 năm tại một tập đoàn tự động hóa lớn nhất nhì thế giới. Hiện tại mình đang làm Senior Data Engineer ở Grab Singapore với 5 năm kinh nghiệm. Hy vọng những video của mình sẽ giúp đỡ các bạn phần nào đó bước trên con đường Data này.
    Credits:
    Feelin Good by Kevin MacLeod được under license Creative Commons Attribution (creativecommon...)
    Source: incompetech.co....
    Artist: Kevin MacLeod (incompetech.com/)
    #dataengineer #datawarehouse #datalake

ความคิดเห็น • 71

  • @DataGuyStory
    @DataGuyStory  3 ปีที่แล้ว +5

    Cái mô hình từ Database - Datalake - Data Warhouse này là ELT nhé. Sorry mọi người

  • @DataGuyStory
    @DataGuyStory  3 ปีที่แล้ว +31

    Cám ơn ý kiến của một bạn, mình xin đính chính database là cơ sở dữ liệu chứ không phải hệ quản trị cơ sở dữ liệu nhé. Xin lỗi anh chị em :)

    • @ourworld7206
      @ourworld7206 3 ปีที่แล้ว

      Mình từ ngành khác - bây giờ muốn tìm hiểu data analyst thì mình bắt đầu từ đâu. Thks bạn.

    • @minhly650
      @minhly650 2 ปีที่แล้ว +1

      @@ourworld7206 Bắt đầu bằng việc học Python. Sau đó tìm hiểu về các library của Python dùng để xử lí và hiển thị dữ liệu là Pandas, Numpy...

  • @buiky6860
    @buiky6860 2 ปีที่แล้ว +2

    Cảm ơn anh về video. Rất ngắn gọn và dễ hiểu. Mong anh ra nhiều video hơn về ngành DE này ạ

  • @hoangtuyen2000
    @hoangtuyen2000 2 ปีที่แล้ว

    Tuyệt quá tìm mãi mới thấy anh để hiểu về cái này. Cám ơn a rất nhiều

  • @anguctung4176
    @anguctung4176 3 ปีที่แล้ว +1

    Video của anh không dài, tần suất ra ít, nhưng ra cái nào là chất cái đó :)))

  • @tiepchu6650
    @tiepchu6650 ปีที่แล้ว

    mong anh ra thêm video cần học và làm gì để có thể định hướng trở thành DE ạ. Xem vid của anh cuốn quá ạ !!!

  • @tuannguyenba9513
    @tuannguyenba9513 3 ปีที่แล้ว +1

    Giải thích và cho vd dễ hiểu, cảm ơn anh nhiều nhé, chúc a thành công ^^

  • @tongtran6024
    @tongtran6024 2 ปีที่แล้ว +3

    cảm ơn a ạ. Video rất hay, anh có thể làm một video hướng dẫn về ETL một cách chi tiết được không ạ.

  • @Peter-Donate
    @Peter-Donate 2 ปีที่แล้ว

    Video chất lượng cho người mới tìm hiểu như em anh ạ

  •  2 ปีที่แล้ว +1

    Cảm ơn anh rất nhiều!
    Chúc anh luôn thành công, hạnh phúc và gặp nhiều may mắn trong cuộc sống.
    Anh có thể làm video về quá trình sự nghiệp của anh được không ạ?

  • @Crackinglife2x
    @Crackinglife2x 3 ปีที่แล้ว +1

    Video rất hay, rất mong anh làm một video về xây dựng một data warehouse

  • @ngochuyentrinh5585
    @ngochuyentrinh5585 2 ปีที่แล้ว +1

    Anh giải thích dễ hiểu quá ạ

  • @jonnynguyen3087
    @jonnynguyen3087 2 ปีที่แล้ว

    Hay...mình kg phải chuyên ngành này nhưng cũng làm việc liên quan lên số liệu và data nên cần phân tích số liệu để đưa ra cái nhìn trực quan hơn .

  • @juhandvan
    @juhandvan 6 หลายเดือนก่อน

    Hay và dễ hiểu lắm anh. Cám ơn anh nhiều ạ

  • @ucnguyenang601
    @ucnguyenang601 3 ปีที่แล้ว +1

    Anh thêm các Tut trong chủ đề này nữa đi hả. Xem rất dễ hiểu, đúng là Senior có khác ạ

  • @04.thanhatphan75
    @04.thanhatphan75 3 ปีที่แล้ว

    Video nào của anh cũng chất lượng hết trơn ❤️❤️

  • @Ari_Peace68
    @Ari_Peace68 ปีที่แล้ว

    Video hữu ích lắm, cảm ơn Cảnh nhiều 👍👍👍

  • @divichuy2575
    @divichuy2575 3 ปีที่แล้ว +3

    anh có thể làm một ví dụ cụ thể nào đó về một quá trình ETL được không ạ, Cảm ơn anh

  • @tranduyphuc4045
    @tranduyphuc4045 3 ปีที่แล้ว

    cảm ơn anh về những chia sẽ ^^ hóng từng video một của anh

  • @tungminh159
    @tungminh159 3 ปีที่แล้ว

    Cảm ơn anh Cảnh. dễ hiểu và hữu ích lắm anh

  • @davidle1342
    @davidle1342 3 ปีที่แล้ว

    Video rất bổ ích. Cảm ơn Cảnh!

  • @PeddyNguyenishere
    @PeddyNguyenishere 3 ปีที่แล้ว +3

    úi database chỉ là dữ liệu cơ sở thôi chứ anh nhỉ? hệ qtri CSDL em nhớ là DBSM thì phải. Hy vọng trong tương lai a sẽ làm video emphasize rõ hơn role của Data Scientist khi liên hệ với business side ạ!
    Btw keep up with your good work anh, videos của anh rất dễ hiểu và xúc tích 👍👍

    • @DataGuyStory
      @DataGuyStory  3 ปีที่แล้ว

      DBMS, có đính chính lại ùi á :D

    • @vuhuynh4592
      @vuhuynh4592 3 ปีที่แล้ว +2

      là BDSM chứ =))

    • @mindset5228
      @mindset5228 3 ปีที่แล้ว +2

      "A database system, also called a database management system (DBMS), consists of a
      collection of interrelated data, known as a database"
      Sách Data Mining nè bác. Gọi như nhau.

  • @nhancao6515
    @nhancao6515 ปีที่แล้ว

    Video rất hay, cảm ơn anh.

  • @xemvido
    @xemvido ปีที่แล้ว

    Cảm ơn bạn, rất dễ hiểu ạ

  • @yourhealthyvegangirl7410
    @yourhealthyvegangirl7410 3 ปีที่แล้ว +2

    Hi ạ! Anh có thể làm video chia sẻ về AWS được không ạ? Giả dụ công ty đã sử dụng AWS rồi, thì có cần phải tuyển thêm Data Engineer, Data Analyst,.. nữa không ạ? Em cảm ơn anh!

    • @DataGuyStory
      @DataGuyStory  3 ปีที่แล้ว

      AWS chỉ là nền tảng. Không có DE, DA thì AWS đâu để làm gì em

  • @HungNguyen-ys3kj
    @HungNguyen-ys3kj 2 ปีที่แล้ว

    Ok, tôi đã bấm đăng ký kể từ video này

  • @BuiQuangChinh-BDCVT
    @BuiQuangChinh-BDCVT 2 ปีที่แล้ว

    anh ơi video rất bổ ích ạ. Nhưng ngoài ra a có thể nói thêm về các cách để chuyển từ datawarehouse sang datamart như nào không ạ???

  • @desolate_tunes__
    @desolate_tunes__ 3 ปีที่แล้ว

    Hóng video mới ạ! 😍

  • @tamhuynhthanh874
    @tamhuynhthanh874 3 ปีที่แล้ว

    cảm ơn video của anh, đúng lúc project có cái này luôn

  • @dpad-tinhhoatoanhoc4725
    @dpad-tinhhoatoanhoc4725 ปีที่แล้ว

    Still working as of today, ty!

  • @truongnv84
    @truongnv84 2 ปีที่แล้ว +1

    Anh có thể làm kèm theo demo được không ạ.

  • @dpad-tinhhoatoanhoc4725
    @dpad-tinhhoatoanhoc4725 ปีที่แล้ว

    Worked , thanks a lot!

  • @thenguyen5887
    @thenguyen5887 3 หลายเดือนก่อน

    a ơi, vậy nếu như mỗi cái nhu cầu báo cáo, phân tích khác nhau thì dữ liệu mình đổ vào data warehouse sẽ khác nhau, vậy thì với một datalake mình sẽ có nhiều data warehouse đúng k ạ

    • @DataGuyStory
      @DataGuyStory  3 หลายเดือนก่อน

      Data Warehouse chỉ có một thôi nhé. Nên người ta mới gọi là Single Source of Truth

  •  3 ปีที่แล้ว

    Hay quá b

  • @dinhkhoi8207
    @dinhkhoi8207 ปีที่แล้ว

    cám ơn bạn

  • @chiho7311
    @chiho7311 3 ปีที่แล้ว

    Rất chi tiết

  • @itranh9066
    @itranh9066 2 ปีที่แล้ว

    data lake co ve giong staging

  • @quannguyenthe3520
    @quannguyenthe3520 ปีที่แล้ว

    mình đanh vướng mắc ở phần OLAP, có ai support mình kh ạ 😢

  • @nightcorerelax2560
    @nightcorerelax2560 3 ปีที่แล้ว

    Cho mình hỏi mình học hệ thống thông tin làm về Data engineer dc k vậy bác ?

  • @angkhoanguyen7566
    @angkhoanguyen7566 ปีที่แล้ว

    Anh Cảnh cho em hỏi: Case thứ 2 nếu như extract từ Datalake ra Report và send email cho sếp. Nếu như mình ko cần lưu thì mình tới Data warehouse làm gì a nhỉ?

    • @DataGuyStory
      @DataGuyStory  ปีที่แล้ว +1

      Thông thường là đều lưu lại hết em. Còn nếu không cần lưu thì khỏi cần DWH nha

    • @angkhoanguyen7566
      @angkhoanguyen7566 ปีที่แล้ว

      @@DataGuyStory Thanks a. Anyway cho em hỏi về quá trình Ingestion, các phương thức Ingestion theo em tìm hiểu thì có Batch - Stream - ELT - API. Thì khi nào mình áp dụng phương thức cho mỗi DB vậy anh Cảnh nhỉ? Thứ 2 cho em hỏi về việc backup data ở trong Datalake, giữa real-time backup và T-1 backup thì cách thức hoạt động của nó sẽ như nào a ha?

  • @NguyenHuy-jw5yy
    @NguyenHuy-jw5yy 3 ปีที่แล้ว

    Cảm ơn anhh

  • @LongTran-Spacebar
    @LongTran-Spacebar 3 ปีที่แล้ว

    Awesome! More please !!!

  • @hiderrmark4019
    @hiderrmark4019 3 ปีที่แล้ว

    data Science can trang bi nhung gi ha a , e cam on a

  • @anhbui3759
    @anhbui3759 3 ปีที่แล้ว +1

    From Toi di code dao with love

  • @lokito5338
    @lokito5338 2 ปีที่แล้ว

    anh cho em hỏi data load vô data lake sao lại là ETL vậy anh? Vì theo em biết thì quy trình ETL không có support data lake thì phải.

    • @DataGuyStory
      @DataGuyStory  2 ปีที่แล้ว +2

      Nó là ELT đó em. Anh vẽ lộn cái lười edit đó

    • @DataGuyStory
      @DataGuyStory  2 ปีที่แล้ว +1

      Với anh có cái comment đính chính lại á em. 1 năm trước nên nó trôi mất tiêu thì phải

  • @loutruong
    @loutruong 3 ปีที่แล้ว

    Dạ a ứi, hiện tại bên Việt Nam một số bạn làm hệ thống crm có thêm một từ khoá là cdp customer data platform. A cho e hỏi đó là gì và sao câc bạn crm lại cho ra hệ thống đó ạ

    • @DataGuyStory
      @DataGuyStory  3 ปีที่แล้ว +1

      À, Customer Data Platform (CDP) là một hệ thống data riêng và phục vụ duy nhất cho Marketing team. Data Warehouse thì nó phục vụ toàn bộ công ty, còn CDP chỉ phục vụ cho một team, tối ưu cho việc marketing để segment khách hàng và target customers cho marketing campaign.
      Thường thì nếu công ty nhỏ mà xây dựng Data Warehouse chỉ cho việc phân tích dữ liệu Marketing thì có thể xài CDP. Còn nếu công ty lớn đã có sẵn Data Warehouse rồi thì việc xây dựng hệ thống CDP con từ DW có sẵn lại dễ dàng hơn nữa.

    • @loutruong
      @loutruong 3 ปีที่แล้ว +1

      @@DataGuyStory Dạ a, tại e làm mkt á a, lead của customer của e đổ vào trong CRM. Khi e cần visualize 1 cái ad hoc hypothesis thì các anh DE bảo sẽ là phải đổ vào trong CDP để làm sạch r từ đó e mới query ra thành bảng mà đi visualize lại

    • @DataGuyStory
      @DataGuyStory  3 ปีที่แล้ว +1

      @@loutruong mình nghĩ do bên bạn hệ thống data chủ yếu là cho marketing nên các bạn DE mới xây dựng CDP, phương pháp tốt nhất mà hiệu quả nhất rồi :)

  • @sockbenzero10
    @sockbenzero10 3 ปีที่แล้ว

    Data Engineer co phai cung la database manager lun khong anh

    • @DataGuyStory
      @DataGuyStory  3 ปีที่แล้ว

      Không em. Database là khác nữa

  • @ronme9636
    @ronme9636 3 ปีที่แล้ว

    giá mak biết sớm hơn về kênh

  • @BAGGame-be3rw
    @BAGGame-be3rw 3 ปีที่แล้ว

    được vl anh ơi :D

  • @dangtran9405
    @dangtran9405 3 ปีที่แล้ว

    hay vl, subscribe ngay và lon

  • @cuongnguyenquoc6309
    @cuongnguyenquoc6309 ปีที่แล้ว

    A học trường nào vậy ạ

  • @linh-phgvu
    @linh-phgvu 3 ปีที่แล้ว

    First like =))))

  • @ngochuyentrinh5585
    @ngochuyentrinh5585 2 ปีที่แล้ว +1

    Mình ở đây vì hông muốn giống bò :))))

  • @quoccuongnguyen9751
    @quoccuongnguyen9751 ปีที่แล้ว

    Vứt

  • @buison6454
    @buison6454 5 หลายเดือนก่อน

    Cô đọng và dễ hiểu.