Евгений Ермаков: Есть 2 стула - Data Vault и Anchor Modeling, на какой сядешь, на какой DWH посадишь

แชร์
ฝัง
  • เผยแพร่เมื่อ 23 พ.ย. 2024

ความคิดเห็น • 14

  • @ChristmasWave
    @ChristmasWave ปีที่แล้ว

    А зачем в центральной таблице сущности, где хранится сам бизнес-ключ нужно версионирование по utc_from_dttm? Изменяться же могут только атрибуты конкретной сущности в контексте определяющего ее бизнес-ключа.

  • @Vilka044
    @Vilka044 3 ปีที่แล้ว +6

    Название - топ!

    • @paulfunigga
      @paulfunigga 5 หลายเดือนก่อน

      для школьников, которые любят мемы и тикток

  • @sergeysukharev4939
    @sergeysukharev4939 ปีที่แล้ว +1

    Хранилище строится не по водопаду а по спирали. Я первый в России построил ХД по data vault, всего мною их построено три штуки, одно на 10 ТБ на технологиях ms sql, консультировался с Линстедтом, в конце концов я понял, что это полная хрень имеющая кучу недостатков в т.ч. и на загрузке - каждый сателлит - это по сути межленноменяющаяся размерность 2-го типа, при таблице в сотню гигабайт что бы закрыть датой предыдущую запись нужно её искать по всей таблице - это тяжелая операция. Второе dv не укладывается на MPP, некоторые пробуют, но получается плохо. Третье хешключи плохо индексируются, они и на простых базах то размазыватся по дискам в беспорядке, а что будет если их ещё и размещать по разным нодам MPP серверов? Разница между DV и Anchor в том, что первый строится от источника - снизу вверх, а второй сверху вниз т.е. от требований к анализу данных.

    • @paulfunigga
      @paulfunigga 5 หลายเดือนก่อน

      молодец, всем посрать, как видишь

  • @AndreyTulenev
    @AndreyTulenev 4 ปีที่แล้ว +1

    Такое впечатление что быстрая массовая загрузка данных - единственная цель многих оптимизаций. Это ж один раз делается, нужно ли подгонять под параллельную загрузку?

    • @ivani3237
      @ivani3237 2 ปีที่แล้ว +1

      в смысле один раз? Один раз в сутки ты имел ввиду?? А зачастую вообще непрерывно, real-time. Но да, оптимизация под загрузку - это как авто для драг-рейсинга. Едет быстро, но юзерам пользоваться невозможно

  • @НиколайРРРРР
    @НиколайРРРРР 2 ปีที่แล้ว

    непонятно, зачем атрибуты разбивать по разным таблицам. Вам разве нужно анализировать персон, у которых менялось только имя, а ничего другого не менялось? Почему имя и фамилия например в разных таблицах?

  • @aleksandra.6778
    @aleksandra.6778 4 ปีที่แล้ว

    А вот здесь 7:50 вообще на "Звезду" похожа
    "... не мышонка, не лягушку,
    а неведому зверушку..." Русская сказка
    Главное чтобы работало. Я тоже сторонник гремучих смесей. 👌

  • @jonnyradars
    @jonnyradars 4 ปีที่แล้ว +1

    А куда вы кладёте атрибуты связей между сущностями (Hub) в hNhM?

    • @antonbondar5632
      @antonbondar5632 3 ปีที่แล้ว +1

      тоже не понятно. Разве что атрибуты связи - это отдельный Hub и его добавляем к связи

    • @ivani3237
      @ivani3237 2 ปีที่แล้ว

      он сказал же, в отдельный саттелит прикрепленный к линку

  • @Sibbarb9
    @Sibbarb9 3 ปีที่แล้ว +2

    А зачем волосы красить

  • @MetaRussia
    @MetaRussia ปีที่แล้ว +1

    Почему у спикера лицо, как будто его через петушиную хату прогнали?