ELK: менеджмент логов, быстрая локализация проблем / Сергей Шумов (News360)

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 ก.ย. 2024
  • Приглашаем на конференцию HighLoad++ 2024, которая пройдет 2 и 3 декабря в Москве!
    Программа, подробности и билеты по ссылке: clck.ru/3DD4yb
    --------
    Презентация и тезисы:
    www.highload.ru...
    Сначала несколько слов про предпосылки задачи.
    1. Что нам завещали деды: zcat | cut | sort | uniq -c | sort -nr .
    2. Сборка логов: syslog-ng, rsyslog etc.
    3. Ок, давайте сделаем все правильно.
    Полезные фичи Elastic & Kibana.
    Несколько кейсов, где Кибана выступает отлично.
    Метрики и дашборды: тут они с graphite примерно одинаково гибки, но упомянуть об этом надо.
    Кратенько об альтернативах, плюсы-минусы.

ความคิดเห็น • 27

  • @kardonov
    @kardonov 3 ปีที่แล้ว +2

    Интересная схема, прям ответ на многие мои вопросы по поиску причин ошибок в сложных многокомпонентных системах 👍

  • @megadrigter
    @megadrigter 3 ปีที่แล้ว +1

    Супер выступление! Сразу погрузился в тему, что это и зачем это.

  • @ceperagrey
    @ceperagrey 5 ปีที่แล้ว +2

    Очень интересный доклад. Приятно послушать профессионала.

  • @agoalofalife
    @agoalofalife 2 ปีที่แล้ว +5

    00:37 Что такое ELK?
    02:16 Основные требования к логам
    03:41 Рассказ о старом способе анализа логов (grep, file, console)
    04:37 Плюсы и минусы этого подхода, сборка лог файлов из разных сервисов в централизованное место
    7:33 Проблемы централизованного хранения лог файлов из разных сервисов в одном месте
    09:32 Важность Структурированного лога
    12:52 Почему выбрали JSON для логов
    13:31 Особенности ElasticSearch(ES)
    16:07 Практика создания индексов в ES для логов
    17:18 Kibana, Агрегация данных, Поиск
    23:24 Kibana: просмотр хронологии пользователя в сис-ме
    24:42 Пример с выявлением аномальных пользователей на основе данных из Kibana
    25:50 Kibana Исследование всплесков, стратегические метрики
    29:34 Kibana Dashboard - чем полезен?
    31:05 Как и что логировать
    32:19 Fluentd - альтернатива Logstsh
    33:27 Наш Logging pipeline
    34:55 Альтернативы ELK
    36:42 Потребление ресурсов
    37:55 Вопросы
    37:58 Сколько у вас Node в elastic search кластере?
    39:30 Как настроен alert?
    40:41 Нет потери данных при отправке по udp в вашем logging pipleline?
    41:22 Вопрос по схеме
    42:42 Что такое шард в elastic?
    44:19 Какая у вас нагрузка
    45:10 Почему использовали fluentd а не rsyslog ?
    46:20 Когда вы понимаете, что настало время для масштабирования?
    47:33 Храните ли логи в файлах и как долго?
    48:10 Решаете ли вы проблемы сетевой связности или недоступности( в вашем случае fluentd), гарантия доставки логов?
    48:52 Не понятно как на всех этапах вашего logging pipeline сохраняется персистентность и гарантия доставки данных?
    50:33 На каком этапе вы обрабатываете multiline сообщения?
    51:50 Если вместо elastic поставить clickhouse а вместо kibana -> grafana? На сколько это перспективно?
    53:53 Как осуществляется контроль доступа к elasticsearch?
    54:44 Ваш Fluentd принимает логи в json или нет?
    56:51 Где формируется сквозной Id в вашей микросервисной архитектуре?
    57:30 Рассматривали ли вы graylog как альтернативу?
    58:07 Какой запас надежности кластера вы держите для elasticsearch?

  • @zhukov.aleksei
    @zhukov.aleksei 6 ปีที่แล้ว +10

    За человека с 800 шардами и 400 успешными прямо страшно, брать какую-либо БД не ознакомившись с основными концепциями однозначно плохая идея.

  • @АлексейМосковский-ш6у
    @АлексейМосковский-ш6у 4 ปีที่แล้ว +1

    Мощно! 💪😎👍

  • @Blowjin
    @Blowjin 3 ปีที่แล้ว +1

    Хороший вопрос...))))

  • @alik5907
    @alik5907 2 ปีที่แล้ว

    Требуется перезагрузка)

  • @zhpchshts_official
    @zhpchshts_official 6 ปีที่แล้ว +4

    Спасибо за видео. Звук нужно погромче.

  • @naikpatel6517
    @naikpatel6517 3 ปีที่แล้ว

    Доклад хороший! Но возможная потеря логов смущает.

  • @SynopsisLAB
    @SynopsisLAB ปีที่แล้ว

    картинка logstash (Я собираю логи), не совсем правильно, о вроде принимает....?
    собирают beat -ы

  • @SynopsisLAB
    @SynopsisLAB ปีที่แล้ว

    1 нода 15тыс сообщений, хмммм.
    у нас 5 нод, есть сервисы в debug-е подробно пишут за день сотни Мб логов каждый. Как вообще кластер живёт ещё непонятно.

  • @konstantinchvilyov9602
    @konstantinchvilyov9602 2 ปีที่แล้ว

    Что такое скул?

  • @БогданЛитвинов-и3х
    @БогданЛитвинов-и3х 3 ปีที่แล้ว

    привет

  • @konstantinchvilyov9602
    @konstantinchvilyov9602 2 ปีที่แล้ว

    Фиксики скулят логи? 😆

  • @zackevans5837
    @zackevans5837 5 ปีที่แล้ว +2

    Не помешало бы термины говорить по-русски. Вот например, сконкстанировать логи можно было бы объяснить проще, понятнее...

    • @sergezaigraeff8599
      @sergezaigraeff8599 5 ปีที่แล้ว +1

      Склеить несколько строк\фрагментов в одну строку.

    • @alexeystaroverov4804
      @alexeystaroverov4804 5 ปีที่แล้ว +17

      "сконкстанировать" прочел и стало страшно... потом понял что это сконкатенировать - ну не зная этого термина в ИТ мне кажется делать нечего, даже непонятно как ты мимо него прошел если хоть 1 книжку читал по языкам программирования ...

    • @DmitryStallion
      @DmitryStallion 2 ปีที่แล้ว

      @@alexeystaroverov4804 Задрота задело)))

    • @ZhandosKaz
      @ZhandosKaz ปีที่แล้ว +2

      @@DmitryStallion конкатенация - база в АйТи

    • @DmitryStallion
      @DmitryStallion ปีที่แล้ว

      @@ZhandosKaz есть огромное множество программистов, которые склеивают логи ничем не хуже, чем те, кто знает этот термин.