Мониторинг в высоконагруженных (и не только) проектах: сравнительный анализ существующих решенийЛогирование и мониторинг

Доклад принят в программу конференции
Евгений Потапов

Генеральный директор компании ITSumma, 10 лет обеспечивающей круглосуточную техническую поддержку веб-сайтов. В настоящий момент на поддержке более 10000 серверов, сайты на которых посещает более 100 миллионов человек каждый день.

Выбор системы мониторинга - это практически holy-war-ная тема среди администраторов и разработчиков. Какая система лучше? Что удобнее? Какая система сможет выдержать большое количество статистики, а какая - лучше собрать и представить данные?

В своем докладе мы попробуем предельно непредвзято рассмотреть существующие решения и понять, что и когда можно использовать.

Прежде всего, мы постараемся сделать доклад не сравнением feature-листов, а рассмотреть особенности практического применения разных систем для конкретной задачи - для сайта, который не должен падать (а точнее - для возможности оперативно отреагировать на аварию, понять что к ней привело, и как можно ее исправить).

1) Что именно необходимо мониторить в высоконагруженном (и не только) проекте 24/7?
1.1) Мониторинг потребления ресурсов.
1.2) Статистика работы серверного ПО.
1.3) Бизнес-логика приложения.

2) Обзор существующих open-source (cacti,zabbix,graphite,nagios) систем мониторинга.
2.1) Сравнение возможностей.
2.2) Примеры конфигурирования для мониторинга типовых параметров сервера.
2.3) Плюсы, минусы, подводные камни.

3) Какие существуют SAAS-решения для мониторинга?
3.1) Описание отличий от open-source.
3.2) Примеры использования.
3.3) За и против использования SAAS.

Другие доклады секции Логирование и мониторинг