Защита датацентров и данных от катастроф (Disaster Recovery - асинхронная и Metro/Stretch Cluster - синхронная репликация) на базе технологий NutanixТехнологии отказоустойчивости и катастрофоустойчивости
Технический директор и архитектор решений компании Nutanix по Восточной Европе и РФ.
Построение полной технической инфраструктуры множества высоконагруженных онлайн-проектов, включая Begun, Mamba, Innova, Badoo.
* RTO - Recovery Time Objective - максимальное время, за которое все ваши бизнес-задачи должны полностью быть восстановлены в работоспособное состояние после полной катастрофы ДЦ
RPO - Recovery Point Objective - максимально приемлемый для ваших задач промежуток времени, за который вы готовы потерять данные.
* Стратегии защиты и репликации ДЦ (1 to 1, 1 to many, many to many).
* Асинхронная репликация - наилучший выход с точки зрения производительности, единственно возможный вариант в случае значительного географического разнесения дата-центров (сотни и более километров). Работает на уровне виртуальных машин.
* Метро / "растянутые" кластеры - нулевой RPO, минимальный RTO, большие потери производительности и множество ограничений. Иногда - единственный выход, если уровень приложения не умеет реплицировать данные. Работает на уровне синхронизации датасторов (и всех записей в них).
* Лучший подход - комбинация репликации на уровне приложений, асинхронной и синхронной репликации.
* Технологии Нутаникс для решения подобных задач: DR, Metro cluster, Timestream.
* Timestream - "аналог" TimeMachine, безлимитное количество снапшотов данных без потери производительности и практически мгновенным восстановлением. Работает для всех основных гипервизоров, включая KVM.
* Полный контроль над политиками защиты.
* RESTful API для обеспечения DR / Metro / Timestream.
* Пример (с высоты птичьего полета) архитектуры одного из крупнейших за последние годы IT-проектов государственного / федерального масштаба в РФ, базирующегося на технологиях Nutanix и управляемого KVM Management tool, разработанной нашей компанией. Асинхронная репликация дата-центров на сотни километров, защита данных от реальных катастроф.