- Главная
- Про людей и команды
- Находим и устраняем причину, а не просто перезапускаем сервис
Находим и устраняем причину, а не просто перезапускаем сервис
Михаил Полютин
Операционное управление ИТ
— Меня зовут Михаил Полютин, и я возглавляю команду операционного управления ИТ. Наша цель — сделать работу команд быстрее и удобнее, а бизнес — защищённым от рисков.
Структура направления
— В направлении операционного управления ИТ работают 7 специалистов, а также коллеги из Hotline — первой линии реагирования. Мы выстраиваем надёжные и управляемые процессы, которые позволяют быстро устранять сбои, сокращать простои и поддерживать высокий уровень качества ИТ-сервисов.
Чем занимаемся?
Реагирование на инциденты Быстрое выявление и устранение сбоев — наша ключевая задача. Когда возникает сбой, мы собираем нужных экспертов, координируем всех участников, запускаем восстановление и доводим процесс до нормального состояния. Снижение времени простоя для компании — главное, что отличает зрелую ИТ-поддержку.
Постинцидентный анализ и улучшения Когда система снова работает — работа только начинается. Мы разбираем причину сбоя, проводим Post Mortem, выявляем “узкие места” и устраняем их, чтобы инциденты не повторялись. В результате бизнес становится увереннее, а инфраструктура — надёжнее. Мониторинг и автоматизация Не только следим за системами сами, но и строим сервисы, которые делают это без нашего участия. Всё, что можно автоматизировать — автоматизируем: интегрируем логи и метрики, развиваем систему "зонтичного" мониторинга Monq, чтобы собирать единый пул событий и быстрее реагировать.
Управление изменениями Всё новое в продуктиве — зона риска. Мы проверяем готовность, проводим комитеты по изменениям, даём "зелёный свет" только безопасным решениям, оптимизируем и ускоряем процессы согласования. Всё ради того, чтобы изменения приносили только пользу.
Кризисное реагирование и поддержка пользователей В любой сложной ситуации наша команда выходит на передний план: консультирует пользователей, координирует действия команд, поддерживает Hotline (первую линию), помогает наладить коммуникацию между всеми участниками процесса.
Какие технологии используем?
— В работе применяем современные системы мониторинга (например, зонтичный мониторинг Monq), инструменты для автоматизации реагирования, интеграцию логов и метрик для создания единой среды наблюдения. Используем системы оповещения, автоматизацию процессов восстановления, а также средства для быстрой эскалации и координации между ИТ-командами.
Цели на ближайшее время
— В фокусе выстраивание предоставления достаточных сервисов для заказчика, выстраивание управления доступностью и мощностями.
Структура направления
— В направлении операционного управления ИТ работают 7 специалистов, а также коллеги из Hotline — первой линии реагирования. Мы выстраиваем надёжные и управляемые процессы, которые позволяют быстро устранять сбои, сокращать простои и поддерживать высокий уровень качества ИТ-сервисов.
Чем занимаемся?
Реагирование на инциденты Быстрое выявление и устранение сбоев — наша ключевая задача. Когда возникает сбой, мы собираем нужных экспертов, координируем всех участников, запускаем восстановление и доводим процесс до нормального состояния. Снижение времени простоя для компании — главное, что отличает зрелую ИТ-поддержку.
Постинцидентный анализ и улучшения Когда система снова работает — работа только начинается. Мы разбираем причину сбоя, проводим Post Mortem, выявляем “узкие места” и устраняем их, чтобы инциденты не повторялись. В результате бизнес становится увереннее, а инфраструктура — надёжнее. Мониторинг и автоматизация Не только следим за системами сами, но и строим сервисы, которые делают это без нашего участия. Всё, что можно автоматизировать — автоматизируем: интегрируем логи и метрики, развиваем систему "зонтичного" мониторинга Monq, чтобы собирать единый пул событий и быстрее реагировать.
Управление изменениями Всё новое в продуктиве — зона риска. Мы проверяем готовность, проводим комитеты по изменениям, даём "зелёный свет" только безопасным решениям, оптимизируем и ускоряем процессы согласования. Всё ради того, чтобы изменения приносили только пользу.
Кризисное реагирование и поддержка пользователей В любой сложной ситуации наша команда выходит на передний план: консультирует пользователей, координирует действия команд, поддерживает Hotline (первую линию), помогает наладить коммуникацию между всеми участниками процесса.
Какие технологии используем?
— В работе применяем современные системы мониторинга (например, зонтичный мониторинг Monq), инструменты для автоматизации реагирования, интеграцию логов и метрик для создания единой среды наблюдения. Используем системы оповещения, автоматизацию процессов восстановления, а также средства для быстрой эскалации и координации между ИТ-командами.
Цели на ближайшее время
— В фокусе выстраивание предоставления достаточных сервисов для заказчика, выстраивание управления доступностью и мощностями.
Поделиться
Стать частьюкомандыIT-металлургов
-
Разработка
-
-
Консультанты ИС
-
ML/DS/AI
-
DevOps/SRE
-
Информационная безопасность
-
-
-
Управление данными
-
Инфраструктура
-
Аналитика и архитектура
-
-
Управление проектами
ДРУГИЕ
ИНТЕРВЬЮ
Все интервью -
Мы смогли выстроить процессы на очень современном стеке, а не сидеть на легаси вечно
Юрий Дворжецкий Backend-разработкаЧитать интервью -
Создали собственную дизайн-систему, а не мучились с неподходящей нам Material UI
Олег Рогов Frontend-разработкаЧитать интервью -
Видим систему в целом, а не только отдельные частности
Антон Ильин Solution-архитектураЧитать интервью -
Улучшаем пользовательский опыт, а не просто обновляем старые системы
Ирина Седова Гильдия UI/UXЧитать интервью