На прошлой неделе пользователи по всему миру столкнулись со сбоями в работе сервисов Google и Youtube, на которые пожаловались десятки тысяч человек. Сбой был разрешен в течение 45 минут после обнаружения причины. Николай Ганюшкин, CEO и основатель MONQ Digital Lab, вендора и поставщика первой AIOps-платформы родом из России MONQ, поделился результатами большого исследования основных болей ИТ-руководителей в крупных и быстрорастущих компаниях.
Даже Google сталкивается с ИТ-сбоями: что мешает спать CIO, IT-директору или product owner?
Николай Ганюшкин
Несколько фактов об исследовании
В исследовании приняли участие более 30 ИТ-руководителей крупных компаний – от СIO и руководителей отделов ИТ-инфраструктуры и мониторинга до продактов и специалистов департаментов информационной безопасности.
Глубинные интервью включали в себя вопросы об организации управления ИТ-инфраструктурой и цифровыми сервисами, частоте возникновения сбоев и оценке их влияния на бизнес, времени решения ИТ-инцидентов. Исследование проводилась в банках, телеком и ритейл-компаниях.
ТОП-болей ИТ-руководителя
Проблемы при ИТ-поддержке, конечно, зависят от индустрии, в которой работает компания, однако исследование позволило выявить общие для всех проблемы. Их десять:
Банки: фокус на self-service накладывает на ИТ совершенно другой уровень ответственности
Если говорить о специфике разных индустрий, то банки, безусловно, являются одним из самых развитых секторов в использовании ИТ. В этом сегменте на развитие ИТ-менеджмента влияют пять основных трендов:
Банки создают все больше продуктов, которые используются клиентами без участия операторов. В такой ситуации положение, когда что-то «зависло», становится критическим для финансовых результатов и репутации компании.
Качество сервиса должно быть на высоте, а реакция на возникающие инциденты — моментальной. ИТ-команды должны поддерживать абсолютную непрерывность работы цифровых сервисов, потому сбои в ИТ моментально отражаются на клиентах.
Это приводит к растущим KPI в части скорости реакции на инциденты.
В банках будущее за автоматизацией.
Банк — это сегмент, где это тренд наиболее заметен. Человек не может быстро и качественно обрабатывать огромный объем информации (до миллиона логов в день), генерируемый системами мониторинга.
В условиях, когда стабильность работы ИТ становится жизненно важной для бизнеса, поддержание «здоровья» ИТ должно исключать человеческий фактор. Роль инженеров — развитие, но не попытки заменить роботов.
Как часто случаются ИТ-сбои?
Лучше всего частоту сбоев охарактеризовали два респондента: «Мы сталкиваемся с крупными проблемами примерно один раз в месяц», «Сбои и инциденты — часть рабочего процесса».
ТОП болей банков при ИТ-поддержке:
Телеком: высокая зависимость от технологий при неповоротливости бизнеса… при все еще актуальной проблеме вандализма.
По словам участников исследования, телеком — один из сегментов, наиболее зависимых от ИТ («без технологий нам не выжить»). При это такие компании концентрируются на развитии продуктовой линейки и борьбе за завоевание и удержание клиентов из-за высокого уровня конкуренции на рынке.
Однако внедрение AI-технологий, упрощающих управление, может занять много времени из-за большого размера компаний и высокой разрозненности продуктов и инфраструктуры. Телеком Telco стремится к простой автоматизации, которая могла бы остановить бесконечное тушение пожаров.
Как часто происходят сбои?
В телекоме ситуация со сбоями может отличаться от компании к компании: есть те, кто высказываются о проблеме в ключе «тушим пожары каждый день». В других компаниях проблема не такая явная: «Я не могу сказать, что [сбои] случаются часто. Вероятно, пять-шесть раз в год серверы выходят из строя по неизвестной причине. Это напрямую не влияет на пользователей, они могут даже ничего не замечать, но это может иметь отсроченный эффект».
ТОП болей телекома при ИТ-поддержке:
которого сложнее отслеживать.
ошибок».
Ритейл: бум развития служб онлайн-заказов и доставки в пандемию
Все, кто был просто ритейлом, в 2020 году становится eCommerce. До пандемии ритейл, не связанный с электронной коммерцией, был менее развит и зависим от стабильности ИТ, однако коронавирус заставил многие компании перейти от офлайн-продаж к онлайн-заказам и доставке.
Фокус поменялся, новые крупные релизы происходят чуть ли не еженедельно. При этом сроки на переход были сжатые, и для ритейл-компаний, которые только в этом году начали активную цифровизацию, вопросы ИТ-поддержки еще являются новыми, а сбои в ИТ, причем как во внешних, так и внутренних сервисах – почти ежедневными.
Как часто происходят сбои?
«Аварии случаются примерно два раза в неделю» – как рассказал один из респондентов информирует своего руководителя о регулярных сбоях, которые могут затрагивать до 600 сотрудников, но не получает средств и полномочий для разрешения ситуации. В другой компании сбои случаются «хотя бы один-два раза в месяц … [это] непонятные отказы продолжительностью от получаса и более».
Однажды произошел длительный сбой во внутренней системе, который привел к миллионам убытков для компании.
ТОП болей ритейла при ИТ-поддержке:
Дальше только AI
Тренд на цифровизацию и усиление зависимости бизнеса от стабильной работы ИТ будет расти, поэтому проактивная работа с инцидентами, предсказание сбоев и решение проблем в корне станут для ИТ-руководителей фокусом, при этом нагрузка на инженеров поддержки будет расти в связи с усложнением и ростом инфраструктуры и сервисов. Увеличить эффективность ИТ-поддержки могут AIOps-решения, но как – это уже тема для другой статьи.
Фото на обложке: CoinUp/Shutterstock
Иллюстрации предоставлены автором.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Источник: https://rb.ru/
Average Rating