Assurance – важная составляющая интуитивных сетей Cisco

APC

Юлия Андрианова, менеджер по развитию беспроводных решений компании Cisco, начало свое выступление, которое касалось системы Assurance – следующего шага в развитии интуитивных сетей компании Cisco.

Сама концепция этого продукта произошла от SLA (Service Level Agreement) - соглашения об уровне предоставления услуги - это термин методологии ITIL, обозначающий формальный договор между заказчиком (в рекомендациях ITIL заказчик и потребитель — разные понятия).

SLA используется внутри организации для регулирования взаимоотношений между подразделениями, а также является основным инструментом непрерывной оценки и управления качеством предоставления услуг аутсорсинга специализированной организацией — аутсорсером. Как правило термин SLA используется применительно к ИТ и телекоммуникационным услугам. В таком соглашении может содержаться детальное описание предоставляемого сервиса, в том числе перечень параметров качества, методов и средств их контроля, времени отклика поставщика на запрос от потребителя, а также штрафные санкции за нарушение этого соглашения. Для того, чтобы соблюсти SLA, поставщик услуг в свою очередь заключает операционное соглашение об уровне услуг (OLA, operational-level agreement) с другими внутренними подразделениями, от которых зависит качество предоставления услуг. SLA может гарантировать определенный уровень обслуживания сети.

В переводе с английского слово Assurance означает «уверенность, гарантия» - это именно то, что должна дать ИТ-департаментам система Assurance. Это решение существует для центров обработки данных и для корпоративных сетей, последнее решение называется DNA Center Assurance, его задача состоит сокращении времени, которое ИТ-департаменты затрачивают на поиски неисправности и проблем в сети, по оценкам Cisco – это порядка 43% всего рабочего времени ИТ-специалистов.

Сегодня сети и их эксплуатация значительно отличается от того, что было на заре появления Интернета. ИТ – это значительно больше, чем только верификация пингов. Естественно, что сеть сегодня стала много сложнее и важнее для пользователей – это теперь кровеносная система любой организации. Часто, если сеть недоступна, бизнес практически останавливается.

ИТ-службы видят растущее давление со стороны бизнес-подразделений и клиентов. С одной стороны бизнес-подразделения должны двигаться очень быстро, они должны придумывать новые сервисы, в результате внедряются новые приложения в рабочую среду, привносятся новые устройства, датчики и сенсоры. На все эти изменения сеть должна также быстро реагировать. Пользователи не менее требовательны, она работают из любой точки Земли, с любого устройства, в любой время и все что тормозит их работу, ими рассматривается как неприемлемое.

Тем не менее сети тормозят, они не соответствуют ожиданиям бизнеса. У них медленная реакция на запросы изменений. ИТ уже сегодня тратит большую часть своего времени просто, чтобы сеть работала. Операционные расходы на эксплуатацию сетей сегодня уже в 2-3 раза больше, чем капитальные затраты, которые были произведены на закупку ИТ-сетей, и ситуация со временем только ухудшается. Аналитики пугают ИТ-отделы четырехкратным ростом числа мобильных устройств к 2020 году, всё это только увеличит сложность работы ИТ-служб. Напряженность работы подразделений информационной безопасности также постоянно возрастает.

Корпоративная сеть — это коммуникационная система, принадлежащая и/или управляемая единой организацией в соответствии с правилами этой организации. Корпоративная сеть отличается от сети, например, интернет-провайдера тем, что правила распределения IP-адресов, работы с интернет-ресурсами и т. д. едины для всей корпоративной сети, в то время как провайдер контролирует только магистральный сегмент сети, позволяя своим клиентам самостоятельно управлять их сегментами сети, которые могут являться как частью адресного пространства провайдера, так и быть скрытым механизмом сетевой трансляции адресов за одним или несколькими адресами провайдера. Корпоративную сеть, основанную на компьютерных технологиях, называют интранетом.

Пришло время, когда традиционный подход к сети уже всех не устраивает. После 30 лет работы, по словам Юлии Андриановой, компания Cisco, можно сказать заново изобрела корпоративные сети, которыми стало в разы управлять проще, чем это происходит ранее.

Эти новые сети постоянно самооптимизируются и защищают себя сами. В Cisco интуитивная сеть управляется и двигается вперед бизнес-намерениями, это сеть, которую информирует контекст, которая имеет повсеместно встроенную безопасность. В июне 2017 года Cisco сделала большой анонс интуитивных сетей и был он посвящен двум блокам: НАМЕРЕНИЯ и БЕЗОПАСНОСТЬ. Речь шла о DNA Center, о Catalist 9000, об аналитике шифрованного трафика. Все эти инновации дали возможность попрощаться с управлением IP-адресацией и увидеть угрозы, которые раньше определить было невозможно. Те клиенты, которые приобрели Catalist 9000, получили совсем новые возможности и увеличили производительность сети.

Коммутаторы серий Catalyst 9000 — это новая линейка коммутаторов, разработанная с учетом самых последних моделей работы — использования мобильных и облачных технологий, Интернета вещей, а также с обеспечением высокого уровня безопасности. Построены коммутаторы этих серий на новом Cisco ASIC UADP 2.0. Эта линейка включает в себя такие серии: Catalyst 9300 — следующее поколение коммутаторов доступа.

Интуитивная сеть – это абстрактная концепция, которую достаточно сложно объяснить.

Три основные функции этой концепции. Первая – ПЕРЕВОД. Цель интуитивной сети – в упрощении, сеть разделяется на два уровня, на транспорт и уровень сетевой фабрики для управления. Такая сеть предлагает интерфейс для перевода бизнес-задач в требуемые конфигурации. В простых понятных бизнесу категориях можно выражать намерения по политикам и правилам работающей сети. Например, только финансовый отдел и руководство имеют доступ к ресурсам финансовых серверов, только доктора и медсестры имеют доступ к записям пациентов, датчики и сенсоры «Интернета вещей» не имеют доступа к корпоративным базам данных. Эти намерения должны дальше транслироваться в конфигурацию всей сети, но необходимо удостоверится в целостности этих характеристик. В ручном варианте – это огромная работа. Интуитивная сеть это делает автоматически.

Вторая задача – АКТИВАЦИЯ. Многие клиенты делаю конфигурацию вручную и это то, почему внедрение нового приложения может занять очень много времени, иногда это месяцы. Автоматизация - это критически важная задача для ИТ-департаментов. Cisco хочет высвободить время ИТ-служб на то чтобы они играли более важную роль в стратегии компании. Активация означает, что политики доступа будут внедрены по всей сети и останутся неизменными, пока вы не решите их изменить.

Третья задача – Assurance, это то, что поможет изменить жизнь ИТ-службы, вместо того, чтобы гадать, что может случиться сегодня, где теперь будет очередной сбой при внедрении нового сервиса, теперь вы сможете с уверенностью сказать своим внутренним клиентам: «Сеть работает и ваш сервис доступен» или «Новый филиал успешно подключен». Но когда что-то пойдет не так, вы быстро увидите источник проблемы и решение.

Assurance – это гарантия того, что инфраструктура будет делать именно то, что она должна делать. Assurance выполняет три основных действия.

Первое – это ПОСТОЯННАЯ ВЕРИФИКАЦИЯ. Вы должны быть уверены, что сеть работает так, как она должна это делать. Был ли произведен корректный перевод бизнес-намерений в политики для технологий, были ли они успешно применены для сети. Изменения в сети или запуск нового приложения включает в себя большой комплекс задач и много времени уходит на тестирование и верификацию. Assurance осуществляет автоматическую верификацию.

Второй элемент – это ЗНАНИЕ и ПРОЗРАЧНОСТЬ. Каждый думает, если что-то не работает, то это проблема в сети. Эта часть Assurance помогает в поиске причины в реальном времени и в ретроспективе. В результате анализа вы сможете констатировать, что проблема не в сети и вы сможете это доказать. Это информация, которая поможет ИТ-службе избежать шквала звонков и моря проблем, потому что появится возможность отслеживать очень гранулярно состояние сети и наблюдать ее в динамике, сделать прогноз на будущее.

Следующий элемент – это КОРРЕКТИРЮЩИЕ ДЕЙСТВИЯ. Они используются для решения проблемы, время на решение проблемы – это ключевая метрика ИТ-служб и Assurance – это то средство, которое позволит автоматизировать решение проблем. Такое решение было бы невозможно реализовать просто на сетевых элементах, ее реализация требует полностью сквозной архитектуры, именно так это построено в интуитивных сетях Cisco.

Cisco представляет DNA центр Assurance, который дает полный обзор сети, обогащенный контекстом, который позволяет делать правильные действия. В сети Cisco используется концепция – «Все как сенсор». Агрегирование данных производится от сетевых элементов, из приложений, от клиентских устройств, от сенсоров, чтобы получить ИТ-службе исчерпывающую картину, чтобы сократить те 43% времени, которое уходит на поиск неисправности ИТ-подразделением. Самое востребованное использование этой системы - в области беспроводных сетей, это самая сложная часть сети для поиска неисправности, поскольку часть проблем может появляться и исчезать.

Теперь ИТ-службам станет много проще локализовывать проблемы. В этом им поможет DNA Center Assurance, который и будет собирать информацию с множества сетевых элементов, он также будет пользоваться Wi-Fi аналитикой с iOS-устройств. Компании Apple и Cisco давно ведут партнерство в области Wi-Fi-сетей и поэтому iOS-устройства поставляют дополнительную информацию о том, как они «слышат» беспроводную сеть и почему в устройстве произошел тот или иной сбой. Вся эта информация позволяет понять какие в сети проблемы или какие могут быть проблемы для клиентских устройств.

Еще один источник информации о сети – активные устройства Aironet. Это выделенные устройства, которые для сети эмулируют клиентские устройства. Точки доступа общаются друг с другом, но находятся они на высоте трех метров. Как клиентское устройство слышит сеть – этого в Cisco не знали, эту информацию могут дать сенсоры, которые вешаются в том месте, где наиболее важен клиентский сервис. Для Cisco – это еще один клиент, который постоянно тестирует сеть, постоянно следит за ее состояние и рассказывает о том, что слышит. Активными сенсорами также могут быть любые точки доступа Aironet.

Получать информацию о сети помогает 360-градусный контекстный граф (360 Contextual Views), он дает полный спектр информации о состоянии сети. Следующий элемент – это ретроспективный анализ, он дает возможность как бы путешествовать во времени и переместиться в ту точку времени, когда случилась проблема. И третий элемент – это навигация по решению: вы теперь не просто знаете какая у вас была проблема, когда и где она произошла, не только получаете по ней весь возможный контекст, но система подсказывает как решить эту проблему. DNA Assurance также контролирует устройства «Интернета вещей» – сенсоры-датчики.

Как же работает DNA Center Assurance?

Во-первых, производится сбор потоковой телеметрии с более 16 источников, по словам Юлии Андриановой, это количество будет расти, вся эта информация предоставляется в DNA Center, после чего она обрабатывается мощным движком с корреляцией и анализом, в результате ИТ-службы получают информацию о причинах проблем в сети. Система накапливает эту информацию для того, чтобы оценивать тренды и прогнозировать будущее. Можно найти более 100 типовых проблем и система дает возможность их решить в автоматическом режиме. Концепция «Все как сенсор» говорит о том, что любое устройство в сети дает нам информацию для DNA Center Assurance.

Теперь посмотрим как работает DNA Center Assurance в динамике.

Четыре города подсвечены зеленым цветом, значит там с сетью все хорошо.

DNA Center сразу предлагает оценить здоровье сети, он дает данные по сети и по клиентам. В данном случае оценки по здоровью оказались равными 95%, система также подсказывает какие обнаружены ошибки в сети – это routing, а с клиентами проблемы в беспроводной части.

Система тут же дает Top-10 проблем, которые произошли за выбранный период времени, в данном случае за сутки.

Внимательно рассмотрим одну из проблем с беспроводных клиентом. Как видно на экране, клиентское устройство подключалось слишком долго и не смогло подключиться, предположительно по причине плохого «радио», что-то случилось с радиоэфиром, что не позволило осуществить on bording. Система предлагает статистику: время подключения к сети приемлемое, значительно ниже 10 секунд, пик в 48 секунд, который образовался для двух беспроводных клиентов, – это аномалия. Видно на экране к какой точке доступа подключался клиент, где это было территориально. Система предлагает корректирующие действия. Можно проверить не перемещался ли клиент, он мог начать подключение, а потом стал отходить от точки доступа и качество подключения стало плохим для завершения процедуры. Можно сделать обновление, можно проверить радиообстановку именно в том месте, где произошел сбой. Эти действия нельзя выполнить автоматически. Как только мы выполним некоторые действия вручную, сразу увидим полный отчет по этим действиям.

На следующем рисунке даны высказывания клиентов по поводу работы с системой Assurance.