HPE OneView взгляд в недалекое будущее

APC

Сегодняшнее мероприятие ведет Александр Светлаков, сотрудник компании Hewlett Packard Enterprise, отвечающий за направление HPE Synergy и HPE OneView. 

План мероприятия изображен на следующем слайде.

Компануемая платформа HPE Synergy пришла на смену blade серверам HPE С-класса. Вендор закончил производство и поставку инфраструктурных компонентов, шасси, модуля управления, коммутационных модулей, но до конца года он будет поставлять сами серверы С-класса.

Об увеличении требований к ИТ-инфраструктуре говорит следующий слайд.

Ответом здесь выступает автоматизация. Нужно как можно больше автоматизировать повседневные операции запуска инфраструктуры в эксплуатацию и конфигурирование, обслуживания поддержки, уменьшить влияние человеческого фактора, стандартизировать операции с помощью шаблонов (т.е. выполнять операции по отработанному проверенному шаблону, чтобы быть уверенным нужном результате). 

Рассмотрим типичный процесс ввода в эксплуатацию некоего сервера. Следует установить сервер в стойку, подключить к нему кабели питания и коммутации, включить питание сервера, настроить BIOS, обновить firmware компонентов в зависимости от того, какую информационную систему будете ставить. Настроить подключение сервера к сетям Ethernet, настроить подключение к сетям Fibre Channel, выделить том на СХД и установить ОС. С каждым сервером такой процесс повторяется. И здесь лучший способ, который был доступен ранее, документировать этот процесс с тем, чтобы получать всегда необходимый результат.

С blade серверами, как минимум, несколько шагов из этого списка убирается. Здесь не надо устанавливать сервер в стойку и подключить кабели питания, если сервер устанавливается в шасси. И для blade серверов возможно автоматизация и других шагов,  как настройка и подключение к сетям Ethernet и Fibre Channel, если blade сервер использует модули Virtual Connect. 

И, если полностью использовать функционал HPE OneView для blade серверов или для стоечных серверов, и, тем более, для HPE Synergy, где OneView является неотъемлемой частью, у нас остается всего лишь один шаг - применить серверный профиль из заранее созданного шаблона. 

Таким образом, все шаги конфигурирования и подготовки сервера к эксплуатации заменяются на один единственный шаг. И после этого надо лишь установить ОС любым способом, например, традиционной загрузкой с дисков, загрузкой с USB или с microUSB.

Какие повседневные ИТ операциях администратор серверной инфраструктуры регулярно выполняет? Контроль обновления драйверов и прошивок. Поскольку инфраструктура весьма динамична, поскольку регулярно выпускается Upgrade к ОС, необходимо регулярно обновлять wifmware и драйверы. В чем важные отличия HPE Synergy от традиционных стоечных серверов. Если для традиционных стоечных серверов вы можете совершенно безболезненно обновлять отдельный компонент, но рекомендуется устанавливать сервис пак, то для HPE Synergy это не просто рекомендуется, это становится обязательным. Обязательно нужно устанавливать update на HPE Synergy - Synergy Software Releases Satemy. 

Для HPE Synergy совершенно критично устанавливать сбалансированный пакет в BIOS сервера версии iLO, версии firmware для сетевых адаптеров, для RAID-контроллеров и т.д. Подавляющее большинство сервисных заявок по HPE Synergy связаны как раз с тем, что программные компоненты Synergy вошли в несоответствие друг с другом. Версия HPE OneView не соответствует версии BIOS сервера, например. Так что, всегда программные обновления нужно устанавливать именно пакетами.

Контроль и обновление firmware драйверов, наверное, самая распространенная задача, с которой вы обращаетесь в поддержку с просьбой улучшить, облегчить эти повседневные операции. И для этого у вендора есть две основных утилиты. Сбор и актуализация инвентарной информации, что где находится, где стоит какое оборудование, какой состав аппаратных компонентов - всегда это необходимо иметь под рукой.

Изменение параметров подключения к сетям Ethernet и Fibre Channel 

Что-то изменилось в настройках VLAN, например, и вам нужно внести изменения. Здесь очень впечатлил рассказ одного из заказчиков HPE, у которого много blade серверов C-класса с модулями Virtual Connect под управлением OneView и была одна корзина blade серверов другого производителя. И вот, добавить VLAN на все blade корзины C-класса заняло примерно полчаса и не потребовало перезагрузки серверов. А с blade шасси другого производителя администратор занимался больше недели. Потому что потребовалась перезагрузка всех серверов в данном шасси. Уже видно, как технология Virtual Connect облегчала управление инфраструктурой уже несколько лет назад. Сейчас в наших продуктах автоматизации становится все больше с каждым месяцем.

Конфигурирование аппаратных компонентов по запросу внешних систем управления

Большое внимание уделяется интеграции OneView и Synergy с платформами управления частными облаками, с платформами DEVOPS, когда нужные фрагменты инфраструктуры под приложения выделяются буквально несколькими командами или скриптами, это экономит значительное количество времени.

Контроль аппаратных сбоев и взаимодействие со службой поддержки HPE Безусловно, аппаратные сбои время от времени происходят, и крайне важно устранять их как можно быстрее, а лучше предотвращать. И лучше обнаружить и устранить аппаратные сбои до того, как они привели к проблемам в работе приложений и сервисов. И нужно отслеживать выход новых сервисных обновлений. Подобные бюллетени выходят довольно часто, но понять, какие именно из них относятся к вашей инфраструктуре довольно сложно. И, к сожалению, чаще всего вы узнаете о том, что какие-то обновления необходимо было установить тогда, когда уже пришлось открыть сервисный кейс. Было бы гораздо разумнее проактивно узнавать о том, что необходимо сделать именно для вашей инфраструктуры.

Также всегда требуется контроль и обновление самих средств управления, самой консоли OneView компоузера Synergy применительно к сегодняшней теме.

OneView охватывает все перечисленные выше аспекты: ПО, предназначенное для подготовки серверов к установке ОС, для постоянного мониторинга состояния систем, обновления с помощью шаблонов, потому что обновления firmware, драйверов, OneView автоматизированы. Развернув серверы из шаблонов, вы видите, какие из них неконсистентны в данной конфигурации и планируете для них перезагрузку. OneView управляется либо через графический интерфейс, либо через скрипты Power Shell и интегрируется с решениями партнеров, что дает право называть данный подход как «инфраструктура как код». Мы предоставляем инфраструктуру по запросу приложений.

OneView дополняется решением Global Dashboard. Это приборная панель, к которой подключаются все OneView компоузеры организации. Global Dashboard ставится один на организацию, с ним легко контролировать состояние всей инфраструктуры, состоящей из нескольких сотен, или даже тысяч серверов. Но Global Dashboard потребуется даже в самом случае, если у вас есть Synergy и есть стоечный либо blade сервер C-класса, поскольку есть два вида OneView: в виде виртуальной машины для контроля стоечных серверов и blade инфраструктуры, и в виде компоузера в виде аппаратного средства для контроля управления Synergy. OneView встроит функционал удаленной технической поддержки. Сервисные заявки открываются напрямую из OneView, и там же их можно контролировать. А сервисные заявки, открытые для всей организации, можно контролировать с помощью Global Dashboard.

Развертывание серверов OneView реализуется с помощью шаблонов. Шаблон для развертывания серверов подготавливают совместно администраторы серверной, администраторы сетей хранения и администраторы сетей. Иногда это одни и те же люди, но в больших организациях этим занимаются разные специалисты. И вот, один раз согласовав несколько типов подключения серверов к сетям, и дальше новые серверы развертываются с помощью данных шаблонов. 

Каждый новый сервер единообразно подключается к внешним сетям, получает одни и те же настройки, и в дальнейшем его поведение, его состояние контролируется с помощью шаблонных профилей серверов. Скажем, вышло обновление VMware новый сервисный Pak. Он применяется к шаблону профиля, и дальше вы оцениваете, какие серверы у вас неконсистентны, планируете перезагрузку для установки всех компонентов. Для наших серверов потребуется всего одна перезагрузка для установки всех необходимых обновлений. Update заранее закачиваются на сервер. И вы планируете одну перезагрузку для того, чтобы эти изменения вступили в силу.

Как дальше видится процесс автоматизации контроля-обновления драйверов и firmware? Сейчас, например, в OneView присутствует удобная консоль для контроля соответствия версий для серверов Gen 9 и Gen 10. Какие шаги планируются далее? Автоматическая загрузка необходимых обновлений, исходя из того, какая конфигурация имеются. Чтобы не скачивать лишнее обновление, а скачивать именно то, что соответствует вашей конфигурации. И в перспективе, к 2022 году или может быть, несколько позже, мы стремимся к полной автоматизации обновления драйверов и firmware. Поскольку на стороне data-центра есть машины, на стороне вендора есть машины с ИИ, постоянно обучаемые. Пусть машины между собой сами разберутся, какая версия им необходима, не вовлекая в это ни администраторов инфраструктуры на одной стороне, ни службу поддержки на другой стороне. Пусть машины договариваются сами между собой. А человеку останется лишь проконтролировать процесс перезагрузки серверов, чтобы не произошло влияние на работу сервиса. 

Например, вышла новая версия iLO для всех серверов, в том числе для Synergy. При попытке установить эту версию iLO для Synergy сервера встроенная проверка укажет, что эта версия еще не совместима с Synergy Software Releases Set и не даст установить данное обновление. Но пока это все же отдаленное будущее.

Централизованный мониторинг и автоматизированная поддержка

Для того, чтобы видеть, что происходит с серверами на разных площадках, а иногда и на одной площадке, но с разными типами серверов, нужно установить консоль OneView Global Dashboard. Это может быть Appliance VMware, но дополнительного лицензирования для Synergy он не требует. И OneView Global Dashboard масштабируется до 75 платформ, но по факту это зависит от количества систем, которые мониторит данный OneView или компоузер. Если, например, у вас большое количество шасси Synergy, например, 150 шасси Synergy, и в каждом стоит по одной паре композеров, то все 150 можно подключить к OneView Global Dashboard, и иметь возможность мониторить окружение из такого большого количества систем. Так что 75 платформ - это ограничение довольно условное для тех случаев, когда каждое OneView или каждое Synergy управляет большим количеством систем.

OneView Remote Support - встроенный функционал автоматического открытия сервисных кейсов и контроля их выполнения.  OneView Remote Support не требует лицензирования, и даже если вы скачали бесплатную версию OneView, хотя OneView всегда один и тот же, что на мониторинг, что на управление, вы просто подключаете сервер либо на мониторинг, если у вас нет лицензии, либо на управление, если она у вас есть. OneView Remote Support работает и для систем, подключенных на мониторинг. Работает даже и в том случае, если нет действующей гарантии, но тогда кейсы не открываются. Но тем не менее, вы подобные сообщения видите в системных журналах. С базовой гарантией вам OneView Remote Support Suport откроет кейс, просто его будут обрабатывать согласно регламенту для стандартной поддержки, а это реакция инженера на следующий рабочий день.

iLO Amplifier Pack, с одной стороны, это средство альтернативное OneView для контроля и обновления драйверов и firmware. Если у вас окружение только из стоечных серверов, то возможно вам использовать iLO Amplifier Pack будет удобнее. С другой стороны, iLO Amplifier Pack используется и для систем под управлением OneView и для систем под управлением Synergy с целью передачи системных журналов в облако HPE InfoSight, в платформу искусственной аналитики HPE InfoSight. Каждый сервер передает свой статус каждые 10 минут. И один раз в сутки, около 2 часов ночи по локальному времени iLO Amplifier Pack инициирует отправку журнала телеметрии каждого сервера. 

InfoSight накапливает аналитику, обнаруживает несовместимые комбинации, уведомляет о том, что необходимо срочно обновить firmware, например, на жестких дисках, уведомляет о несоответствии ваших версий firmware драйверов, показывает список всех ваших систем, подключенных к InfoSight, и для стоечных серверов сейчас InfoSight начал автоматически регистрировать сервисные заявки. (Это если не используется OneView.) 

Чуть позже, может быть в течение года, будет интеграция и с OneView Remote Support. Сервисный кейс может открыться либо там, либо там. Но это не будет дублироваться сервисный кейс, открытый InfoSight, сервисным кейсом, открытым OneView. Очень важно, что специалист службы поддержки уже имеет доступ к истории вашего сервера, уже имеет логи вашего сервера, уже может быстрее и эффективнее работать по вашему кейсу.

Что вендор предлагает в самой свежей версии OneView 5.3? Интеграцию с InfoSight. Называется данная утилита OneView Analytic for InfoSight. И OneView может передавать данные о конфигурации и телеметрии от тех устройств, которые мониторит OneView. В отличие от InfoSight, который транслирует журнал телеметрии просто отдельно по каждому серверу, OneView дополняет эти данные данными о конфигурации всего окружения, которое OneView мониторит. Передает эти данные в InfoSight, и проверяет облако InfoSight на предмет рекомендаций.

Мы сделали пока первый шаг, на основании данных о конфигурации подбираются сервисные бюллетени Customer Advisory и Security Bulletin в базе, и вас уведомляют о том, что для этой конфигурации актуальны такие и такие бюллетени. Т.е. уже на этом этапе InfoSight сможет распознать нехорошие комбинации драйверов и firmware и своевременно вас уведомить. Но пока основная роль такого подключения - это собрать как можно больше данных для ИИ, для того, чтобы накопить информацию для анализа, для выдачи проактивных рекомендаций.

На предыдущем слайде приведен вариант подключения HPE OneView к HPE InfoSight.

Схему работы InfoSight можно представить следующим образом. В InfoSight поступает множество данных от оборудования, расположенного в ЦОДах от систем хранения данных Nimble, 3PAR, от операционного окружения. Особенно богатая аналитика передается от VMware решений. InfoSight инициирует открытие сервисных кейсов для систем хранения данных, для серверов, анализирует причины, какие-то неправильные комбинации драйверов, firmware, утилит, версий операционных систем, какие-то неправильные настройки подсоединения серверов к СХД, ошибки конфигурирования и совместимости. И чем больше InfoSight об этом узнает, тем эффективнее он выдает рекомендации для решения проблем. И есть возможность своевременно автоматически уведомлять о нехороших комбинациях, нехороших последствиях, которые могут быть с текущими конфигурациями. Сейчас, особенно для серверов, идет интенсивный процесс обучения, процесс тренировки машин для устранения аппаратных сбоев.

HPE Synergy

HPE Synergy поставляется на российский рынок с марта 2017 года и с тех пор было поставлено в Россию несколько тысяч серверов. 

За эти годы произошли существенные изменения в портфеле HPE Synergy. Вначале поставлялись серверы Gen9, потом серверы Gen10, последние уже пережили два обновления: первое поколение Intel Scalable processor с кодовым названием Sky Lake, затем произошло обновление на Intel Scalable processor 2-го поколения Cascade Lake и затем Cascade Lake Refresh.

40 гигабитная инфраструктура обновляется на 100 гигабитную. Партнерские решения Brocade 16G Switch поставляется и в дополнение к нему выпущен Brocade 32G Switch. Обновлена и инфраструктура управления в 2019 году, сейчас Composer первого поколения (продолжается его поддержка как минимум до апреля 2022 года) снят с производства и поставляется Composer2. Выпуская HPE Synergy вендор стремился сделать стабильным конструктив самого шасси, чтобы не пришлось, как в случае серверами С класса, несколько раз обновлять шасси и сигнальную панель для поддержки новых технологий, а обновлять только активные компоненты, такие как Composer нового поколения и модуль соединения шасси друг с другом и подключение сети управления HPE Synergy Frame Link. Контроль за состоянием системы HPE Synergy полностью возложен на Composer. Выпущен также четырехпортовый HPE Synergy Frame Link 10G SFP+. Всю платформу HPE Synergy вендор планирует производить, обновлять и продавать как минимум до 2030 года.

Следующее обновление для двухсокетных систем запланированы на апрель 2021 года, процессоры с кодовым названием Iсe Lake будут только для двухсокетных систем. Как только у Intel эти процессоры будут готовы, так сразу будет выпущен апдейт и будет выпущена новая версия Gen10 серверов. Тогда станет 4 разновидности серверов Gen10: на Sky Lake, на Cascade Lake, на Cascade Lake Refresh и Iсe Lake.

Зачастую задают вопрос: можно ли сервер, купленный с процессорами первого поколения перевести на процессоры 2-го поколения, ответ отрицательный, поскольку встроенные низкоуровневые прошивки, установленные в серверах с процессорами Sky Lake, не поддерживают процессоры Cascade Lake.

К четырехсокетному серверу HPE Synergy 660 Gen10 не применимо обновление Cascade Lake Refresh и не применимо обновление Iсe Lake, планируется, что он с текущими процессорами будет поставляться до 2023 года для данной четырехсокетной платформы.