IT для среднего и малого бизнеса

HPE Nimble нового поколения и его поддержка

Начал свое выступление Алексей Казьмин, менеджер по продуктам HPE Hybrid IT в России, с описания СХД Nimble Storage. Сегодняшний портфель систем хранения данных HPE, по данным аналитической компании IDC на протяжении всего 2017-2018 года HPE прочно занимала первое место в России, в некоторых кварталах с двукратным отрывом от ближайших конкурентов. На сегодня в портфеле HPE находятся продукты любых классов и сегментов.

Рис. 1.

На рис. 1 слева находятся системы MSA, абсолютный бестселлер в классе систем начального уровня, которые хорошо могут подойти для СМБ сектора российского рынка. Чуть правее находится гиперконвергентная система HPE Simplivity, сочетающая в себе как функции СХД так и функции вычислителей, систем резервного копирования и так далее.

В крайнем правом углу расположились hi end СХД HPE XP7, которая обеспечивает доступность на уровне 99,99999%, высокую производительность, расширенную репликацию данных, функции аварийного восстановления и возможности переноса данных по сети. Программное обеспечение HPE XP7 High Availability обеспечивает непрерывный доступ к данным HPE XP7 даже в случае сбоя всего ЦОДа, благодаря чему показатель надежности повышается до 99,999999999999%. Значения надежности HPE XP7 (99,99999% и 99,999999999999%) определены с помощью инструмента автоматизированной оценки иерархических символьных моделей надежности и производительности (SHARPE), который моделирует и прогнозирует общую доступность системы, используя метод непрерывных цепей Маркова (CTMC). Одно устройство HPE XP7 способно одновременно поддерживать открытые системы, мейнфрейм и HPE Integrity NonStop.

Также по середине рис. 1 расположилась система 3PAR и массивы Nimble нового пятого поколения.

Система поддержки HPE InfoSight обслуживает СХД 3PAR и распространяется на другие массивы линейки, на вычислительные и сетевые решения. Системы резервного копирования StoreOnce и Nimble изначально имеют в своем составе возможности интеграции с различными облаками, как частными, так и публичными. Они обеспечивают простое перемещение данных между основным и резервным ЦОДами и облаком.

Рис. 2.

 

Nimble Storage

Для Nimble и 3PAR действует программа, в которой обеспечивается лицензирование «все включено» без сюрпризов, поэтому спустя 2-3-5 лет лицензия все еще действует, поскольку она бессрочная и включает в себя весь функционал, ограничен только срок поддержки.

Nimble Storage характеризуется тремя главными тезисами: надежная производительность, радикальная простота управления и поддержки, встроенные функции гибкой мобильности данных.

Рис. 3.

Кстати, большинство апгрейдов у этого СХД происходит без остановки массива. Стоимость поддержки не зависит от срока этой поддержки, т.е. если вы покупаете поддержку на год и она стоит Х рублей, то если покупаете на 3 года, то она стоит 3Х рублей.

При покупке массива можно за небольшую часть стоимости этого массива купить сервис, по которому через три года вам будут поставлены как запчасть и заменены новые контроллеры, с гарантией конкретного прироста производительности и массив снова станет на поддержку на 2 или 3 года (есть два варианта этих опций).

Рис. 4.

В 5-м поколении Nimble Storage делается особенный упор на гарантию эффективности хранения данных Stor More Guarantee. СХД готово к Storage Class Memory и NVMe, т. е. шасси и внутренняя плата готовы к работе с будущими контроллерами с поддержкой новых типов накопителей. В этом обновленном шасси стоят новые контроллеры, которые дают по сравнению с предыдущим поколением прирост производительности от 40% до 220%, что весьма приятно, с учетом того, что новые массивы стоят столько же, сколько и предыдущие. Также дедупликация возможна и на гибридных массивах.

 

Поддержка InfoSight

По словам Алексея Казьмина, миссия Nimble Storage изначально была не только в том, чтобы сделать новую СХД, а еще и в том, чтобы сделать СХД с такой поддержкой, «которой бы все завидовали» и которая называется InfoSight. Эта поддержка строится на нескольких основополагающих принципах: систем собирает телеметрию со всего окружения массивов Nimble Storage и 3PAR посредством гипервизора VMware, который собирает информацию с хостов и операционных систем, установленных на этих хостах, и с самой СХД. Эта телеметрия передается регулярно, ежедневно в большое облако Nimble, где, используя инновационную базу данных Vertica, эти данные в режиме реального времени постоянно обрабатываются с помощью алгоритмов математической статистики и предсказания случайных событий. Поле сбора этих многочисленных данных из них строятся паттерны и корреляции, которые позволяют предсказывать проблемы, которые могли бы возникнуть у заказчиков. Но сотрудники HPE не дадут им возникнуть, потому что если подобная проблема случилась у одного заказчика, InfoSight не даст ей возникнуть у других. InfoSight в автоматическом режиме установит причину произошедшего.

Рис. 5.

Выгоды, которые можно получить от использования InfoSight, представлены на рис. 5.

Ключевая составляющая InfoSight – это поддержка первого и второго уровня, которые полностью автоматизированы. Эта линия поддержки выполняет функцию сбора и первичной структуризации информации. Кроме того, в Nimble автоматизирован и анализ собираемых данных. В абсолютном большинстве случает кейс, возникший в Nimble, не выходит за рамки внимания этих самых роботов первого и второго уровня поддержки, которые работают в облаке HPE Nimble. Однако иногда возникают ситуации, когда сервисный кейс получается довольно таки сложным и требует внимания живого эксперта. Если хочется поговорить с таким реальным человеком, можно набрать номер телефона 8-800-301-6968 и попасть на инженера 3-го уровня поддержки. Он спросит серийный номер вашего массива Nimble или номер вашего сервисного контракта и затем постарается ответить на ваши вопросы, которые у вас накопились.

На рис. 6 представлена статистика работы с поддержкой Nimble.

Рис. 6.

Среднее время жизни кейса составляет 42 минуты, практически все кейсы закрываются за 8 часов.

Рис. 7.

Как видно из рис. 7, более половины источников сбоев лежат вне системы хранения данных. Кстати, здесь самый функциональный – это модуль интеграции с внешней средой, модуль InfoSight VMVision с виртуализацией VMware, который может следить за слоем виртуальных машин и коррелировать показатели жизни виртуальных машин, отмечать что происходит на массиве Nimble.

Самый видимый результат работы InfoSight – это автоматическое формирование «черного списка». Туда попадают тревожные ситуации, возникающие в каких-то конфигурациях массива Nimble с окружающими его системами при каких-то определенных настройках, при определенных версиях софта, например, с патчем на гипервизоре. И если какая-то из сумм таких факторов, складывается в пазл так, что приводит к проблеме, то эта конфигурация попадает в «черный список». И если InfoSight видит, что у какого-то пользователя конкретная инфраструктура приближается к конфигурации из «черного списка», то система об этом предупредит этого пользователя на отличном литературном английском языке. Так система работает по всему миру.

Рис. 8.

Алексей Казьмин уверен в надежной работе массивов HPE, которая дает следующую гарантию: если СХД недоступен по причинам, связанным с самим массивом, от 300 до 600 секунд в год, то вы получаете один месяц кредитов на работу наших инженеров, которые вы можете использовать, например, для управления и поддержки в дальнейшем. Если простой будет более 600 секунд в год, то вы получаете 3 месяца этих кредитов. InfoSight как раз и работает на обеспечение этой гарантии.

Поскольку растет инсталлированная база массивов, и теперь к инсталлированной базе Nimble прибавились массивы 3PAR, т.е. к 13 тысячам массивов Nimble добавилось еще десятки тысяч массивов 3PAR по всему миру. Из такой большой выборки InfoSight может делать гораздо более точные предсказания неисправности.

Также в Nimble встроена интеграция с лидирующими решениями для бэкапа, кроме того обеспечиваются встроенные мгновенные снимки и репликация между массивами для быстрого восстановления. Массив выдерживает выход из строя трех дисков в одной RAID-группе плюс изолирует сбойные секторы на диске и содержит запасные диски.

 

Запись и чтение в массивах Nimble

Далее слово взял Александр Грубин, технический консультант, HPE Storage HPE в России. Он начал рассмотрение того, как происходят процедуры записи и чтения в массивах Nimble. Они реализованы одинаково как для гибридных масcивов, так и для массивов All-Flash и с выходом нового поколения Nimble обеспечивается функционал дедупликации и компрессии в режиме он-лайн. Каждый массив Nimble имеет кэш на запись, реализованный в виде NVDIMM, такой кэш есть на обоих контроллерах. На рис. 9 для простоты нарисован один контроллер. И всегда все блоки, которые пишутся хостом на массив, попадают в этот кэш независимо от размера блока и независимо от того какой это массив. Попав в кэш на запись все блоки тут же зеркалируются на второй контроллер (на рис. 9 он не показан).

Рис. 9.

После этой процедуры хост получает подтверждение, что блоки данных были записаны. Затем происходит «мейджик», который обеспечивается архитектурой массивов Nimble. Все блоки, которые попали в кэш первого контроллера, подвергаются операции дедупликации и компрессии, причем это происходит адаптивно, т.е. подбирается блок переменной длины для дедупликации и после того, как это произошло, с этим блоком происходит компрессия. И если необходимо, есть возможность шифрования (на рис. не показано), но это встречается редко. После этого происходит сбор этих блоков в страйп размером 10 Мбайт, все это происходит в кэше NVDIMM. После сборки такого stripe с ним выполняются процедуры вычисления четности, это происходит по сути три раза, затем после выполнения процедуры вычисления четности выполняется запись полным страйпом на диски. Если это массив гибридный (Adaptive Flash), то запись осуществляется параллельно на Flash и на винчестерные диски (с моторчиком). Здесь выполняется две записи, чтобы данные остались на Flash – играет роль кэша чтения, и чтобы в дальнейшем данные были оперативно доступны, если это потребуется. Если массив - All-Flash, то происходит все то же самое, единственное сразу все пишется последовательно на дисковую подсистему SSD.

Рис. 10.

Какие преимущества имеет такая запись? Мы минимизируем количество операций Random write в бэкенде системы, мы, по сути, все делаем в оперативной памяти в кэше, таким образом мы минимизируем число операций ввода-вывода.

При необходимости провести операцию чтения в гибридном массиве Adaptive Flash, хост сначала будет получать данные из кэша, который организован на флэш-памяти, если там данных не окажется, то в этом случае массив полезет на уровень обычных дисков – будет искать на винчестерах, есть рекомендации каким должен быть размер флеш-памяти на гибридных массивах. Если им следовать, то это обеспечит необходимое соотношение (количество Гбайт флеша на количество Гбайт HDD), тогда мы сможем обеспечить отличную производительность и на чтение.

Рис. 11.

 

Производительность в гибридах не ограничена со стороны HDD

В случае с массивами All-Flash процедура чтения будет выполняться напрямую с дисков SSD, которая тоже будет осуществляться тоже очень быстро. Поэтому производительность в гибридных массивах не ограничена со стороны HDD, а за счет механизма сбора Random write мы можем получить производительность схожую с производительностью массивов All-Flash. Тысячи блоков записываются через NVDIMM и обрабатываются там с защитой по питанию, а потом записываются на диски большими последовательными страйпами. Последовательная запись помогает избежать механических задержек на дисках. Запись на массив минимально зависит от производительности HDD и максимально используются выгоды от дешевых NL-SAS-дисков. Таким образом мы стараемся избегать выполнять операции Random write на обычных дисках.

Что делать с массивами All-Flash, чтобы получить низкую стоимость хранения за терабайт и высокую производительность всего массива? Есть возможность отдельные данные разместить только на Flash-накопителе, т.е. положить целиком весь том на уровень Flash, чтобы данные совсем не писались на обычные диски, тем самым гарантировать этому тому скорость работы SSD. При этом надо учитывать размер доступной флеш-памяти и то, что если в таком режиме вы что-то делаете, то общий объем флеш-памяти уменьшается и для остальных данных размер флеш-кэш становится меньше. Но если вы решили использовать гибридные массивы, то можно сделать конфигурацию, в которой, например, целиком одну полку сделать Flash, тем самым сделать уровень хранения достаточной емкости и оставить большой кэш для остальных данных. В обычном режиме работы у нас есть рекомендации - 10% объема кеша должно быть от общего объема массива и в этом случае производительность будет очень хорошей.

Рис. 12.

Но можно сделать и наоборот, настроить так, чтобы минимальный объем флэша будет использоваться для томов, которым производительность не нужна, зато нужна низкая стоимость за терабайт. Каждый администратор решит самостоятельно каким приложениям нужна повышенная производительность гибридных массивов, а каким достаточно обычной производительности, а какие могут обойтись минимальной производительностью.

Преимущества архитектуры Nimble изображены на рис. 13.

Рис. 13.