Новые системы хранения данных для гибридной мультиоблачной инфраструктуры

APC

Сегодняшнее мероприятие проводит Денис Тужилкин, технический эксперт по системам хранения данных, IBM в России и СНГ. Его выступление посвящено анонсу новых систем хранения данных. 

Новые системы хранения данных способны хранить данных много больше, использовать искусcтвенный интеллект и решения для Big Data. Денис, расскажет о технологических и бизнес-преимуществах анонсируемых решений. Относительно недавно IBM провела ребрендинг и обновление своей линейки хранения данных.

Но сначала немного истории. В 2017 году для всей IT отрасли произошло событие, которое можно сравнить с переворотом, произошедшим в 1917 году в России. Фактически мировой экономический журнал признал, что ИТ стали полноценной производительной силой, от которой зависит развитие мировой экономики. И наиболее ценным мировым ресурсом стала не энергия, а информация. Такое изменение в производительных силах вызвало определенную последовательность изменений в окружающей нас действительности.

Так как информация стала одним из наиболее ценных ресурсов, от которого зависит рост бизнеса и будущая прибыльность, то происходит все большая цифровизация всех сторон жизни, и соответствующий рост объемов информации. При этом так как традиционный корпоративный сектор был хорошо централизован в прошедшее десятилетие, основной прирост данных происходит в новых отраслях. Это и мобильные мультимедийные приложения, это и доказательная медицина, это и Интернет вещей, автономное управление транспортом и т.д. 

И график этого экспоненциального роста данных упирается в тот объем носителей, которые способна предложить ИТ-отрасль. И на фоне этого роста произошла смена лидера в оперативном хранении данных. Т.е. изобретенные IBM почти 60 лет назад жесткие диски окончательно начали сдавать свои позиции примерно в середине 10-х годов XXI века. И можно констатировать, что за следующие 2-3 года из массового оборота жесткие диски неизбежно в среднесрочной перспективе будут изыматься. Это происходит благодаря тому, что технологии энергонезависимых электронных носителей смогли не только обеспечить достойную производительность, но и цену, которая устраивает широкие массы пользователей и практически все сегменты рынка. Кроме, к сожалению, сегмента корпоративных заказчиков. 

Поэтому IBM c 2011 года переориентировало свои исследовательские усилия на разработке нового поколения систем хранения данных. Процесс этот не был неким моментом озарения, когда IBM удалось сделать нечто волшебное. В течение нескольких лет производились определенные итерации, испытывались различные устройства, которые представлены на слайде. 

Методом проб и ошибок двигалась IBM к 2018 году и по итогам 5-летней обкатки этой новой технологии, было создано устройство, которое лежит в основе тех последующих быстрых изменений, которые IBM оказалась в состоянии совершить в прошедшее время. Это устройство называется IBM NVMe FlashCore Module и представляет собой корпоративный флеш диск.

После того, как был создан этот критически важный элемент всей будущей работы вендора определенного класса систем, IBM, начав со старших систем, полностью обнаруживает в ней свои наиболее массовые устройства, которые продавались под брендами Flash System Storwize. Получилась линейка, изображенная на следующем слайде.

IBM разработала FlashCore Module, потому что стандартных SSD недостаточно для корпоративных заказчиков. Тенденции современного рынка NAND-чипов плохо соответствует требованиям СХД корпоративного класса к производительности и надежности. Так как 80% новых объемов данных создаются в потребительском сегменте, то все производители NAND-чипов отдают приоритет разработкам для мобильных и бытовых устройств.

Все вендоры элементной базы для флеш чипов выпускают много по доступной цене, достаточно производительной, но не очень надежной памяти.

На следующих двух слайдах представлено портфолио IBM 2019 года (что было):

и портфолио IBM 2020 года (что стало).

IBM FlashSystem имеет два основных компонента: IBM Spectrum Virtualize и IBM Storage Insights. К преимуществам этих систем можно отнести производительность и эффективность, поддержку любых облачных технологий, их надежность и отказоустойчивость, они созданы для будущего.

Новая линейка IBM FlashSystem

На следующем слайде представлена новая линейка - IBM Enterprise FlashSystem. Младший уровень - это системы по сути являются продуктом ребрендинга. Реальные же инновации начинаются с уровня средних систем корпоративного класса, которые представлены устройствами под названием FlashSystem 5100 и FlashSystem 7200. И самые интересные инновации, они в категории - FlashSystem 9000 и FlashSystem 9000R.

Старшая система сделана в привычном для пользователей High-End форм-факторе. Начиная со среднего уровня систем хранения устройства полностью поддерживают ключевой элемент IBM FlashCore Module.

На слайде также изображена линия производительности. Согласно имеющимся предварительным данным, линейка систем хранения IBM подобрана таким образом, что каждая суммарная конфигурация каждой из следующих систем в линейке примерно в 2 раза производительнее, чем предыдущая система. Т.о. получается понятное по позиционированию и по возможностям расширения предложение, которое отличается не только производительностью, но и своими функциями, которые, чем старше система, тем они более продвинуты.

В то же время набор базовых универсальных функций для даже самой младшей модели, достаточно серьезный. Он раньше был присущ только системам хранения среднего и старшего классов. Т.е. обеспечивается мгновенное копирование, удаленная репликация, причем с поддержкой топологий, поддержка многопользовательского доступа, иерархическая миграция данных, поддержка контейнерных сред, все это определенная база, которая начинает присутствовать в линейке, начиная с самой младшей модели.

Со среднего уровня начинаются функции, которые востребованы в корпоративном секторе, т.е. кластеризация систем, которые служат для возможности модернизации существующих инфраструктур хранения и для обеспечения максимально возможной отказоустойчивости. В этих системах появляется аппаратное шифрование данных, возможность создания метрокластера и возможность оптимизации хранения за счет онлайн компрессии и дедупликации. 

Системы хранения старшего уровня, это уже не дисковые системы, в них механических дисков в принципе нет и быть не может. При этом это новое поколение аппаратной базы позволяет адаптировать не только существующие Flesh-устройства, но и новые поколения носителей, которые в индустрии называются Storage Class Memory (SCM). И для вот этих моделей, начиная c FlashSystem 5100, сохраняется возможность полноценной виртуализации внешних систем хранения. Т.е. они могут быть интегрированы в любую инфраструктуру хранения.

На этом слайде отображено кратное сравнение характеристик отдельных систем, тут следует обратить внимание, это что до красной линии, до системы FlashSystem 9200 возможны гибридные конфигурации, которые будут включать в себя не только электронные носители, но и механические диски во внешних полках. Для старших систем FlashSystem 9200 механические диски можно подключать только в режиме внешней виртуализации.

Линейка является конструктором по принципу лего, хотя, естественно, в младших моделях возможности конструирования ограничены, а в старших моделях эти возможности весьма велики: можно создавать 4-х узловые кластеры, они поддерживают будущие сети передачи данных 32-гигабитные.

 Что делать заказчикам, которые купили системы Flash System Storewize?

Им остается наслаждаться правильно сделанным выбором. IBM не снимает эти системы с поддержки и не приостанавливает поставку комплектующих для них. С другой стороны, IBM предоставляет пользователям Flash System Storewize возможность превратить их в флеш системы. Для этих систем возможен любой путь апгрейда. Те клиенты, которые купили Flash System Storewize второго поколения 5 лет назад сейчас могут превратить его во FlashSystem 9200 за одну итерацию либо путем последовательного добавления соответствующих узлов. Причем при добавлении узла флеш системы к кластеру Storewize, общее название системы меняется на FlashSystem. Клиенты без миграции данных, без добавления новых прикладных интерфейсов получают флеш систему.

FlashSystem поддерживают виртуализацию более чем 450 моделей внешних СХД.

SSD-диски с интерфейсом Serial Attach SCSI – это наиболее массовые устройства, они могут быть подключены к любым системам FlashSystem. Большинство систем поддерживает и гибридные конфигурации с механическим дисками.

Следующий класс устройств - это SSD диски с NVMe интерфейсом. Это то, что у многих производителей считается самым быстрым из доступных уровней хранения, у IBM же это один из рядовых уровней хранения, но он не даст особых преимуществ по сравнению с IBM FlashCore Module. Разница между ними заключается в том, что IBM FlashCore Module это все-таки корпоративный диск, скорее даже полноценная система хранения. И, т.к. его стоимость за килобайт полезной ёмкости сопоставима, а на некоторые модели даже дешевле, чем обычные NVMe SSD диски, его применение, по крайней мере технологически, всегда более предпочтительно. Для тех же заказчиков, которые хотят, чтобы система IBM была похожа на то, что представляют конкуренты, мы можем сделать любую конкурентную номинальную конфигурацию. 

И четвертый тип - это экспериментальные носители класса Storage Class Memory. Устройства эти пока все еще носят экспериментальный характер и пока непонятно, которое из них победит. Поэтому мы их рекомендуем использовать в составе гибридных полок для ускорения ввода-вывода в смеси с другими типами носителей. Т.к. это все же полноценные устройства хранения, мы для них можем предложить довольно широкий спектр использования. 

Теперь мы плавно переходим ко второму пункту преимуществ линейки Flash System, которые созданы для будущего и готовы к развитию в ближайшие 5-10 лет. Я уже упомянул волшебные слова, которыми жужжит IT-рынок. Эти слова - Storage Class Memory. Часто они воспринимаются многими как некая панацея от всех возможных задержек при операциях ввода-вывода.

Наиболее общее определение Storage Class Memory: это энергонезависимая электронная память, задержки при работе с которой для ОС и приложений сопоставимы с задержками оперативной памяти. Поэтому, если мы хотим провести сравнение носителей, претендующих на звание Storage Class Memory, то за точку отсчета надо взять производительность старой оперативной памяти DRAM. 

Как видно из таблицы, носителей типа Storage Class Memory не так много. Что показывает это сравнение? Наиболее распространенный Flash-носитель, сделанный по технологии 3D NAND Flash в состоянии на уровне своей конструкции обеспечить задержки над всеми измеряемыми десятками и сотнями микросекунд, но при этом задержки на запись для этого типа носителей измеряются миллисекундами. Это его архитектурная особенность, которую можно неким образом снивелировать, но нельзя полностью от нее избавиться. Т.е. на уровне записи современная Flash память работает со скоростью, сопоставимой с механическими дисками. На уровне операций чтения она работает в сотни тысяч раз медленнее, чем оперативная память. 

Следующее поколение физических носителей, которые будут позиционироваться как кандидаты в Storage Class Memory, это память, основанная на изменении фазовых состояний вещества, так называемые Fhase Change Memory. Устройства, которые используют этот тип носителей, производится компаниями Micron и Intel и называются Optane. Особенность этого типа памяти состоит в том, что скорость записи и чтения для их ячеек примерно одинакова, и для этих записей возможно проводить обновление информации в отдельных ячейках за достаточно короткое время. Это тип памяти показывает весьма стабильные результаты, измеряемые десятками микросекунд и для операции чтения, и для операции записи. Это, конечно, очень хороший показатель, но если сравнивать со скоростью энергозависимой оперативной памяти, то это все же получается почти в 1000 раз хуже. Поэтому утверждать, что Fhase Change Memory, в частности Optane, способны полностью заменить собой оперативную память, мягко говоря, будет лукавством. По крайней мере, на уровне тех физических характеристик, которые эти технологии обеспечивают сейчас. Возможно, в будущих поколениях задержки удастся снизить до уровня наносекунд, ну хотя бы сотен наносекунд, тогда уже такие заявления будут иметь под собой твердую физическую основу.

И третий тип памяти, который доступен на рынке, называется магнитно-резистивная память (Magneto-Resistive Memory, MRAM). Она по своим характеристикам наиболее близка к оперативной памяти. Т.е. задержки как на чтение, так и на запись для этой памяти измеряется десятками, максимум, сотнями наносекунд. Эти устройства поставляет разработчик этой памяти, которая является одним из OEM-партнеров компании IBM, поставщиком комплектующих, то наиболее близко к эпсилон-окрестности оперативной памяти по производительности и надежности попадает как раз магнитно-резистивная память. Соответственно, так называемая Fhase Change Memory, 3D-Xpoint, она скорее находится в области систем хранения. Поэтому IBM в своем дальнейшем развитии не планирует использовать память типа 3D-Xpoint в качестве именно уровня оперативной памяти, а сразу его внедряет как уровень хранения.

В FlashCore Module вендора уже два года магнитно-резистивная память используется в качестве оперативной. Т.е. FlashCore Modulе по сути представляет собой гибридную систему, состоящую из магнитно-резистивной памяти для кеширования операций записи и обеспечения функциональности SPG-контроллеров, и основной объем хранения, который размещается на стандартных нано-чипах. 

Этот дизайн по крайней мере лучше, чем кеширование с помощью Fhase Change Memory, потому что эта память заведомо быстрее. Т.е. вот в эту архитектуру FlashCore Module нет технической проблемы интегрировать чипы 3D-Xpoint памяти в качестве быстрого уровня хранения. Поэтому IBM Flash System являются единой и наиболее универсальной платформой хранения, которая может обеспечить миграцию из существующих систем инфраструктур хранения в будущие структуры хранения. По крайней мере, на уровне поддержки аппаратных компонентов конкурентов у нее пока нет.

В феврале IBM объявила о поддержке двух типов устройств, которые позиционируются как Storage Class Memory. Это устройства двух разных типов. 

Эти чипы от компании Micron или Intel, с которой у нас соглашение о технологическом партнерстве, которые называются Intel Optane, которые используют технологию изменения фазовых состояний вещества. И устройство под названием Z-SSD, которое производит компания Samsung. 

Т.к. пока IBM отрабатывала способы интеграции этих технологий и устройств в свою систему, до настоящего момента пока допускается установка не более четырех Optane, либо Z-SSD в систему IBM, которые можно организовать либо в десятый, либо в распределенный пятый RAID. В зависимости от того, как вы их планируете применять. И дальше их можно использовать тремя способами.

Первый рекомендуемый способ – это некий дополнительный уровень хранения в составе гибридного пула, особенно это хорошо для Optane, т.к. для этих носителей производительность на запись и на чтение – одинаковы, то их хорошо использовать как кэш на запись для тех массивов, где основной объем набран флеш памятью. За счет этого можно повысить производительность и уменьшить износ ресурса на операциях перезаписи.

При этом также программное обеспечение версии Spectrum Virtualize 8.3.1 позволяет устанавливать в каждую контроллерную группу до 4 штук Intel Optane, либо Samsung Z-SSD в RAID 5 или RAID 10, которые можно использовать: 

- как уровень хранения EasyTier;

- отдельный сверхбыстрый пул хранения;

- для кеширования метаданных DRP пулов.

Также изменены алгоритмы, по которым идет работа с третьим уровнем хранения, в отличие от традиционных алгоритмов, которые были оптимизированы под операции чтения, при появлении устройств типа FlashCore Module, ориентировка будет сделана именно на операции записи и соответственно оптимизировать на них размещение интенсивно обновляемых данных.

Второй способ использования этих устройств – это обычный сверхбыстрый пул, о котором была речь ранее. Может у определенных заказчиков есть база данных, которая требует максимальной производительности, данные настолько важны, что для них можно сделать отдельный объем памяти, даже если он будет стоить весьма дорого.

Третий способ использования – это кеширование метаданных DRP пулов. По сути это расширение кэш-памяти флэш систем. Поверх тех объемов, которые для них доступны. Для флеш систем начиная с 7000-й серии объем кэш-памяти составляет до 1,5 Тбайт на один узел, если этого не хватает, то можно нарастить его за счет кэширования в Storage Memory носителях. Получается, что Intel Optane стоят несколько дешевле, т.е. с точки зрения повышения эффективности можно не увеличивать оперативную память до максимальных значений во флэш-системах, а заменить ее часть кэшированием на Intel Optane. Intel Optane – это хорошее устройство, просто использующее другой тип памяти.