Сжатие: еще одна новая технология повышения эффективности от NetApp

Интервью с Джеем Киддом

 

Эффективность СХД стала важнейшим критерием выбора для многих организаций особенно сегодня, когда объемы данных продолжают расти, а бюджеты – сокращаться.

Поэтому если вы еще не в курсе, то узнайте, как благодаря NetApp® у вас появилась возможность гарантированно повысить коэффициент использования уже имеющегося дискового пространства, отложив на месяцы приобретение новых накопителей. Наши новейшие технологии рационального использования агрегированных систем хранения позволяют предприятиям меньшими ресурсами решать все более сложные задачи.

Мы прикладываем все силы, чтобы создаваемые нами новаторские средства повышения эффективности работы ЦОД способствовали снижению затрат на ИТ и дальнейшему развитию бизнеса наших клиентов. Из основных способов рациональной эксплуатации СХД наибольший интерес в последнее время привлекает сжатие данных. Эта технология, немаловажное значение которой стало очевидным после нескольких знаковых слияний, особенно эффективна применительно к подсистемам хранения архивной информации.

Уплотнение данных особенно полезно в сочетании с другими сопутствующими технологиями. В полной мере его преимущества проявляются, когда вместе с ним применяются другие средства повышения эффективности СХД. А поскольку есть возможность выбрать наиболее подходящее решение из специализированного портфеля продуктов, вы можете пополнить свой арсенал наиболее гибкими и эффективными средствами, которые отвечают как техническим требованиям, так и задачам, которые стоят перед предприятием.

О готовых к выходу на рынок новых продуктах NetApp в этой области нам сегодня расскажет Джей Кидд, старший вице-президент группы стратегического развития и разработки средств и технологий хранения данных.

NetApp предлагает набор весьма привлекательных решений для компрессии данных. Хотелось бы услышать несколько слов о новейших продуктах, нацеленных на увеличение полезной отдачи СХД.
Джей: Различные технологии уплотнения данных применяются уже достаточно давно. При этом всегда приходилось учитывать влияние такой компрессии на производительность всей системы, поскольку сжатие информации и ее восстановление в прежней, несжатой форме, неизбежно отнимает часть процессорных ресурсов. Вот почему до последнего времени сжатие для записи на ленточные накопители или хранения в виртуальных ленточных библиотеках выполнялось аппаратно. Нам же удалось найти способ выполнять эту процедуру программно, тем самым снизив потребность в вычислительных ресурсах.

То есть теперь данные сжимаются совсем без потери производительности?
Джей: Нет, программного уплотнения, которое никак бы не сказывалось на системе в целом, не бывает, но мы считаем, что операционная среда Data ONTAP® и файловая среда WAFL® позволяют добиться оптимального отношения степени компрессии к ресурсозатратам.

Суть технологии в следующем: прежде, чем данные отправятся в систему, из них выбирается некоторое число блоков WAFL размером 4 КБ каждый, и формируется группа — кандидат на уплотнение. Когда она готова, а данные находятся в памяти, следует проверка, можно ли эту группу сжать. Если нет, данные просто записываются на диск. Если же проверка показывает, что сжатие возможно, на диск записываются уже уплотненные данные. Операционная среда Data ONTAP попутно выполняет еще и другие функции, но в целом принцип работы именно таков.

Мы вплотную подошли к дедупликации. Можно одновременно сжимать и дедуплицировать данные?
Джей: Да. Сжатие применяется одновременно с дедупликацией и другими операциями, которые направлены на повышение эффективности СХД. Пользователь сам решает, какие технологии использовать на томе NetApp или логическом томе LUN: сжатие, дедупликацию, оба процесса сразу или ни одного.

Привлекательной особенностью предложения NetApp является интегрированность решений повышения эффективности СХД, причем составляющие портфеля можно использовать как по отдельности, так и одновременно, получая максимальный выигрыш. Наша конечная цель — добиться уплотнения каждого бита данных, попавших в информационную систему, что еще больше бы понизило TCO (совокупную стоимость владения).

Сжатие в сочетании с другими технологиями повышения эффективности — это могут быть гибкое выделение ресурсов, эффективная организация RAID-массивов и дедупликация — снижает до минимума емкость накопителей, которая необходима для поддержания заданного уровня обслуживания. Например, как видно из следующей таблицы, совокупная экономия от дедупликации и компрессии часто оказывается заметно выше, чем когда используется только что-то одно. Поэтому становится достижим компромисс между уровнем загрузки процессора и стремлением к экономии дискового пространства.

  Технологии и экономия дискового пространства (в %)
Прикладная задача Только сжатие
(в среднем)
Только дедупликация
(в среднем)
Дедупликация +
сжатие
(в среднем)
Файловые службы:
домашние каталоги
50 30 65
Файловые службы:
техническая документация
55 30 75
Файловые службы:
геосейсмические данные
75 3 75
Виртуальные службы 55 70 70
Базы данных:
Oracle ERP
65 0 65
Базы данных:
SAP
70 15 70
Электронная почта:
Exchange 2010
35 15 40

Насколько заметно падение производительности?
Джей: Поскольку сжатие предусматривает дополнительную обработку, сказаться это должно. В какой степени — будет зависеть от типа данных (их уплотняемости) и загрузки системы. Мы разработали ряд рекомендаций, которые помогут нашим заказчикам подобрать оптимальную конфигурацию, способную дать наибольший эффект.

Уплотнение будет очень эффективным при использовании этой технологии на вторичной подсистеме хранения при резервном копировании и архивации; одновременная дедупликация даст дополнительную экономию места.

Возьмем, например, базы данных. Заказчики часто говорят, что им хотелось бы снизить объем дискового пространства, который приходится выделять под резервные копии баз данных. Наши эксперименты показывают, что компрессия в сочетании с дедупликацией позволяет сэкономить до 70% пространства. Ради 70% экономии дисковой памяти масса пользователей готова заплатить ростом нагрузки на процессор.

Несколько лет назад, когда технология дедупликации только входила в обиход, она была доступна лишь узкому кругу первопроходцев. Будет такая же схема использована и при продвижении компрессии данных?
Джей: Да. Лицензия на использование технологии сжатия будет предоставляться по специальной процедуре. Вначале мы проведем аудит подсистемы хранения, результатом которого станут рекомендации по надлежащему применению сжатия. Таким образом мы сможем удостовериться, что предлагаемое нами средство полностью соответствует каждому конкретному случаю, то есть что ни нам, ни клиенту не следует ждать никаких сюрпризов.

В общем, на начальном этапе мы предпочитаем держать руку на пульсе и не оставлять без внимания первых пользователей новой технологии. А уже после она будет доступна всем без исключения и безо всяких дополнительных проверок.

Потребуется ли клиентам NetApp докупать еще что-либо, чтобы использовать компрессию данных в своих системах?
Джей: Нет. Мы не будем взимать плату за функцию сжатия. Возможность использовать эту технологию появится после обновления до новейшей версии операционной среды Data ONTAP.

Спасибо, Джей, за интересную и содержательную беседу. Может, вы хотите что-нибудь добавить?
Джей: С моей точки зрения, NetApp выводит на рынок технологию уплотнения данных по тому же сценарию, что и дедупликацию несколько лет назад. Мы первыми встроили функцию дедупликации в рядовые контроллеры СХД, однако для использования в ведущих системах она внедрялась постепенно. Нам требовалось понять преимущества и возможные последствия применения дедупликации к данным самых разных типов. Сейчас мы придерживаемся точно такого же консервативного подхода в отношении уплотнения, и точно так же начинаем со вторичных подсистем. Мы стремимся дать нашим пользователям возможность вначале оценить ожидаемые выгоды и характер данных, для которых все эти функции окажутся наиболее эффективными, чтобы затем использовать их с наибольшим выигрышем при минимальных эксплуатационных затратах.

«С момента своего основания NetApp выросла в технологическую компанию с 4-миллиардным оборотом, продукция которой — Snapshot™, гибкое выделение дисковых ресурсов, гибкие тома FlexVol, дедупликация, RAID-DP® и так далее — позволяет клиентам сокращать расходы на системы хранения данных. Все эти технологии уменьшают потребность в дисковой памяти. Мы всегда ищем новое и постоянно предлагаем рынку все более экономичные технологии. Наша компания растет и отвоевывает новые рубежи потому, что мы предлагаем нашим клиентам самые привлекательные решения. Поставщик, который помогает своему клиенту экономить деньги, имеет все основания ожидать, что этот клиент отдаст предпочтение именно его решениям».
- Джей Кидд, сотрудник компании NetApp

Разумеется, возможность сжатия данных предлагают и многие другие поставщики, однако никто из них даже не приблизился к тому разнообразию технологий повышения эффективности и сокращения объема, которые разработаны в NetApp для ведущих и вторичных подсистем хранения. Решения конкурентов не обладают слитностью, широтой и глубиной дополнительных возможностей, а то и работают только на уровне файлов, что ограничивает сферу их применения. Компания NetApp включает эти технологии повышения эффективности непосредственно во все свои подсистемы хранения, благодаря чему такие накопители обрабатывают не только файлы, но и блоки данных. Клиенту незачем приобретать отдельные специализированные устройства, для управления которыми необходимы дополнительные усилия и инструменты.

Когда мы вышли на рынок с технологией дедупликации, ее встретили с изрядной долей скептицизма. Но дедупликация отлично зарекомендовала себя даже в ведущих системах хранения при работе с данными самых разных типов, особенно в сочетании с VMware®. Сегодня NetApp является ведущим поставщиком технологии дедупликации по всем основным показателям — по числу использующих эту технологию систем, по их КПД и по количеству клиентов. Такого же подхода мы будем придерживаться и в отношении сжатия данных. Пока можно говорить о базах данных или некоторых других прикладных областях, но со временем все увидят, что технология программного уплотнения прекрасно работает на всех уровнях хранения: основном, вторичном и архивном.

Спасибо, Джей, что вы нашли время на эту беседу.

Когда требуется добиться максимальной отдачи от информационной системы, то лучшее средство для этого — интегрированные, взаимодополняющие технологии повышения эффективности СХД. Эффективные технологии уменьшают затраты времени, усилий и ресурсов, необходимые для работы современных информационных систем, высвобождая ресурсы для будущего развития.

Подробнее о технологии сжатия в системах NetApp и о нашем наборе решений для повышения эффективности СХД.

Если вы еще не успели этого сделать, прочтите самые свежие статьи о том, как на фундаменте разделяемой инфраструктуры строятся готовые к будущемугибкие информационные системы.