Вопросы ритейлера при выборе систем хранения данных

2 апреля 2021

Когда возникает необходимость покупки системы хранения данных (СХД), перед ритейлером встает непростой выбор: СХД бывают разных типов и видов, имеют разную специфику, доступность и производительность, а соответственно – и цену. На что ориентироваться, кого слушать, какие нюансы учесть?

Зачем компании нужна новая система хранения данных?

Покупка СХД, как правило, вызвана одной из двух причин – запуск нового проекта либо развитие уже существующей инфраструктуры.

На что ориентироваться при выборе системы хранения данных?

В первую очередь надо ориентироваться на стратегию развития и бизнес-цели компании.В соответствии с общей стратегией и требованиями бизнеса выстраивается ИТ-стратегия.«Надо представлять потенциально верхний уровень роста, понимать, куда хочет двигаться компания, на каких сервисах и мощностях будет развиваться ИТ-инфраструктура. Должен быть определен четкий путь. Потом он может меняться, но общий вектор необходимо задавать сразу».От стратегии компании зависит сайзинг системы – подбор оптимальной конфигурации и производительности с учетом роста бизнеса.

Какие данные планируется хранить?

На выбор СХД влияют тип и объем данных. Данные бывают неструктурированные и структурированные.

Неструктурированные – это данные, требующие обработки, – например, видеозаписи, фотографии, чертежи, схемы, архивы переписки по электронной почте, накладные, чеки и т.д.

Структурированные – базы, таблицы, вычисления и прочие аналогичные упорядоченные массивы.

В зависимости от типа хранимых данных и подбирается решение: «Например, под неструктурированные данные подойдет СХД объектного класса, где записи хранятся в виде объектов, – говорит Алексей Никифоров. – Либо можно использовать хранилища типа Hadoop (набор утилит, библиотек и фреймворк для разработки и выполнения распределенных программ), в которых можно не только хранить, но и обрабатывать большие данные. Это уже хранительно-распределительно-вычислительные системы. Возможно, под тип данных, которые планирует хранить ритейлер, нужна вовсе не СХД. Понимая, какой тип данных предполагается хранить, вендор сможет предложить оптимальное решение».

 Как составить требования к доступности, отказоустойчивости и производительности СХД?

На требования к СХД влияет масштаб компании. Важно знать, сколько предполагается пользователей, сколько магазинов будет подключено, насколько критичен простой в передаче данных. Как правило, крупным розничным сетям, оперирующим большим массивом ценных данных, которые необходимо хранить качественно и в полном объеме, требуются емкие и мощные решения класса Enterprise.

Но небольшим компаниям – например, нишевым производителям, локальным ритейлерам – такие масштабные и распределенные системы не нужны. Для них простой системы, длящийся три – пять часов, некритичен: данные о транзакциях все равно будут фиксироваться на онлайн-кассах, просто какое-то время не будут передаваться в CRM компании. Существенно на процессы малого бизнеса такие простои не повлияют. Поэтому решение рассчитывается на невысокий уровень критичности. Такое решение будет дешевле, чем решение с минимальным простоем, измеряемым секундами.

Высокая производительность тоже нужна не всем. Чтобы правильно рассчитать и спрогнозировать нагрузку, лучше обратиться к интегратору.

Что лучше – один дорогой сервер или двадцать бюджетных?

С точки зрения отдела закупок кажется логичнее закупить двадцать маленьких, цена которых будет существенно ниже, чем одной большой. Но мало кто думает о том, что если эти устройства начнут по очереди ломаться, как это нередко и происходит, то возникнут большие проблемы со всем остальным объемом информации, придется быстро искать, где вылетело, и оперативно устранять сбой. Это как плыть в дырявой лодке – постоянно приходится затыкать большое число дырок».

Например, если устройство имеет два контроллера, но при этом обладает низкой процессорной мощностью и слабыми возможностями отказоустойчивости, то в обычном режиме оно сможет работать и поддерживать стандартные процессы, но стоит дать большую нагрузку – и все посыпется. А ведь сервис рассчитан на использование двадцати устройств одновременно, и если два из них отвалились – кусок данных окажется недоступным. Чтобы починить или заменить, нужно будет найти именно две недоступные. В итоге такое решение оказывается нерабочим. ИТ-директор сдвигает его на другие задачи и закупает новое железо.

Системы хранения данных в Алматы

Источник: retail.ru