2 февраля 2023

Ошибка на миллион: что может пойти не так при построении хранилища данных

Создание корпоративного хранилища данных — сложный и затратный процесс. Ошибки на старте и во время реализации проекта могут привести к неконтролируемому росту расходов, а также технологическим и экономическим потерям для бизнеса.

Корпоративное хранилище данных (Data Warehouse, DWH) необходимо для запуска проектов в области бизнес-аналитики. Данные поступают в хранилище из различных источников — информационных систем, приложений, внешних систем. Таким образом, хранилище данных становится единым источником проверенной информации компании. С помощью аналитических инструментов компании извлекают из собранной в DWH информации ценные для бизнеса сведения для повышения эффективности решений, принимаемых в различных подразделениях – от менеджмента и членов правления до бухгалтерии, казначейства, отдела кадров и других службах. Аналитика помогает решать множество бизнес-задач — от оценки клиентской базы и продуктов до бюджетирования и составления консолидированной отчетности.

Многие крупные компании понимают ценность бизнес-аналитики и необходимость создания корпоративного хранилища данных. Однако практически все сталкиваются с проблемами, приводящими к увеличению бюджета проекта и затягиванию сроков реализации. Разберем наиболее «дорогие» ошибки при построении DWH.

Ошибка № 1: непонимание бизнес-целей

Это главная ошибка, которая может привести к срыву проекта и необходимости начинать всё с нуля.

При построении хранилища данных следует идти от потребностей бизнеса. Это означает, что важно привлечь будущих пользователей — сотрудников, которые будут работать с информацией и строить аналитические отчеты. В зависимости от их задач выбираются архитектура и способ реализации конечного решения. В противном случае проектная команда загружает в хранилище данные по своему усмотрению и в том виде, который считает оптимальным. Время и усилия потрачены, а результата нет — пользователи не могут полноценно работать с хранилищем и получать требуемый результат.

Поэтому первым делом нужно определить перечень ключевых сущностей, которые необходимо загрузить для того, чтобы покрыть потребности бизнеса в полном объеме. Без вовлечения будущих пользователей на старте проекта это вряд ли удастся.

Ошибка № 2: неправильная модель данных

Далее необходимо выбрать оптимальную модель данных, которая будет соответствовать определенным на старте проекта бизнес-целям. При этом она не должна быть сложной как на этапе проектирования, так и на этапе эксплуатации.

Один из значимых рисков — выбор модели данных, которая используется редко. В этом случае будет сложно найти архитекторов, которые успешно внедряли такие решения. Чтобы разобраться в методологии, где всегда присутствует множество нюансов, специалистам придется потратить время. И это уже удорожает проект.

Если нет широкого опыта применения модели данных в корпоративных хранилищах, то во время реализации проекта могут возникать неприятные сюрпризы. Например, процедура загрузки данных из систем источников может оказаться слишком сложной и будет требовать колоссального количества времени. Могут возникнуть проблемы с обучением команды — на это придется отвлекать ресурсы опытных специалистов.

Выходом из ситуации может послужить упрощение модели до определенного уровня, однако нередко это ведет к потере достоинств, в силу которых она изначально была выбрана. В итоге компания не только теряет деньги и срывает сроки проекта, но получает решение, которое будет тяжело и дорого поддерживать в будущем.

Принятие неверного решения на этапе выбора модели данных может стоить крайне дорого, а риски становятся непрогнозируемыми. Поэтому важно привлекать максимально компетентных специалистов на стадии предпроектного обследования и моделирования хранилища данных.

Ошибка № 3: некорректная пирамида специалистов

Построение корпоративного хранилища данных или замена устаревшего DWH на новое решение — это чаще всего большой мультивендорный проект. К примеру, на одном из таких проектов у нас работает больше 300 человек, из которых около 100 — сотрудники нашей компании.

Для достижения запланированного результата важно не только подобрать людей с нужными компетенциями, но и соблюдать баланс проектных ролей. Например, для снижения затрат в команду привлекают больше начинающих разработчиков и аналитиков. Это может стать проблемой: опытные специалисты, вместо того чтобы решать сложные задачи, вынуждены тратить время на обучение новичков, а после обучения — постоянно контролировать их работу. Процесс затягивается, изначально запланированная экономия на ФОТ превращается в лишние расходы.

Как избежать проблем

Чтобы соблюсти сроки проекта и добиться нужного результата с первого раза, рекомендую придерживаться еще нескольких важных правил:

  • Источники данных для хранилища лучше определить на старте проекта исходя из бизнес-потребностей. 

  • Пробелы в имеющихся данных проще закрыть, если сразу задокументировать их местоположение, структуру и качество. Такой порядок определяет бизнес-правила для их преобразования в соответствии с требованиями хранилища.

  • В команду должны входить «спонсоры» проекта из высшего руководства, а также сотрудники, которые будут работать с данными. Стандартные отчеты и KPI, необходимые им для выполнения задач, важно определить в начале проекта.

  • Из разных сценариев применения хранилища данных для пилотного проекта стоит выбрать один-два с высокой ценностью для бизнеса. 

  • Опыт технологического партнера по организации хранилищ данных должен соответствовать потребностям компании — в этом случае удастся избежать типичных проблем. 

  • Решение должно быть гибким. Когда работать с ним будет все больше подразделений и сотрудников, появится необходимость в построении витрин данных и масштабировании хранилища. Изначально гибкая платформа сможет удовлетворить растущие потребности. 

Автор: Яна Ларькина, менеджер компании Axenix (бывшая Accenture)
Источник: IT World

Клиенты iTrend — в числе лучших ИТ-работодателей России

13 февраля 2024

Клиенты коммуникационного агентства iTrend вошли в рейтинг лучших ИТ-работодателей страны по версии HeadHunter. В сегменте «IT и интернет» были отмечены технологическая корпорация VK, консалтинговая компания Axenix (ранее Accenture), а также компании IT_ONE, Innostage и «Эдит Про» (группа «Борлас»).

 

iTrend начал работу с одним из лидеров в области высокотехнологичных разработок для Интернет-рекламы — компанией Hybrid

16 января 2024

Компанией Hybrid занимает 2 место в рейтинге Программатических закупок в интернете от AdIndex.

 

iTrend займется личным брендингом ИТ-предпринимателей

15 января 2024

Мы запустили новое направление в агентстве — личный брендинг топ-менеджеров и предпринимателей в ИТ.

 

Российские ИТ в эпоху санкционных войн - точки роста и проблемы: вышла наша обзорная статья

7 января 2024

Материал подготовлен специально для авторитетного журнала "Россия в глобальной политике".

 
Все новости iTrend