За последние пару десятилетий предприятия понизили уровень принятия решений в организации, полагая, что лучшие лица, принимающие решения, должны быть теми, кто ближе всего к клиентам и продуктам. В то же время волна цифровой трансформации убедила почти всех, что решения должны приниматься на основе данных.
К сожалению, в большинстве компаний информация для поддержки принятия решений остается заблокированной в так называемом хранилище данных, которое по сути является хранилищем данных. гигантская централизованная база данных, обслуживаемая группами специалистов по данным и инженеров.
Процесс ввода и вывода полезной информации на этот центральный ресурс может быть мучительно долгим, поскольку инженеры по обработке данных проверяют, очищают и доводят записи до нужной формы. К тому времени, когда вы получите ответ на свой вопрос, этот вопрос может даже потерять смысл. И люди, которым поручено обрабатывать эти данные и получать ответы, отделены от вашего бизнес-подразделения, что делает их недостаточно квалифицированными для понимания контекста вашего запроса.
Короче говоря, хранилища данных стали серьезным узким местом для многих крупных компаний. организации, особенно крупнейшие. Нам нужны способы оптимизировать способ управления данными для поддержки принятия решений.
Разбивка склада
Самая популярная идея сейчас — это «сетка данных», в которой Ответственность за ведение аналитических данных переходит от централизованной команды мастеров к людям, находящимся на передовой, которые их создают и лучше всего понимают. Их работа заключается в сборе соответствующей информации, обеспечении ее высокого качества и распространении ее среди других сотрудников организации, которые могут найти ее полезной.
В этом сценарии центральный склад не уходит, а просто становится еще одним потребителем информации о сетке. Централизованная организация распадается, и многие инженеры по обработке данных — или люди, которые уточняют данные перед загрузкой их в хранилище — рассредоточены по бизнес-единицам для тесного сотрудничества с владельцами данных.
Ядро Конструкция сетки данных — это то, что Жамак Дехгани, консультант технологической консалтинговой компании Thoughtworks, который впервые предложил концепцию сетки два года назад, назвал «товарным мышлением», или идеей о том, что данные получают столько же внимания и внимания, как и любой другой продукт. компания продает. Это означает обеспечение того, чтобы информация была актуальной, актуальной, хорошо организованной и доступной для других сотрудников компании. Должны быть созданы стимулы, чтобы побудить заинтересованные стороны заботиться о своих данных, вплоть до взимания платы за доступ.
В сценарии Дехгани организация принимает главный каталог данных, который люди могут просматривать и искать в находят то, что им нужно, так же, как пользователи смартфонов удовлетворяют свои собственные потребности в магазине приложений. Вместо того чтобы неделями ждать, пока запросы дойдут до начала очереди, люди будут собирать данные всякий раз, когда они им нужны.
В соответствии с бизнесом
Это может звучит как радикальная идея, но за ней твердо стоят многочисленные технологические и бизнес-тенденции. Во-первых, «программное обеспечение как услуга» узаконило самообслуживание. Теперь люди свободно выбирают бизнес-приложения, которые они предпочитают использовать, так почему бы не сделать то же самое с данными?
На технологическом фронте недавние инновации сделали концепцию сетки более практичной. Высокоскоростные механизмы запросов с открытым исходным кодом, такие как Presto и Apache Spark, могут работать с данными, распределенными в нескольких местах, без необходимости их копирования и загрузки в центральный ресурс. Поставщики бизнес-аналитики, такие как Microsoft (PowerBI) и Salesforce (Tableau), интегрируют свои удобные интерфейсные инструменты, чтобы скрыть основную сложность.
Компании также все чаще хранят данные в облаке в безопасности, недорогие сервисы хранения, такие как Amazon S3, как своего рода озеро данных. Это означает, что он находится в одном логическом месте, где его легче индексировать и защищать.
Наконец, каталоги данных, которые выступают в качестве основной записи всей информации, которой располагает организация, используют машинное обучение для распознавания и автоматической категоризации записей с помощью незначительное участие человека или его отсутствие. Например, каталог данных Lumada от Hitachi Ventara использует машинное обучение для создания постоянно обновляемого виртуального представления информации, хранящейся в базах данных и других хранилищах структурированных данных внутри организации. Это означает, что бизнес-пользователи могут находить, систематизировать и классифицировать данные, не привлекая ИТ-отдел.
Модель сетки данных уже далеко вышла за рамки концептуальной фазы. В недавней презентации на YouTube старшие руководители JP Morgan Chase рассказали о существенном прогрессе, которого крупная финансовая компания добилась в своей годовой инициативе по созданию сетки данных. По оценкам Gartner, от 400 до 500 крупных организаций уже реализуют инициативы.
В бизнес-среде, которая плохо переносит задержки, концепция ячеистой сети становится все более целесообразной. А учитывая, что, по оценке Gartner, это может снизить накладные расходы на интеграцию на 30% и сократить расходы на обслуживание на 70%, необходимо также привести убедительные аргументы в пользу затрат.
Next read это:
Авторские права © 2021 IDG Communications, Inc.