Организации сегодня собирают постоянно растущие объемы информации из всех источников, включая веб-сайты, корпоративные приложения, социальные сети, мобильные устройства и все чаще в Интернете вещей (IoT).
Большой вопрос : Как вы можете получить реальную ценность бизнеса из этой информации? Именно здесь интеллектуальный анализ данных может внести большой вклад. Сбор данных — это автоматизированный процесс сортировки с помощью огромных наборов данных для определения тенденций и моделей, установления связей, решения бизнес-задач или создания новых возможностей путем анализа данных.
Это не просто вопрос данные, чтобы увидеть, что произошло в прошлом, чтобы иметь возможность действовать разумно в настоящем. Инструменты и методы интеллектуального анализа данных позволяют предсказывать, что произойдет в будущем, и действовать соответственно, чтобы воспользоваться преимуществами будущих тенденций.
Термин «интеллектуальный анализ данных» используется довольно широко в ИТ-индустрии. Он часто применяется к различным крупномасштабным операциям обработки данных, таким как сбор, извлечение, складирование и анализ данных.
Data mining используется во многих областях бизнеса и исследований, включая разработку продуктов, продажу и маркетинг , генетика и кибернетика — назвать несколько. Если он используется правильными способами, интеллектуальный анализ данных в сочетании с интеллектуальными аналитиками может дать вам большое преимущество перед конкурентами, которые не используют эти инструменты.
Содержание статьи
Получение бизнес-ценности от интеллектуального анализа данных
Реальная стоимость интеллектуального анализа данных — это возможность спрятать скрытые драгоценные камни в виде шаблонов и отношений в данных, которые могут быть использованы для составления прогнозов, которые могут оказать значительное влияние на бизнес.
Например, если компания определяет что определенная маркетинговая кампания привела к чрезвычайно высоким продажам конкретной модели продукта в некоторых частях страны, но не в других, он может переориентировать кампанию в будущем, чтобы получить максимальную отдачу.
Преимущества технологии могут варьироваться в зависимости от типа бизнеса и его целей. Например, менеджеры по продажам и маркетингу в розничной торговле могут по-разному информировать клиентов о том, как улучшить показатели конверсии, чем в отраслях авиакомпаний или финансовых услуг.
Независимо от отрасли, интеллектуальный анализ данных, применяемый к схемам продаж и поведение клиентов в прошлом могут быть использованы для создания моделей, которые предсказывают будущие продажи и поведение.
. Также существует потенциал для интеллектуального анализа данных, который поможет устранить действия, которые могут нанести ущерб предприятиям. Например, вы можете использовать интеллектуальный анализ данных для повышения безопасности продукта или обнаружения мошеннической деятельности в транзакциях страхования и финансовых услуг.
Применение интеллектуального анализа данных
Добыча данных может применяться к различным
- Розничные продавцы могут развернуть интеллектуальный анализ данных, чтобы лучше определить, какие продукты люди могут приобрести на основе их прошлых покупательских привычек или какие товары, вероятно, будут продаваться в определенное время года. Это может помочь мерчендайзерам планировать инвентаризацию и хранить макеты.
- Банки и другие поставщики финансовых услуг могут передавать данные, относящиеся к учетным записям, транзакциям и каналам своих клиентов, чтобы лучше удовлетворить их потребности. Они также могут собирать анализируемые данные со своих веб-сайтов и взаимодействия в социальных сетях, чтобы повысить лояльность существующих клиентов и привлечь новых.
- Производственные компании могут использовать интеллектуальный анализ данных для поиска шаблонов в производственном процессе, поэтому они могут точно идентифицировать узкие места и ошибочные методы и найти способы повышения эффективности. Они могут также применять знания от интеллектуального анализа данных к разработке продуктов и делать трюки на основе обратной связи с опытом клиентов.
- Учебные заведения могут извлечь выгоду из интеллектуального анализа данных, например, для анализа наборов данных для прогнозирования будущих учебных навыков и производительности учащихся, а затем использовать эти знания для улучшения методов обучения или учебных программ.
- Поставщики медицинских услуг могут проводить анализ и анализировать данные для определения лучших способов оказания помощи пациентам и сокращения расходов. С помощью интеллектуального анализа данных они могут предсказать, сколько пациентов им нужно будет ухаживать и какие услуги нужны этим пациентам. В науках о жизни горная промышленность может использоваться для сбора информации из массивных биологических данных, для содействия разработке новых лекарств и других методов лечения.
- В различных отраслях промышленности включая здравоохранение и розничную торговлю, вы можете использовать интеллектуальный анализ данных для обнаружения мошенничества и других злоупотреблений — гораздо быстрее, чем при традиционных методах идентификации таких видов деятельности.
Ключевые компоненты интеллектуального анализа данных
Процесс интеллектуального анализа данных включает в себя несколько различных компонентов, которые затрагивают различные потребности:
- Предварительная обработка. Прежде чем вы сможете применять алгоритмы интеллектуального анализа данных, вам необходимо создать целевой набор данных. Один общий источник данных — это хранилище данных или хранилище данных. Вам необходимо выполнить предварительную обработку, чтобы иметь возможность анализировать наборы данных.
- Чистка и подготовка данных. Целевой набор данных должен быть очищен и подготовлен иным образом, чтобы удалить «шум», пропустить отсутствующие значения адресов, отфильтровать исходящие точки данных (для обнаружения аномалий), чтобы удалить ошибки или провести дальнейшую разведку, создать правила сегментации и выполнить другие функции, связанные с подготовкой данных .
- Изучение правила ассоциации (также известный как анализ корзины рынка ). Эти инструменты ищут отношения между переменными в наборе данных, такие как определение того, какие продукты в магазине часто покупаются вместе.
- Кластеризация. Эта функция интеллектуального анализа данных используется для обнаружения групп и структур в наборах данных, которые каким-то образом похожи друг на друга, без использования известных структур в данных.
- Классификация. Инструменты, которые выполняют классификацию, обобщают известные структуры для применения к новым точкам данных, например, когда приложение электронной почты пытается классифицировать сообщение как законную почту или спам.
- Регрессионный. Этот метод интеллектуального анализа данных используется для прогнозирования ряда числовых значений, таких как продажи, значения жилья, температуры или цены при предоставлении определенного набора данных.
- Суммирование. Этот метод обеспечивает компактное представление набора данных, включая визуализацию и генерацию отчетов.
Десятки поставщиков предоставляют инструменты для интеллектуального анализа данных, некоторые из которых предлагают проприетарное программное обеспечение и другие продукты, предлагающие продукты с открытым исходным кодом.
Среди ключевых поставщиков, которые предлагают собственные программные приложения для интеллектуального анализа данных, являются Angoss, Clarabridge , IBM, Microsoft, Open Text, Oracle, RapidMiner, SAS Institute и SAP.
Организации, предоставляющие программное обеспечение и приложения для разработки данных с открытым исходным кодом, включают Carrot2, Knime, Massive Online Analysis, ML-Flex, Orange, UIMA , и Weka.
Риски и проблемы интеллектуального анализа данных
.
На фундаментальном уровне добываемые данные должны быть полными, точными и надежными, поскольку любая технология, которая включает в себя использование потенциально чувствительной или личной информации, безопасности и конфиденциальности, является одной из самых больших проблем. в конце концов, вы используете его для принятия важных бизнес-решений и часто для взаимодействия с общественностью, регуляторами, инвесторами и деловыми партнерами. Современные формы данных также требуют новых технологий, таких как объединение наборов данных из множества распределенных вычислительных сред (например, большая интеграция данных) и более сложных данных, таких как изображения и видео, временные данные и пространственные данные.
Получение правильных данных, а затем их сведение, чтобы их можно было добыть, не является проблемой для ИТ. Облачные, хранилища и сетевые системы должны обеспечивать высокую производительность инструментов интеллектуального анализа данных. И полученная информация от добычи данных должна быть четко представлена широкому кругу пользователей, которые, как ожидается, будут действовать и интерпретировать ее.
. С точки зрения конфиденциальности идея добычи информации, относящейся к тому, как люди ведут себя, что они покупают, какие веб-сайты, которые они посещают, и т. Д. Могут вызывают озабоченность компаний, которые собирают слишком много информации. Это влияет не только на вашу технологическую реализацию, но и на вашу бизнес-стратегию и профиль риска.
Помимо этики отслеживания людей так тщательно, существуют также юридические требования о том, как собирать данные, идентифицировать их и делиться ими. Закон о переносимости и подотчетности медицинского страхования США (HIPAA) и Директиве по защите общих данных Европейского союза (GDPR) являются одними из самых известных.
В области интеллектуального анализа данных начальный акт подготовки сам по себе, такой как агрегирование а затем рационализация данных, может раскрывать информацию или шаблоны, которые могут нарушить конфиденциальность данных. Таким образом, возможно непреднамеренно устранить этические проблемы или юридические требования.
Для интеллектуального анализа данных также требуется защита данных на каждом шагу, чтобы данные не были украдены, изменены или недоступны в тайне. Средства безопасности включают в себя шифрование, средства контроля доступа и механизмы сетевой безопасности.
Углубление данных является ключевым отличием
Несмотря на эти проблемы, интеллектуальный анализ данных стал важным компонентом ИТ-стратегий во многих организациях, которые стремятся для получения выгоды от всей информации, которую они собирают или могут получить. Этот привод, без сомнения, будет ускоряться с постоянными достижениями в области прогнозирующей аналитики, искусственного интеллекта, машинного обучения и других соответствующих технологий.
Эта история: «Что такое интеллектуальный анализ данных? Как аналитика раскрывает идеи», изначально была опубликована
InfoWorld .