Интеллектуальная работа с данными в SAP Data Intelligence

SAP Data Intelligence – это платформа, которая включает в себя унифицированный набор инструментов для управления данными, комплексной обработки данных и создания интеллектуальных сценариев на основе машинного обучения. SAP Data Intelligence позволяет оснащать интеллектуальными сервисами бизнес-системы предприятия, в частности SAP S/4HANA.

  • Комплексное решение для всех основных задач обработки данных

  • Управление данными компании из любых доступных источников

  • Встроенные интеллектуальные сценарии помогают находить инсайты

Посмотреть демо-сценарии

Описание системы SAP Data Intelligence

В последнее время мы замечаем существенную трансформацию, которая происходит в IT-ландшафтах компаний – к традиционным on-premise системам добавляются облачные продукты, а также специализированные решения, например, для работы с большими данными. Таким образом, ландшафты становятся более распределёнными и более комплексными, а для эффективного управления данными и их монетизации необходимо применять новые подходы и инструменты.

SAP Data Intelligence – это платформа, которая позволяет подключаться к различным системам ландшафта, собирать оттуда мета-данные с помощью Metadata Crawler, описывать бизнес-термины на понятном языке в глоссарии, настраивать связи бизнес-терминов и объектов каталога мета-данных, а также создавать бизнес-правила и оценивать с их помощью качество данных.

Кроме того, система даёт возможность моделировать пайплайны для комплексной обработки данных, а также разрабатывать модели во встроенной среде Yupyterlab, отслеживать их версии, обучать модели и оценивать их качество, создавать интеллектуальные сценарии на основе этих моделей, эффективно их продуктивизировать и управлять жизненным циклом.

SAP Data Intelligence

  • Интеллектуальные сценарии

    Разработка ML | Продуктивизация | Управление

  • Комплексная обработка данных

    Сбор данных | Обработка | Прогнозирование

  • Управление данными

    Поиск | Каталог метаданных | Глоссарий | Качество

  • Интеграция

    Подключение к источникам данных

Управление данными с SAP Data Intelligence: Как превратить сырые и разрозненные сведения в полезные идеи и инструменты ведения бизнеса в цифровой экономике?

Барьеры на пути к прозрачной и эффективной работе с данными

  • Данные разрознены в различных системах и не описаны, нет системного подхода и архитектуры

  • “Теневые” ИТ-системы могут хранить важные данных, доступ к которым затруднён

  • Часть бизнес-процессов не автоматизирована, а их данные хранятся в виде файлов либо бумаг

  • Данные собираются или хранятся некачественно, что затрудняет работу с ними

  • Часть необходимых данных не сохраняется

Стандартный процесс управления данными:

  • Исследование

    Поиск данных в ландшафте и их профилирование

  • Определение

    Классификация данных и формирование каталога мета-данных, формирование бизнес-глоссария и связей между терминами и объектами

  • Применение

    Поиск данных в каталоге мета-данных и терминов в глоссарии, применение правил для анализа качества данных, сотрудничество бизнеса и ИТ

  • Оценка и мониторинг

    Проактивный мониторинг качества данных с помощью дашборда, анализ Data Lineage, оценка ценности процесса для бизнеса

Ключевые задачи управления данными по мнению SAP

К 2021 году по мнению Gartner функция CDO станет высококритичной, сравнимой по важности с IT, HR, финансами в 75% крупных компаний. Сегодня CDO отвечает не только за управление данными, но и за внедрение инновационных решений на их основе.

Сейчас работа с данными – это не просто их сбор, хранение и визуализация, а построение самообучающихся систем, которые позволяют оптимизировать бизнес каждую минуту.

5 ключевых задач управления данными

  • Использование и монетизация данных

    Реализация интеллектуальных сценариев на основе машинного обучения.

  • Управление метаданными

    В условиях увеличивающегося объёма данных критически важно синхронизировать объекты данных и бизнес-термины.

  • Анализ и улучшение качества данных

    Использование машинного обучения для анализа качества данных и для уточнения бизнес-правил.

  • Интеграция и обработка данных

    Помимо стандартных средств интеграции используется Data Piplines – конвейеры данных, состоящие из операторов, позволяющих собирать информацию из различных систем, обрабатывать их и публиковать результаты.

  • Хранение данных

    Маскирование, анонимизация и управления правами доступа к данным.

Разработка интеллектуальных сценариев – от прототипа до промышленного решения

  • Поиск данных

    Поиск и анализ данных. Подключение к системам и источникам

  • Подготовка данных

    Сбор данных из источников. Извлечение данных в пакетном режиме.

    Комбинирование данных и трансформация. Обработка и комбинирование данных.

    Подготовка данных для ML. Публикация сета в ML Data Manager.

  • Разработка модели

    Реализация модели. Анализ данных и тестирование.

    Обучение модели. Обучение ML-модели на собранных данных.

    Тестирование и валидация.

  • Создание модели

    Разврёртывание. Создание Inference pipeline — REST API-сервиса

    Управление жизненным циклом. Мониторинг результатов и анализ точности модели

ML-cценарий — объект SAP Data Intelligence, соответствующий бизнес-кейсу и объединяющий все его артефакты в едином консистентном виде.

Посмотрите пример реализации ML-сценария на примере автомобильной отрасли
  • Преимущества

  • Ускорение и упрощение внедрения ML-сценариев

  • Управление жизненным циклом: контроль версий, автообучение, ввод/вывод из эксплуатации, мониторинг выполнения SLA

  • Возможность автоматического построения моделей, включая генерацию и отбор признаков, работу с пропусками, подбор оптимальных алгоритмов и их параметров

  • Построение интеллектуальных сервисов для использования ML-сценариев в промышленной среде, встраивание ML в бизнес-приложения SAP и не-SAP

  • Унифицированный набор инструментов для реализации ML-сценариев и управления их жизненным циклом

SAP Data Intelligence: Совместная архитектура SAP и Microsoft Azure для работы с большими данными и ML

Решение SAP Data Intelligence построено на cloud native технологиях, микросервисной архитектуре и контейнеризации. Data Intelligence предоставляется клиентам в формате as-a-Service в различных публичных и частных облаках, а также, как on-premise решение. Вне зависимости используется ли SAP Data Intelligence as-a-service или решение развёрнуто в on-premise ландшафте, оно позволяет клиентам:

  • использовать сервисы облачных провайдеров для решения задач в области AI/ML;
  • быстро переходить с одного облачного провайдера на другой без значительных трудозатрат на миграцию;
  • оркестрировать данные и управлять всеми AI/ML сценариями централизованно из SAP Data Intelligence.

Таким образом, SAP Data Intelligence поддерживает мультиклаудную стратегию. Наглядным примером совместного использования SAP Data Intelligence и облаков является делегирование тяжёлых ML-задач, обрабатывающих десятки или сотни терабайт данных, из Data Intelligence в специализированные облачные сервисы, предлагающие лучшее соотношение производительности и стоимости в моменте. SAP Data Intelligence позволяет клиентам не зависеть от конкретного облачного провайдера, использовать best-of-breed облачные технологии и снижать TCO.

Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (AI) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области.

alt

Скачайте брошюру 7 сценариев применения Azure Databricks

Здравоохранение, ритейл, коммуникации и СМИ, финансы, нефтегазовая отрасль и энергетика, маркетинг, безопасность

Скачать