Интеллектуальная работа с данными в SAP Data Intelligence
SAP Data Intelligence – это платформа, которая включает в себя унифицированный набор инструментов для управления данными, комплексной обработки данных и создания интеллектуальных сценариев на основе машинного обучения. SAP Data Intelligence позволяет оснащать интеллектуальными сервисами бизнес-системы предприятия, в частности SAP S/4HANA.
Комплексное решение для всех основных задач обработки данных
Управление данными компании из любых доступных источников
Встроенные интеллектуальные сценарии помогают находить инсайты
Описание системы SAP Data Intelligence
В последнее время мы замечаем существенную трансформацию, которая происходит в IT-ландшафтах компаний – к традиционным on-premise системам добавляются облачные продукты, а также специализированные решения, например, для работы с большими данными. Таким образом, ландшафты становятся более распределёнными и более комплексными, а для эффективного управления данными и их монетизации необходимо применять новые подходы и инструменты.
SAP Data Intelligence – это платформа, которая позволяет подключаться к различным системам ландшафта, собирать оттуда мета-данные с помощью Metadata Crawler, описывать бизнес-термины на понятном языке в глоссарии, настраивать связи бизнес-терминов и объектов каталога мета-данных, а также создавать бизнес-правила и оценивать с их помощью качество данных.
Кроме того, система даёт возможность моделировать пайплайны для комплексной обработки данных, а также разрабатывать модели во встроенной среде Yupyterlab, отслеживать их версии, обучать модели и оценивать их качество, создавать интеллектуальные сценарии на основе этих моделей, эффективно их продуктивизировать и управлять жизненным циклом.
SAP Data Intelligence
Интеллектуальные сценарии
Разработка ML | Продуктивизация | Управление
Комплексная обработка данных
Сбор данных | Обработка | Прогнозирование
Управление данными
Поиск | Каталог метаданных | Глоссарий | Качество
Интеграция
Подключение к источникам данных
Управление данными с SAP Data Intelligence: Как превратить сырые и разрозненные сведения в полезные идеи и инструменты ведения бизнеса в цифровой экономике?
Барьеры на пути к прозрачной и эффективной работе с данными
Данные разрознены в различных системах и не описаны, нет системного подхода и архитектуры
“Теневые” ИТ-системы могут хранить важные данных, доступ к которым затруднён
Часть бизнес-процессов не автоматизирована, а их данные хранятся в виде файлов либо бумаг
Данные собираются или хранятся некачественно, что затрудняет работу с ними
Часть необходимых данных не сохраняется
Стандартный процесс управления данными:
Исследование
Поиск данных в ландшафте и их профилирование
Определение
Классификация данных и формирование каталога мета-данных, формирование бизнес-глоссария и связей между терминами и объектами
Применение
Поиск данных в каталоге мета-данных и терминов в глоссарии, применение правил для анализа качества данных, сотрудничество бизнеса и ИТ
Оценка и мониторинг
Проактивный мониторинг качества данных с помощью дашборда, анализ Data Lineage, оценка ценности процесса для бизнеса
Ключевые задачи управления данными по мнению SAP
К 2021 году по мнению Gartner функция CDO станет высококритичной, сравнимой по важности с IT, HR, финансами в 75% крупных компаний. Сегодня CDO отвечает не только за управление данными, но и за внедрение инновационных решений на их основе.
Сейчас работа с данными – это не просто их сбор, хранение и визуализация, а построение самообучающихся систем, которые позволяют оптимизировать бизнес каждую минуту.
5 ключевых задач управления данными
Использование и монетизация данных
Реализация интеллектуальных сценариев на основе машинного обучения.
Управление метаданными
В условиях увеличивающегося объёма данных критически важно синхронизировать объекты данных и бизнес-термины.
Анализ и улучшение качества данных
Использование машинного обучения для анализа качества данных и для уточнения бизнес-правил.
Интеграция и обработка данных
Помимо стандартных средств интеграции используется Data Piplines – конвейеры данных, состоящие из операторов, позволяющих собирать информацию из различных систем, обрабатывать их и публиковать результаты.
Хранение данных
Маскирование, анонимизация и управления правами доступа к данным.
Разработка интеллектуальных сценариев – от прототипа до промышленного решения
Поиск данных
Поиск и анализ данных. Подключение к системам и источникам
Подготовка данных
Сбор данных из источников. Извлечение данных в пакетном режиме.
Комбинирование данных и трансформация. Обработка и комбинирование данных.
Подготовка данных для ML. Публикация сета в ML Data Manager.
Разработка модели
Реализация модели. Анализ данных и тестирование.
Обучение модели. Обучение ML-модели на собранных данных.
Тестирование и валидация.
Создание модели
Разврёртывание. Создание Inference pipeline — REST API-сервиса
Управление жизненным циклом. Мониторинг результатов и анализ точности модели
ML-cценарий — объект SAP Data Intelligence, соответствующий бизнес-кейсу и объединяющий все его артефакты в едином консистентном виде.
Посмотрите пример реализации ML-сценария на примере автомобильной отраслиПреимущества
Ускорение и упрощение внедрения ML-сценариев
Управление жизненным циклом: контроль версий, автообучение, ввод/вывод из эксплуатации, мониторинг выполнения SLA
Возможность автоматического построения моделей, включая генерацию и отбор признаков, работу с пропусками, подбор оптимальных алгоритмов и их параметров
Построение интеллектуальных сервисов для использования ML-сценариев в промышленной среде, встраивание ML в бизнес-приложения SAP и не-SAP
Унифицированный набор инструментов для реализации ML-сценариев и управления их жизненным циклом
SAP Data Intelligence: Совместная архитектура SAP и Microsoft Azure для работы с большими данными и ML

Решение SAP Data Intelligence построено на cloud native технологиях, микросервисной архитектуре и контейнеризации. Data Intelligence предоставляется клиентам в формате as-a-Service в различных публичных и частных облаках, а также, как on-premise решение. Вне зависимости используется ли SAP Data Intelligence as-a-service или решение развёрнуто в on-premise ландшафте, оно позволяет клиентам:
- использовать сервисы облачных провайдеров для решения задач в области AI/ML;
- быстро переходить с одного облачного провайдера на другой без значительных трудозатрат на миграцию;
- оркестрировать данные и управлять всеми AI/ML сценариями централизованно из SAP Data Intelligence.
Таким образом, SAP Data Intelligence поддерживает мультиклаудную стратегию. Наглядным примером совместного использования SAP Data Intelligence и облаков является делегирование тяжёлых ML-задач, обрабатывающих десятки или сотни терабайт данных, из Data Intelligence в специализированные облачные сервисы, предлагающие лучшее соотношение производительности и стоимости в моменте. SAP Data Intelligence позволяет клиентам не зависеть от конкретного облачного провайдера, использовать best-of-breed облачные технологии и снижать TCO.
Получайте аналитические сведения на основе всех своих данных и создавайте решения с использованием искусственного интеллекта (AI) при помощи Azure Databricks, настройте среду Apache Spark™ за считанные минуты, обеспечьте автомасштабирование и участвуйте в совместной работе над общими проектами в интерактивной рабочей области.

Скачайте брошюру 7 сценариев применения Azure Databricks
Здравоохранение, ритейл, коммуникации и СМИ, финансы, нефтегазовая отрасль и энергетика, маркетинг, безопасность
Скачать