Информационные технологии в управлении. Аналитическая платформа Deductor. Учебное пособие по проведению практических занятий со студентами управленческих направлений подготовки
Виктор Дудихин
В данном пособии приводятся примеры использования аналитической платформы «Deductor». Изучение пособия дает возможность студентам бакалавриата и магистратуры существенно продвинуться в освоении совокупности методов и средств аналитической обработки информации. Пособие предназначено для студентов факультета государственного управления МГУ, а также студентов гуманитарных специальностей, изучающих информационные технологии в управлении.
Информационные технологии в управлении
Аналитическая платформа Deductor. Учебное пособие по проведению практических занятий со студентами управленческих направлений подготовки
Виктор Дудихин
© Виктор Дудихин, 2017
ISBN 978-5-4490-1257-9
Создано в интеллектуальной издательской системе Ridero
Введение
В данном пособии приводятся примеры использования аналитической платформы «Deductor». Рассматриваются некоторые возможные реализации нейронных сетей, кластеризация с помощью карт Кохонена, прогнозирование временных рядов и создание баз знаний.
Наличие достаточно развитых инструментальных программных средств аналитической платформы «Deductor» позволяет аналитику при построении модели прогнозируемого процесса руководствоваться такими понятиями, как опыт и интуиция. В ряде случаев, когда нет необходимости в строгой математической спецификации модели, такой подход представляется вполне допустимым, что особенно ценно при анализе плохо формализуемых процессов.
Изучение пособия дает возможность студентам бакалавриата и магистратуры существенно продвинуться в освоении совокупности методов и средств аналитической обработки информации.
Пособие предназначено для студентов факультета государственного управления МГУ, а также студентов гуманитарных специальностей, изучающих информационные технологии в управлении.
Хочу выразить свою благодарность доценту Кафедры математических методов и информационных технологий Факультета государственного управления МГУ И.А.Смольниковой за оказанную помощь и полезные советы при редактировании этой книги.
Если у Вас возникнут вопросы, то пишите мне dudikhin@yandex.ru
I. Аналитическая платформа Deductor
Аналитическая платформа платформа Deductor – это отечественный программный продукт, разработанный компанией BaseGroup Labs. С его помощью возможно решение самого широкого спектра задач, начиная от создания систем корпоративной отчетности и до решения задач Data Mining.
Это специализированное программное решение выполнено на базе единой платформы и содержит в себе необходимые инструменты для извлечения закономерностей из «сырых» данных. Оно позволяет пройти все этапы построения аналитической системы: от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Система позволяет анализировать любые табличные данные и для решения аналитических задач. В ней предусмотрена возможность использования следующих специальных технологий:
– Data Warehouse (хранилища данных) – консолидация данных и обеспечение быстрого и понятного для аналитика доступа к ним
– OLAP (многомерный анализ) – визуализация, отчетность и удобное манипулирование большими объемами данных
– Data Mining (моделирование, интеллектуальный анализ данных) – поиск скрытых закономерностей, выявление причинно-следственных связей, анализ рисков
– KDD – Knowledge Discovery in Databases (обнаружение, извлечение знаний) – построение сценариев обработки от очистки и предобработки данных до моделирования.
В настоящем пособии рассматриваются только некоторые технологии из приведенного списка.
Последовательность действий (импорт, экспорт, обработка, визуализация) при решении конкретных задач в Deductor задается сценарием обработки. Сами же сценарии формируются специальным приложением Deductor Studio, которое является рабочим местом аналитика.
В профессиональной версии системы для импорта и анализа пригодны разнообразные табличные данные из стороннего источника (Oracle, MS SQL, Sybase, MS Access, Excel, 1С и др.). В учебной версии Deductor Academic – импортируются только данные в формате текстовых файлов с разделителями в виде табуляции.
Под обработкой данных в системе подразумевается любые действия, связанные с их преобразованием, такие как очистка данных, их трансформация и построение разнообразных моделей Data Mining.
При визуализации производится отображение полученных и обработанных данных. Аналитическая платформа самостоятельно анализирует формат отображения, предоставляя пользователю возможность выбора необходимого варианта.
В профессиональной версии системы предусмотрен экспорт (вывод) результатов обработки в виде файлов для последующего использования. В учебной версии Deductor Academic данная опция отсутствует.
В платформе Deductor представлено большинство основных технологий анализа, позволяющих достаточно быстро проектировать законченные аналитические решения, охватывающие весь цикл обработки данных. Это – многомерный анализ, нейронные сети, деревья решений, самоорганизующиеся карты, спектральный анализ и ряд других.
Применение подобных самообучающиеся методов и машинного обучения дает возможность создавать адаптивные информационные системы. Во многом такой подход делает более мягкими требования к квалификации персонала, приближая современные информационные технологии к более широкому кругу пользователей.
С помощью аналитической платформой Deductor появляется возможность извлекать из ранее накопленных и хранящихся в организации (в компании, в фирме, в департаменте государственного учреждения и др.) данные, интересную и практически полезную информацию, и тем самым трансформировать ее в знания, дающие существенные конкурентные преимущества.
Тиражирование же знаний обеспечивается за счет того, что все отчеты, модели, правила, полученные экспертом с помощью аналитической платформы Deductor, могут использоваться другими сотрудниками организации без необходимости понимания способов и методов получения этих результатов.
ЛИТЕРАТУРА К РАЗДЕЛУ I
– Deductor Integration Server – Руководство по установке и настройке Deductor Компания BaseGroup™ Labs
– Руководство администратора Deductor 5.3 Компания BaseGroup™ Labs
– Практикум Базовые навыки работы в Deductor Studio BaseGroup™ Labs, 2009
– Н. Ю. Прокопенко ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ АНАЛИЗА ДАННЫХ (аналитические информационные системы поддержки принятия решений на базе Deductor Studio Academic 5.2) Учебное пособие. Нижний Новгород2012.
II. Нейронные сети и их использование
Целью данной практической работы является ознакомление с примерами использования нейронных сетей для решения практических задач. Для выполнения работы используется свободно распространяемая аналитическая программная платформа «Deductor Academic»[1 - Учебную версию Deductor Studio Academic можно скачать бесплатно по адресу https://basegroup.ru/deductor/download.] и программа работы с электронными таблицами MS Excel.
Нейронный сети – это большой класс информационных систем, построение которых имеет некоторую аналогию с структурой нервной ткани человеческого мозга. Нейросетевые технологии функционируют аналогично неосознанным мыслительным действиям человека. Нейронные сети в искусственном интеллекте – это упрощенные модели биологических нейронных сетей.
Известно, что нервная система и мозг человека состоят из нейронов, соединенных между собой нервными волокнами. Нервные волокна способны передавать электрические импульсы между нейронами. Нейрон является особой биологической клеткой, которая обрабатывает информацию. Элементарным преобразователем в искусственных нейронных сетях является искусственный нейрон, названный так по аналогии с биологическим прототипом.
Принципиальное отличие искусственных нейросетей от обычных программных систем состоит в том, что первые не требуют программирования и их можно обучить тому, что требуется пользователю.
Одна из наиболее распространенных архитектур нейронных сетей персептрон. Он построен по принципу иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов предыдущего слоя.
Для нейросетевой модели обработки данных характерно следующее:
– однородность системы (элементы нейронной сети одинаковы и просты, все определяется структурой связи)
– надёжность системы, построенной из ненадёжных элементов, за счёт избыточного числа связей
– «голографичность», предопределяющая, что при разрушении части система сохраняет свои свойства.
Структура искусственного нейрона и нейронной сети
Схема искусственного нейрона представлена на рис. А. Сумматор ? выполняет сложение сигналов Х