Оценить:
 Рейтинг: 0

Предсказываем тренды. С Rattle и R в мир моделей классификации

Год написания книги
2019
<< 1 ... 11 12 13 14 15 16 >>
На страницу:
15 из 16
Настройки чтения
Размер шрифта
Высота строк
Поля

Вторая часть книги является переводом краткого руководства по Rattle.

Эта часть полезна как на этапе первоначального знакомства с Rattle, так и на этапе постоянного использования в качестве краткого справочника.

Текст не содержит подробностей и будет полезен тем, кто либо только начинает работать с предсказательными моделями, либо хочет апробировать некоторую идею.

12. Работа новичка с Rattle

12.1. Интерфейс Rattle

Рассмотрим интерфейс Rattle. Интерфейс основан на ряде последовательных вкладок, через которые выполняется предсказательное моделирование трендов. Для любой вкладки, как только мы предоставили запрошенную информацию, нажмем кнопку Выполнить для выполнения действия. Отметим в меню кнопку Help (Справка).

Интерфейс Rattle спроектирован как простой интерфейс к мощному комплекту базовых инструментов для моделирования финансовых данных. Общий процесс состоит в последовательном движении по вкладкам, слева направо, выполняя соответствующие действия. Для любой вкладки мы конфигурируем опции и затем нажимаем кнопку Выполнить (или F2) для выполнения соответствующей задачи. Важно отметить, что задачи не выполняются, пока кнопка Выполнить (или F2, или пункт меню Выполнить в закладке Tools (Инструменты)) не нажата.

Строка состояния внизу окна укажет на завершение действия. Сообщения от R (например, сообщения об ошибках) могут появиться на консоли R, на которой был запущен Rattle. Так как Rattle – простой графический интерфейс, находящийся поверх R, важно помнить, что некоторые ошибки, с которыми встречается R при загрузке данных (и фактически во время любой работы, выполняемой Rattle), могут быть выведены на консоли R.

Код R, который Rattle передает R для выполнения, записан в журнале, доступном на вкладке Log. Это позволяет рассматривать команды R, которые выполняют соответствующие задачи анализа данных. Фрагменты кода R можно копировать как текст с вкладки Log и вставлять в консоль R, в которой исполняется Rattle. Это позволяет развернуть Rattle для основных задач, и дает нам полную мощность R, которую, при необходимости, можно развернуть, возможно, с использованием большего количества опций команды, чем представлено через интерфейс Rattle. Этим предоставляется возможность экспортировать целый сеанс как файл скрипта R.

Журнал служит записью предпринятых действий и позволяет повторить выполненные действия непосредственно и автоматически в R в более позднее время. Просто выберите (чтобы вывести на экран) вкладку Log и щелкните по кнопке Export. Будет экспортирован журнал в файл, у которого будет расширение R. Можно будет включить или исключить обширные комментарии, имеющиеся в журнале и переименовать внутренние переменные Rattle (с символов «crs$» в символы по выбору).

Теперь рассмотрим главные элементы пользовательского интерфейса Rattle, особенно панель инструментов и меню. Начнем с основной концепции – проекта.

12.1.1. Проекты

Проект – упаковка набора данных, выбранные переменные, исследования и модели, созданные из данных. Rattle позволяет сохранять проекты для последующего продолжения работы.

Проект обычно сохраняется в файле с расширением. Rattle. Фактически, файл – это стандартный двоичный файл RData, используемый R для хранения объектов в более компактной двоичной форме. Любая система R может загрузить такой файл и, следовательно, иметь доступ к этим объектам, даже не исполняя Rattle.

Загрузка файла. Rattle в Rattle (используя кнопку Открыть) загрузит проект в Rattle, восстанавливая данные, модели и другую выведенную на монитор информацию, связанную с проектом, включая информацию об итогах и журнале. Затем можно возобновить анализ данных от прошлой точки.

С точки зрения файловой системы можно переименовать файлы (так же как расширение, хотя это не рекомендуется), не воздействуя на сам файл проекта, у имени файла нет формальной опоры на содержание, так что используйте его с содержательным значением. Лучше избегать пробелов и необычных символов в именах файла.

Проекты открываются и сохраняются с использованием соответствующих кнопок на панели инструментов или из меню Project.

12.1.2. Панель инструментов

Самая важная кнопка на панели инструментов – это кнопка Выполнить. Все действия инициируется Выполнить. Заменой клавиши Выполнить является функциональная клавиша F2. Также доступен пункт меню Выполнить. Стоит повторить, что парадигма пользовательского интерфейса, используемая в пределах Rattle, состоит в том, чтобы задать параметры на вкладке, а затем Выполнить соответствующее действие.

Рис.12.1. Меню и панель инструментов Rattle

Следующие некоторые кнопки на панели инструментов касаются понятия проекта в пределах Rattle. Проекты были обсуждены выше.

Щелчок по кнопке Создать восстановит Rattle в свое изначальное состояние запуска без загруженного набора данных. Это может быть полезно, когда исходный набор данных был внешне изменен (внешний к Rattle и R). Мы, возможно, например, управляли данными в электронной таблице или программе базы данных и реэкспортировали данные в файл CSV. Чтобы перезагрузить этот файл в Rattle, если мы ранее загрузили его в текущий сеанс Rattle, следует очистить Rattle щелчком кнопки Создать. Затем указать имя файла и перезагрузить его.

Кнопка Report предоставит отформатированный отчет, основанный на текущей вкладке. Rattle имеет много шаблонов отчетов и генерирует документ в открытом стандартном формате ODT для открытого исходного кода и поддерживается стандартом LibreOffice. Пока поддержка генерируемых пользователями отчетов ограничена, журнал предоставляет необходимые команды, используемые для генерирования файла ODT. Таким образом, можно создать собственные шаблоны ODT и применить их в пределах контекста текущего сеанса Rattle.

Кнопка Export экспортирует различные объекты и сущности из Rattle. Подробности доступны в соответствующих разделах в следующих главах. Природа экспорта зависит от активной вкладки и в пределах вкладки от активной опции. Кнопка Export не доступна для всех вкладок и опций.

12.1.3. Меню

Вкладка в меню Tools обеспечивают альтернативный доступ ко многим функциям интерфейса. Ключевой пункт в использования меню состоит в том, что по нему можно перемещаться из клавиатуры.

Вкладка меню Project предоставляет доступ к опциям Открыть и Сохранить для загрузки и сохранения проектов «в» или «из» файлов. Меню Tools предоставляет доступ к некоторым другим функциям панели инструментов, а так же доступ к определенным вкладкам. Пункт меню Settings позволяет нам управлять многими дополнительными настройками Rattle. Они включают подсказки и использование более современного устройства графики.

Обширная справка доступна через пункт меню Help. Структура меню следует за структурой вкладок главного интерфейса. При выборе темы справки краткий выпадающий текст выведет на экран некоторую основную информацию на английском языке. Для многих из открытых опций отображается дополнительная информация, которая будет выведена на экран в пределах Веб-браузера на английском языке. Эта дополнительная документация предоставляется непосредственно из документации R или соответствующим пакетом R.

12.1.4. Перемещение с помощью клавиатуры

Перемещение с помощью клавиатуры обычно инициировано функциональной клавишей F10. Клавиши со стрелками клавиатуры могут использоваться для перемещения. Нажатие клавиши Enter клавиатуры выберет выделенный пункт меню.

Разумное использование клавиатуры (в частности клавиши со стрелками, ключи Tab и Shift-Tab и клавиша Enter, вместе с F2 и F10) позволяет нам полностью управлять Rattle с клавиатуры.

12.2. Введение в моделирование с Rattle

Предсказательное моделирование комбинирует понятия, инструменты и алгоритмы из машинного обучения, искусственного интеллекта и статистики для обучения моделей на исторических данных и последующего предсказания целевой переменной на тестовых и проверочных данных.

Rattle (Простое обучение аналитическим инструментам R) является инструментом в виде графического интерфейса пользователя (GUI) (Уильямс, 2009b). Он определенно разрабатывался для упрощения перехода от первых прикидочных шагов к созданию предсказательных моделей, что предполагает наличие GUI, к сложным вариантам предсказательных моделей с использованием мощного статистического языка R.

Rattle объединяет множество пакетов R, которые важны для построения предсказательных моделей, но часто не легки для использования новичком. На первоначальном этапе применения Rattle понимание R не требуется. Пользовательский интерфейс Rattle открывает дверь в R как инструмента статистического моделирования данных.

12.3. Построение модели

Rattle определенно использует простую концепцию, основанную на вкладках, для пользовательского интерфейса, выполняя операции над данными в соответствии с назначением вкладки. Типичный поток операций следует с левой вкладки (вкладка Data – Данные) направо (вкладка Log – Журнал). Для любой вкладки пользователь должен указать доступные параметры, а затем нажать кнопку Выполнить (или F2), чтобы выполнить соответствующую задачу. Строка состояния внизу окна укажет завершение действия.

Можно показать, что очень просто, если нереалистично, Rattle создает предсказательную модель всего четырьмя щелчками мышью. Запускаем R, загружаем пакет Rattle и даем команду Rattle (). Затем:

– щелкаем по кнопке Выполнить;

– щелкаем по Yes в раскрывшемся окне;

– щелкаем по вкладке Model;

– щелкните по кнопке Выполнить.

На основе демонстрационных данных мы получили предсказательную модель классификационного типа в виде дерева решений.

Одним или еще двумя щелчками могут быть созданы альтернативные модели. Еще несколькими щелчками получим на мониторе диаграмму оценки для сравнения результативность созданных моделей. Затем еще пара щелчков – и применили обученные на первом этапе модели на новых наборах данных.

Конечно, применимость древовидной модели на финансовых рынках крайне ограниченна. Но простой пример наглядно демонстрирует простоту применения Rattle.

Общие шаги при проектировании предсказательной модели в итоге выглядит как:

– загрузите исходные данные (Source) в одном из возможных форматов и выберите переменные и назначьте их роли.

– исследуйте (Explore) данные, чтобы понять распределения.

– протестируйте (Test) распределения;

– преобразуйте (Transform) данные, чтобы удовлетворить моделированию.
<< 1 ... 11 12 13 14 15 16 >>
На страницу:
15 из 16