Оценить:
 Рейтинг: 0

Глоссариум по искусственному интеллекту: 2500 терминов. Том 1

Год написания книги
2022
<< 1 ... 10 11 12 13 14
На страницу:
14 из 14
Настройки чтения
Размер шрифта
Высота строк
Поля

МодельLaMDA (LaMDA) – это языковая модель для диалоговых приложений, новая технология Google для обработки диалоговой речи. модель LaMDA разработана Google как открытое приложение для разговорного ИИ. Она берет на себя роль человека или аватара во время разговоров с пользователями.

Модель вероятностной регрессии (Probabilistic regression model) – это модель регрессии, в которой используются не только веса для каждого признака, но и неопределенность этих весов. Модель вероятностной регрессии генерирует прогноз и неопределенность этого прогноза.

Модель классификации (Classification model) – это тип модели машинного обучения для различения двух или более дискретных классов. Например, модель классификации обработки естественного языка может определить, было ли входное предложение французским, испанским или итальянским.

Модель мешка слов (Bag-of-words model) – это упрощающее представление, используемое при обработке естественного языка и поиске информации (IR). В этой модели текст (например, предложение или документ) представляется в виде набора (мультимножества) его слов без учета грамматики и даже порядка слов, но с сохранением множественности. Модель мешка слов также использовалась для компьютерного зрения. Модель мешка слов обычно используется в методах классификации документов, где (частота) появления каждого слова используется в качестве признака для обучения классификатора.

Модель мешка слов в компьютерном зрении (Bag-of-words model in computer vision) – в компьютерном зрении эту модель (модель BoW) можно применять для классификации изображений, рассматривая признаки изображения как слова. В классификации документов набор слов представляет собой разреженный вектор количества встречаемости слов; то есть разреженная гистограмма по словарному запасу. В компьютерном зрении набор визуальных слов представляет собой вектор количества встречаемости словаря локальных признаков изображения.

Модель от последовательности к последовательности (Sequence-to-sequence model, seq2seq). Самая популярная задача на последовательность – это перевод: обычно с одного естественного языка на другой. За последние пару лет коммерческие системы стали на удивление хороши в машинном переводе – взгляните, например, на Google Translate, Yandex Translate, DeepL Translator, Bing Microsoft Translator. Сегодня мы узнаем об основной части этих систем.

Модель последовательности (Sequence model) – это модель, входы которой имеют последовательную зависимость. Например, предсказание следующего видео, просмотренного на основе последовательности ранее просмотренных видео.

Модель регрессии (Regression model) – это тип модели, которая выводит непрерывные значения (обычно с плавающей запятой).

Модель убеждений, желаний и намерений (Belief-desire-intention software model) – это модель программирования интеллектуальных агентов. Образно модель описывает убеждения, желания и намерения каждого агента, однако непосредственно применительно к конкретной задаче агентного программирования. По сути, модель предоставляет механизм позволяющий разделить процесс выбора агентом плана (из набора планов или внешнего источника генерации планов) от процесса исполнения текущего плана, выбранного ранее. Как следствие, агенты, повинующиеся данной модели способны уравновешивать время, затрачиваемое ими на выбор и отсеивание будущих планов со временем исполнения выбранных планов. Процесс непосредственного синтеза планов (планирование) в модели не описывается и остаётся на откуп программного дизайнера или программиста.

Модель Generative Pre-trained Transformer (Generative Pre-trained Transformer) – это семейство больших языковых моделей на основе Transformer, разработанных OpenAI. Варианты GPT могут применяться к нескольким модальностям, в том числе: • генерация изображений (ImageGPT) • преобразование текста в изображение (DALL-E).

Модули векторной обработки (Intelligent Engines) – это поле выполнения операций умножения с плавающей запятой с минимальными задержками (DSP Engines) и специализированное поле/модуль AI Engines c высокой пропускной способностью, а также минимальными задержкам на выполнение операций и оптимальным уровнем энергопотребления, предназначенное для решения задач в области реализации искусственного интеллекта (AI inference) и цифровой обработки сигналов.

Модус поненс(Modus ponens) – это правило логики, которое позволяет вам применять операторы «если-то» для получения части «тогда» всякий раз, когда часть «если» удовлетворяется.

Модус толленс (Modus Tollens) – это форма дедуктивного аргумента и правило логики, используемое для выводов из аргументов и наборов аргументов. Modus tollens утверждает, что если P истинно, то Q также истинно. Если P ложно, следовательно, Q также ложно.

Мозговая технология (также самообучающаяся система ноу-хау) (Brain technology) – это технология, в которой используются последние открытия в области неврологии. Термин был впервые введен Лабораторией искусственного интеллекта в Цюрихе, Швейцария, в контексте проекта ROBOY. Brain Technology может использоваться в роботах, системах управления ноу-хау и любых других приложениях с возможностями самообучения. В частности, приложения Brain Technology позволяют визуализировать базовую архитектуру обучения, которую часто называют «картами ноу-хау».

Мозгоподобные вычисления (Brain-inspired computing) – это вычисления на мозгоподобных структурах, вычисления, использующие принципы работы мозга.

Мультиагентные системы (Multi-agent system MAS) – это основная область исследований современного искусственного интеллекта. Многоагентная система состоит из нескольких агентов, принимающих решения, которые взаимодействуют в общей среде для достижения общих или противоречивых целей. С помощью методологий MAS можно решать широкий спектр приложений, включая автономное вождение, фабрики с несколькими роботами, автоматическую торговлю, коммерческие игры, автоматизированное обучение и т. д.

Мультиголовное самовнимание (Multi-head self-attention) – является ключевым компонентом Transformer- современной архитектуры для нейронного машинного перевода. Механизм самовнимания в настоящее время встречается в самых различных архитектурах и задачах (перевод, генерация текста, аннотация изображений и т.д.).

Мульти-классовая классификация (Multi-class classification) – это классификация, включающая более двух классов, например, классификация серии фотографий породы собак, которые могут быть мопсом, бульдогом или мастифом. Мультиклассовая классификация предполагает, что каждый образец относится к одному классу, например, собака может быть либо мопсом, либо бульдогом, но не тем и другим одновременно.

Мультимодальная модель (Multimodal model) – это текст и другие типы ввода (такие как графика, изображения и т. д.) и более специфичные для конкретной задачи. В мультимодальных средах модель преобразователей используется для создания прогнозов путем слияния текста и изображения. Различные входные данные объединяются, и поверх позиционных вложений добавляется встраивание сегмента, чтобы сообщить модели, какая часть входного вектора относится к тексту, а какая к изображению. Такая классификация возможна с предварительно обученной моделью [[60 - Мультимодальная модель [Электронный ресурс] www.projectpro.io URL: https://www.projectpro.io/recipes/what-are-multimodal-models-transformers (https://www.projectpro.io/recipes/what-are-multimodal-models-transformers) (дата обращения: 07.07.2022)]].

Мультимодальное обучение (Multi-Modal Learning) – это подраздел машинного обучения, когда данные поступают из разных источников. Модусы – это, по сути, каналы информации. Эти данные из нескольких источников семантически коррелированы и иногда предоставляют дополнительную информацию друг другу, таким образом отражая шаблоны, которые не видны при работе с отдельными модальностями сами по себе.

Мультимодальные приложения (Multimodal application) – это объединение различных модальностей или типов информации для повышения производительности в области глубокого обучения. Чтобы искусственный интеллект смог добиться прогресса в понимании окружающего мира, он должен уметь вместе интерпретировать такие мультимодальные сигналы. Мультимодальное глубокое обучение опирается на множество модусов, каждый из которых вносит свой вклад в значение.

Мульти-опыт (Multi-experience) – это часть долгосрочного перехода от индивидуальных компьютеров, которые мы используем сегодня, к многопользовательским, мультисенсорным и многолокационным системам, процесс замены людей, понимающих технологии, на технологии, понимающие людей.

Мусор на входе – мусор на выходе (Garbage In, Garbage Out) – это принцип в информатике, означающий, что при неверных входящих данных будут получены неверные результаты, даже если сам по себе алгоритм правилен.

Мутация (Mutation) – это тип тестирования программного обеспечения, при котором определенные операторы исходного кода изменяются/мутируют, чтобы проверить, могут ли тестовые примеры найти ошибки в исходном коде. Целью мутационного тестирования является обеспечение качества тестовых примеров с точки зрения надежности, чтобы они не давали сбой мутировавшему исходному коду. Изменения, внесенные в мутантную программу, должны быть очень небольшими, чтобы они не влияли на общую цель программы. Мутационное тестирование также называется стратегией тестирования на основе ошибок, поскольку оно включает создание ошибки в программе и представляет собой тип тестирования белого ящика, который в основном используется для модульного тестирования.

Набор данных(Data set) – это совокупность данных, прошедших предварительную подготовку (обработку) в соответствии с требованиями законодательства Российской Федерации об информации, информационных технологиях и о защите информации и необходимых для разработки программного обеспечения на основе искусственного интеллекта (Национальная стратегия развития искусственного интеллекта на период до 2030 года).

«Н»

Набор данных DataFrame (DataFrame) – это проиндексированный многомерный массив значений для представления наборов данных в pandas. DataFrame аналогичен таблице. Каждый столбец DataFrame имеет имя (заголовок), а каждая строка идентифицируется номером.

Набор признаков (Feature set) – это группа признаков, на которых обучается модель машинного обучения. Например, почтовый индекс, размер собственности и состояние могут представлять собой простой набор признаков для модели, предсказывающей цены на жилье.

Наивная семантика (Naive semantics) – это подход, используемый в компьютерных науках для представления базовых знаний о конкретной области, и он использовался в таких приложениях, как представление значения предложений на естественном языке в приложениях искусственного интеллекта. В общем случае этот термин использовался для обозначения использования ограниченного хранилища общепонятных знаний о конкретной области в мире и применялся к таким областям, как проектирование схем данных, основанное на данных.

Наивный Байес (Naive Bayes) – это очень популярный и простой в машинном обучении алгоритм. Как следует из названия, этот алгоритм делает предположение, что все переменные в наборе данных «наивные», т.е. не коррелируют друг с другом. [[61 - Наивный Байес [Электронный ресурс] //proglib.io URL: https://proglib.io/p/izuchaem-naivnyy-bayesovskiy-algoritm-klassifikacii-dlya-mashinnogo-obucheniya-2021-11-12 (https://proglib.io/p/izuchaem-naivnyy-bayesovskiy-algoritm-klassifikacii-dlya-mashinnogo-obucheniya-2021-11-12) (дата обращения: 07.07.2022)]]

Наивный байесовский классификатор (Naive Bayes classifier) – это простой вероятностный классификатор, основанный на применении теоремы Байеса со строгими (наивными) предположениями о независимости.

Намерение (Intent) – это механизм для описания операции (выбрать фотографию, отправить письмо, сделать звонок, запустить браузер и перейти по указанному адресу), которую необходимо выполнить. Используется в обучающих данных для чат-ботов и других задач обработки естественного языка, в качестве типа метки, которая определяет цель сказанного.

Направленный ациклический граф (Directed acyclic graph, DAG) – это график, которые направлен и связывает остальные рёбра без циклов. Это значит, что невозможно преодолеть весь направленный граф, начав с одного ребра. Рёбра направленного графа идут только одним путём.

Направленный ациклический граф являет собой топологическую сортировку, где каждый нод находится в определённом порядке. Конструкция DAG состоит из вершин, соединяемых рёбрами. Основной алгоритм DAG называется топологическим распределением, это означает, что каждое ребро направлено от более раннего ребра к более позднему.

Наука о данных (Data Science) – это профессиональная деятельность, связанная с эффективным и максимально достоверным поиском закономерностей в данных, извлечение знаний из данных в обобщённой форме, а также их оформление в виде, пригодном для обработки заинтересованными сторонами (людьми, программными системами, управляющими устройствами) в целях принятия обоснованных решений. Также, – это процесс исследования, фильтрация, преобразование и моделирования данных с целью извлечения полезной информации и принятия решений.

Н-грамма (N-gram) – это просто последовательность из n элементов (звуков, слогов, слов или символов), идущих в каком-то тексте подряд. На практике чаще имеют в виду ряд слов (реже символов). Последовательность из двух элементов называют биграмма, из трёх элементов – триграмма [[62 - Н-грамма [Электронный ресурс] //sysblok.ru URL: https://sysblok.ru/knowhow/chto-takoe-n-grammy-i-s-chem-ih-edjat/ (https://sysblok.ru/knowhow/chto-takoe-n-grammy-i-s-chem-ih-edjat/) (дата обращения: 07.07.2022)]].

Небольшие данные (Small data) – это данные, представляемые в таких объеме и формате для понимания человеком, в каких они становятся доступными, информативными и действенными.

Недетерминированные алгоритмы (Nondeterministic algorithm) – это алгоритмы, которые даже для одних и тех же входных данных могут демонстрировать различное поведение при разных прогонах, итерациях, выполнениях. Он тесно связан с недетерминированными машинами Тьюринга и классами сложности NP. Это алгоритм, результат которого не может быть заранее определен.

Недоумение (Perplexity) – это показатель того, насколько эффективно вероятностная модель может предсказывать выборку в контексте статистического измерения информации. Например, BLEU – это показатель сложности для моделей языкового перевода, который измеряет, насколько хорошо модель может переводить с одного языка на другой.

Независимо и одинаково распределенные (Independently and identically distributed i.i.d) – это набор случайных данных (величин, переменных) в котором каждая случайная величина имеет такое же распределение вероятностей, как и другие, и все они взаимно при этом независимы. Классический пример iid появляется во время игры с подбрасыванием монеты. Случайные переменные, которые представляют каждый результат бросков (0 для решки и 1 для решки), подчиняются одному и тому же закону Бернулли. Более того, поскольку броски являются последовательными, результаты не зависят друг от друга, и, следовательно, случайные величины независимы.

Нейрокибернетика (Neurocybernetics) – это научное направление, изучающее основные закономерности организации и функционирования нейронов и нейронных образований. Основным методом нейрокибернетики является математическое моделирование, при этом данные физиологического эксперимента используются в качестве исходного материала для создания моделей. Одним из наиболее перспективных направлений нейрокибернетики -на стыке между психологией, биологией и информатикой является моделирование на основе нейронных сетей. Нейрокибернетика имеет широкий спектр приложений – от медико-биологических разработок до создания специализированных нейрокомпьютеров. [[63 - Нейрокибернетика [Электронный ресурс] //kartaslov.ru URL: https://kartaslov.ru (https://kartaslov.ru/) (дата обращения: 07.07.2022)]]

Нейрокомпьютер (Neurocomputer) – устройство переработки информации на основе принципов работы естественных нейронных систем. Эти принципы были формализованы, что позволило говорить о теории искусственных нейронных сетей. Проблематика же нейрокомпьютеров заключается в построении реальных физических устройств, что позволит не просто моделировать искусственные нейронные сети на обычном компьютере, но так изменить принципы работы компьютера, что станет возможным говорить о том, что они работают в соответствии с теорией искусственных нейронных сетей [[64 - Нейрокомпьютер. [Электронный ресурс] //ru.wikipedia.org. URL: https://ru.wikipedia.org/ wiki/Нейрокомпьютер (дата обращения: 04.08.2022)]].

Нейрология (нейронаука, Neuroscience) – это изучение того, как развивается нервная система, ее структура и функции. Нейробиологи сосредотачиваются на мозге и его влиянии на поведение и когнитивные функции. Неврология занимается не только нормальным функционированием нервной системы, но и тем, что происходит с нервной системой, когда у людей возникают неврологические, психические расстройства и нарушения развития нервной системы. Неврологию часто называют во множественном числе нейробиологией. Неврологию традиционно относят к разделу биологии. В наши дни это междисциплинарная наука, которая тесно связана с другими дисциплинами, такими как математика, лингвистика, инженерия, информатика, химия, философия, психология и медицина. Многие исследователи говорят, что нейробиология означает то же самое, что и нейробиология. Тем не менее, нейробиология рассматривает биологию нервной системы, в то время как неврология относится ко всему, что связано с нервной системой.

Нейроморфная инженерия (Neuromorphic engineering) – это использование принципов построения биологических нервных систем при конструировании микросхем; концепция, предложенная Карвером Мидом (Carver Mead) в конце 1980-х гг. с целью создания искусственных нейронов, СБИС и систем, копирующих архитектуры нервных систем биологических объектов.


Вы ознакомились с фрагментом книги.
Приобретайте полный текст книги у нашего партнера:
<< 1 ... 10 11 12 13 14
На страницу:
14 из 14

Другие электронные книги автора Матвей Олегович Баканач