Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

Ограниченная машина Больцмана кратко

Лекция



Привет, Вы узнаете о том , что такое ограниченная машина больцмана, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое ограниченная машина больцмана, омб , настоятельно рекомендую прочитать все из категории Вычислительный интеллект.

ограниченная машина больцмана ( омб , англ. Restricted Boltzmann machine, RBM ) - это порождающих стохастическая искусственная нейронная сеть , способная учиться распределения вероятностей над набором ее входов.

ОМБ было сначала изобретено под названием гармониум ( англ. Harmonium - фисгармония ) Полом Смоленским 1986 года, а популярность они приобрели после изобретения Джефри Хинтон с соавторами в середине 2000-х годов алгоритмов быстрого обучения для них. ОМБ нашли применение в снижении размерности , классификации , колаборативних фильтрации , обучении признаков и тематическом моделировании . Их может быть тренированным как управляемым , так и спонтанным образом, в зависимости от задачи.

Как следует из их названия, ОМБ является вариантом машин Больцмана , с тем ограничением, что их нейроны должны формировать двудольный граф : пара узлов с каждой из двух групп узлов (что, как правило, называют «видимым» и «скрытым» узлами соответственно) могут иметь симметричное соединение между ними, но соединений между узлами в группе не существует. Напротив, «неограниченные» машины Больцмана могут иметь соединение между скрытыми узлами. Это ограничение позволяет эффективнее алгоритмы тренировки, чем доступны для общего класса машин Больцмана, в частности, алгоритм сравнительной разногласия ( англ. Contrastive divergence ) на основе градиентного спуска .

Ограниченные машины Больцмана могут также применяться в сетях глубинного обучения . В частности, глубинные сети убеждений могут образовываться «сборкой» ОМБ и, возможно, тонкой настройкой получаемой в результате глубинной сети с помощью градиентного спуска и обратного распространения .

Ограниченные машины Больцмана имеют широкий спектр применений — это задачи снижения размерности данных, задачи классификации, коллаборативная фильтрация, выделение признаков (англ. feature learning)и тематическое моделирование.

В ограниченной машине Больцмана нейроны образуют двудольный граф, с одной стороны графа находятся видимые нейроны (вход), а с другой стороны — скрытые, причем перекрестные связи устанавливаются между каждым видимым и каждым скрытым нейроном. Такая система связей позволяет применить при обучении сети метод градиентного спуска с контрастивной дивергенцией .

Ограниченные машины Больцмана могут также применяться в сетях глубинного обучения . В частности, глубинные сети убеждений могут образовываться «сборкой» ОМБ и, возможно, тонкой настройкой получаемой глубинной сети с помощью градиентного спуска и обратного распространения

Ограниченная машина Больцмана

Ограниченная машина Больцмана

Связь с другими моделями

Ограниченная машина Больцмана представляет собой частный случай обычной машины Больцмана и марковской сети[10][11]. Их графовая модель соответствует графовой модели факторного анализа

Структура

Стандартный тип ОМБ имеет двийковозначни ( булевы / бернуллиеви ) скрытые и видимые узлы и состоит из матрицы весовых коэффициентов Ограниченная машина Больцмана(размера m × n ), связанной с соединением между скрытым узломОграниченная машина Больцманаи видимым узломОграниченная машина Больцмана, А также весовых коэффициентов предубеждений ( оползней )Ограниченная машина Больцмана для видимых узлов и Ограниченная машина Больцманадля скрытых узлов. Об этом говорит сайт https://intellect.icu . С учетом этого, энергия конфигурации (пары булевых векторов) ( v , h ) определяется как

Ограниченная машина Больцмана

или, в матричной записи,

Ограниченная машина Больцмана

Эта функция энергии аналогична функции энергии сети Хопфилда . Как и в общих машинах Больцмана, распределения вероятности над скрытыми и / или видимыми векторами определяются в терминах функции энергии:

Ограниченная машина Больцмана

где Ограниченная машина Больцманаявляется статистической суммой , определенной как суммаОграниченная машина Больцмананад всеми возможными конфигурациями (то есть, просто нормировочная стала [en] для обеспечения того, чтобы распределение вероятности давал в сумме 1). Аналогично, ( обособленная ) вероятность видимого (входящего) вектора булевых значений является суммой над всеми возможными конфигурациями скрытого слоя:

Ограниченная машина Больцмана

Поскольку ОМБ имеет форму двудольных графу, без соединений внутри слоев, активации скрытых узлов взаимно независимыми для заданных активаций видимых узлов, и наоборот, активации видимых узлов являются взаимно независимыми для заданных активаций скрытых узлов. То есть, дляОграниченная машина Больцмана видимых узлов и Ограниченная машина Больцманаскрытых узлов условной вероятностью конфигурации видимых узлов v для заданной конфигурации скрытых узлов h является

Ограниченная машина Больцмана.

И наоборот, условной вероятностью h для заданной v является

Ограниченная машина Больцмана.

Отдельные вероятности активации задаются как

Ограниченная машина Больцмана и Ограниченная машина Больцмана

где Ограниченная машина Больцманаобозначает логистическую сигмоид .

Несмотря на то, что скрытые узлы являются бернуллиевимы , видимые узлы ОМБ могут быть многозначными . В таком случае логистическая функция для видимых узлов заменяется нормированной экспоненциальной функцией ( англ. Softmax function )

Ограниченная машина Больцмана

где K является количеством дискретных значений, имеющих видимые значения. Они применяются в тематическом моделировании и рекомендательных системах .

Соотношение с другими моделями

Ограниченные машины Больцмана является случаем машин Больцмана и марковских случайных полей . Их графовая модель соответствует модели факторного анализа .

Алгоритм тренировки

Ограниченные машины Больцмана тренируются максимизировать произведение вероятностей, предназначенных определенном тренировочном набору Ограниченная машина Больцмана (Матрица, каждая строка которого рассматривается как видим вектор Ограниченная машина Больцмана)

Ограниченная машина Больцмана

или, равноценно, максимизировать математическое ожидание логарифмической вероятности Ограниченная машина Больцмана:

Ограниченная машина Больцмана

Алгоритму, чаще всего применяется для тренировки ОМБ, то есть для оптимизации вектора весовых коэффициентов Ограниченная машина Больцмана, Алгоритм сравнительной расхождения (ПР, англ. Contrastive divergence, CD ), принадлежащей Хинтон , первично разработан для тренировки моделей произведения экспертов ( англ. Product of experts, PoE ). Этот алгоритм осуществляет выборку по Гиббс [en] , и используется внутри процедуры градиентного спуска (подобного тому, как обратное распространение используется внутри такой процедуры при тренировке нейронных сетей прямого распространения) для вычисления уточнения весовых коэффициентов.

Элементарную, одношаговую процедуру сравнительной расхождения (ТР-1, англ. CD-1 ) для единого образца может быть описано следующим образом:

  1. Взять тренировочный образец v , вычислить вероятности скрытых узлов, и выбрать вектор скрытой активации h из этого распределения вероятности.
  2. Вычислить внешний произведение v и h , и назвать это положительным градиентом .
  3. Опираясь на h , выбрать восстановление видимых узлов v ' , а затем перевибраты с ней скрытые активации h' . (шаг выборки по Гиббс)
  4. Вычислить внешний произведение v ' и h' , и назвать это негативным градиентом .
  5. положить уточнением Ограниченная машина Больцмана разницу положительного и отрицательного градиентов, умноженную на определенный темп обучения: Ограниченная машина Больцмана.

Правило уточнения для предубеждений a и b определяется аналогично.

Вау!! 😲 Ты еще не читал? Это зря!

Представленные результаты и исследования подтверждают, что применение искусственного интеллекта в области ограниченная машина больцмана имеет потенциал для революции в различных связанных с данной темой сферах. Надеюсь, что теперь ты понял что такое ограниченная машина больцмана, омб и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Вычислительный интеллект

Из статьи мы узнали кратко, но содержательно про ограниченная машина больцмана
создано: 2017-04-05
обновлено: 2021-03-30
132563



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей



Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Вычислительный интеллект

Термины: Вычислительный интеллект