Лекция
Привет, Вы узнаете о том , что такое ограниченная машина больцмана, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое ограниченная машина больцмана, омб , настоятельно рекомендую прочитать все из категории Вычислительный интеллект.
ограниченная машина больцмана (
омб , англ. Restricted Boltzmann machine, RBM ) - это порождающих стохастическая искусственная нейронная сеть , способная учиться распределения вероятностей над набором ее входов.
ОМБ было сначала изобретено под названием гармониум ( англ. Harmonium - фисгармония ) Полом Смоленским 1986 года, а популярность они приобрели после изобретения Джефри Хинтон с соавторами в середине 2000-х годов алгоритмов быстрого обучения для них. ОМБ нашли применение в снижении размерности , классификации , колаборативних фильтрации , обучении признаков и тематическом моделировании . Их может быть тренированным как управляемым , так и спонтанным образом, в зависимости от задачи.
Как следует из их названия, ОМБ является вариантом машин Больцмана , с тем ограничением, что их нейроны должны формировать двудольный граф : пара узлов с каждой из двух групп узлов (что, как правило, называют «видимым» и «скрытым» узлами соответственно) могут иметь симметричное соединение между ними, но соединений между узлами в группе не существует. Напротив, «неограниченные» машины Больцмана могут иметь соединение между скрытыми узлами. Это ограничение позволяет эффективнее алгоритмы тренировки, чем доступны для общего класса машин Больцмана, в частности, алгоритм сравнительной разногласия ( англ. Contrastive divergence ) на основе градиентного спуска .
Ограниченные машины Больцмана могут также применяться в сетях глубинного обучения . В частности, глубинные сети убеждений могут образовываться «сборкой» ОМБ и, возможно, тонкой настройкой получаемой в результате глубинной сети с помощью градиентного спуска и обратного распространения .
Ограниченные машины Больцмана имеют широкий спектр применений — это задачи снижения размерности данных, задачи классификации, коллаборативная фильтрация, выделение признаков (англ. feature learning)и тематическое моделирование.
В ограниченной машине Больцмана нейроны образуют двудольный граф, с одной стороны графа находятся видимые нейроны (вход), а с другой стороны — скрытые, причем перекрестные связи устанавливаются между каждым видимым и каждым скрытым нейроном. Такая система связей позволяет применить при обучении сети метод градиентного спуска с контрастивной дивергенцией .
Ограниченные машины Больцмана могут также применяться в сетях глубинного обучения . В частности, глубинные сети убеждений могут образовываться «сборкой» ОМБ и, возможно, тонкой настройкой получаемой глубинной сети с помощью градиентного спуска и обратного распространения
Стандартный тип ОМБ имеет двийковозначни ( булевы / бернуллиеви ) скрытые и видимые узлы и состоит из матрицы весовых коэффициентов (размера m × n ), связанной с соединением между скрытым узломи видимым узлом, А также весовых коэффициентов предубеждений ( оползней ) для видимых узлов и для скрытых узлов. Об этом говорит сайт https://intellect.icu . С учетом этого, энергия конфигурации (пары булевых векторов) ( v , h ) определяется как
или, в матричной записи,
Эта функция энергии аналогична функции энергии сети Хопфилда . Как и в общих машинах Больцмана, распределения вероятности над скрытыми и / или видимыми векторами определяются в терминах функции энергии:
где является статистической суммой , определенной как сумманад всеми возможными конфигурациями (то есть, просто нормировочная стала [en] для обеспечения того, чтобы распределение вероятности давал в сумме 1). Аналогично, ( обособленная ) вероятность видимого (входящего) вектора булевых значений является суммой над всеми возможными конфигурациями скрытого слоя:
Поскольку ОМБ имеет форму двудольных графу, без соединений внутри слоев, активации скрытых узлов взаимно независимыми для заданных активаций видимых узлов, и наоборот, активации видимых узлов являются взаимно независимыми для заданных активаций скрытых узлов. То есть, для видимых узлов и скрытых узлов условной вероятностью конфигурации видимых узлов v для заданной конфигурации скрытых узлов h является
.
И наоборот, условной вероятностью h для заданной v является
.
Отдельные вероятности активации задаются как
и
где обозначает логистическую сигмоид .
Несмотря на то, что скрытые узлы являются бернуллиевимы , видимые узлы ОМБ могут быть многозначными . В таком случае логистическая функция для видимых узлов заменяется нормированной экспоненциальной функцией ( англ. Softmax function )
где K является количеством дискретных значений, имеющих видимые значения. Они применяются в тематическом моделировании и рекомендательных системах .
Ограниченные машины Больцмана является случаем машин Больцмана и марковских случайных полей . Их графовая модель соответствует модели факторного анализа .
Ограниченные машины Больцмана тренируются максимизировать произведение вероятностей, предназначенных определенном тренировочном набору (Матрица, каждая строка которого рассматривается как видим вектор )
или, равноценно, максимизировать математическое ожидание логарифмической вероятности :
Алгоритму, чаще всего применяется для тренировки ОМБ, то есть для оптимизации вектора весовых коэффициентов , Алгоритм сравнительной расхождения (ПР, англ. Contrastive divergence, CD ), принадлежащей Хинтон , первично разработан для тренировки моделей произведения экспертов ( англ. Product of experts, PoE ). Этот алгоритм осуществляет выборку по Гиббс [en] , и используется внутри процедуры градиентного спуска (подобного тому, как обратное распространение используется внутри такой процедуры при тренировке нейронных сетей прямого распространения) для вычисления уточнения весовых коэффициентов.
Элементарную, одношаговую процедуру сравнительной расхождения (ТР-1, англ. CD-1 ) для единого образца может быть описано следующим образом:
Правило уточнения для предубеждений a и b определяется аналогично.
Представленные результаты и исследования подтверждают, что применение искусственного интеллекта в области ограниченная машина больцмана имеет потенциал для революции в различных связанных с данной темой сферах. Надеюсь, что теперь ты понял что такое ограниченная машина больцмана, омб и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Вычислительный интеллект
Из статьи мы узнали кратко, но содержательно про ограниченная машина больцмана
Комментарии
Оставить комментарий
Вычислительный интеллект
Термины: Вычислительный интеллект