Лекция
Нейронная сеть (также искусственная нейронная сеть, ИНС) — математическая модель, а также ее программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Первой такой попыткой были нейронные сети У. Маккалока и У. Питтса . После разработки алгоритмов обучения получаемые модели стали использовать в практических целях: в задачах прогнозирования, для распознавания образов, в задачах управления и др.
Архитектуры нейронных сетей представляет собой ключевой аспект изучения современных методов машинного обучения и искусственного интеллекта. Нейронные сети — это математические модели, вдохновленные биологическими процессами обработки информации в мозге, и их архитектуры определяют способы взаимодействия и организации искусственных нейронов. Существует несколько основных типов архитектур, каждая из которых предназначена для решения различных задач.
Простейшей является однослойная персептронная сеть, состоящая из входного слоя и одного выходного слоя нейронов, но она ограничена в возможности обучения сложных зависимостей. Глубинные нейронные сети (DNN) включают несколько скрытых слоев, что позволяет им эффективно моделировать сложные закономерности в данных. Сверточные нейронные сети (CNN) предназначены для обработки изображений, извлекая пространственные особенности благодаря использованию сверточных и пулинговых слоев. Рекуррентные нейронные сети (RNN) обладают механизмом обратной связи, что делает их эффективными для работы с последовательными данными, такими как текст и временные ряды.
Современные архитектуры, такие как трансформер ы, представляют собой усовершенствованные модели, использующие механизм внимания для обработки информации, что делает их особенно мощными в задачах обработки естественного языка и генерации контента. Эволюция архитектур нейронных сетей продолжает развиваться, открывая новые возможности для автоматизации, предсказательного анализа и создания интеллектуальных систем.
ИНС представляет собой систему соединенных и взаимодействующих между собой простых процессоров (искусственных нейронов). Такие процессоры обычно довольно просты (особенно в сравнении с процессорами, используемыми в персональных компьютерах). Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И, тем не менее, будучи соединенными в достаточно большую сеть с управляемым взаимодействием, такие по отдельности простые процессоры вместе способны выполнять довольно сложные задачи.
Game: Perform tasks and rest cool.5 people play!
Play gameВычислительные системы, основанные на нейронных сетях, обладают рядом качеств, которые отсутствуют в машинах с архитектурой фон Неймана (но присущи мозгу человека):
ИНС может рассматриваться как направленный граф со взвешенными связями, в котором искусственные нейроны являются узлами. По архитектуре связей ИНС могут быть сгруппированы в два класса (рис. 5): сети прямого распространения, в которых графы не имеют петель, и рекуррентные сети, или сети с обратными связями.
В ряде нейронных сетей активирующая функция может зависеть не только от весовых коэффициентов связей , но и от времени передачи импульса (сигнала) по каналам связи
. Поэтому в общем виде активирующая (передающая) функция связи
от элемента
к элементу
имеет вид:
. Тогда синхронной сетью называют такую сеть, у которой время передачи
каждой связи равно либо нулю, либо фиксированной постоянной
. Асинхронной называют такую сеть у которой время передачи
для каждой связи между элементами
и
свое, но тоже постоянное.
Game: Perform tasks and rest cool.5 people play!
Play gameСигнал с выходных нейронов или нейронов скрытого слоя частично передается обратно на входы нейронов входного слоя (обратная связь). Рекуррентная сеть Хопфилда «фильтрует» входные данные, возвращаясь к устойчивому состоянию и, таким образом, позволяет решать задачи компрессии данных и построения ассоциативной памяти[22]. Частным случаем рекуррентных сетей являются двунаправленные сети. В таких сетях между слоями существуют связи как в направлении от входного слоя к выходному, так и в обратном. Классическим примером является Нейронная сеть Коско.
Разработаны нейронные сети, использующие в качестве активационных функций радиально-базисные (также называются RBF-сетями). Общий вид радиально-базисной функции:
, например,
где — вектор входных сигналов нейрона,
— ширина окна функции,
— убывающая функция (чаще всего, равная нулю вне некоторого отрезка).
Радиально-базисная сеть характеризуется тремя особенностями:
Такие сети представляют собой соревновательную нейронную сеть с обучением без учителя, выполняющую задачу визуализации и кластеризации. Является методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего, двумерное), применяется также для решения задач моделирования, прогнозирования и др. Является одной из версий нейронных сетей Кохонена. Самоорганизующиеся карты Кохонена служат, в первую очередь, для визуализации и первоначального («разведывательного») анализа данных.
нейросеть трансформер (англ. Transformer) — архитектура глубоких нейронных сетей, По аналогии с рекуррентными нейронными сетями (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как машинный перевод и автоматическое реферирование. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры распараллеливаются легче чем РНС и могут быть быстрее обучены.
Game: Perform tasks and rest cool.5 people play!
Play gameСеть РБФ (радиально-базисных функций) — искусственная нейронная сеть, которая использует радиальные базисные функции как функции активации.
АРТ ‑ Адаптивная резонансная теория, сети адаптивного резонанса — разновидность искусственных нейронных сетей основанная на теории адаптивного резонанса Стивена Гроссберга и Гейла Карпентера. Включает в себя модели, использующие обучение с учителем и без учителя и используются при решении задач распознавания образов и предсказания.
Нейронные сети различают по:
· структуре сети (связей между нейронами);
· особенностям модели нейрона;
· особенностям обучения сети.
По структуре нейронные сети можно разделить (рисунок 8) на:
· неполносвязные (или слоистые) и полносвязные;
· со случайными и регулярными связями;
· с симметричными и несимметричными связями.
Рисунок 8 – Классификация нейронных сетей по структуре
Неполносвязные нейронные сети (описываемые неполносвязным ориентированным графом и обычно называемые перцептронами), подразделяются на однослойные (простейшие перцептроны) и многослойные, с прямыми, перекрестными и обратными связями. В нейронных сетях с прямыми связями нейроны j-ого слоя по входам могут соединяться только с нейронами i-ых слоев, где j > i , т.е. с нейронами нижележащих слоев. В нейронных сетях с перекресными связями допускаются связи внутри одного слоя, т.е. выше приведенное неравенство заменяется на j > = i . В нейронных сетях с обратными связями используются и связи j-ого слоя по входам с i-ым при j < i.
С точки зрения топологии можно выделить три основных типа нейронных сетей:
· полносвязные (рисунок 9, а);
· многослойные или слоистые (рисунок 9, б);
· слабосвязные (с локальными связями) (рисунок 9, в).
Рисунок 9 – Архитектуры нейронных сетей: а – полносвязная сеть, б – многослойная сеть с последовательными связями, в – слабосвязные сети
В полносвязных нейронных сетях каждый нейрон передает свой выходной сигнал остальным нейронам, в том числе и самому себе. Все входные сигналы подаются всем нейронам. Выходными сигналами сети могут быть все или некоторые выходные сигналы нейронов после нескольких тактов функционирования сети.
В многослойных нейронных сетях нейроны объединяются в слои. Слой содержит совокупность нейронов с едиными входными сигналами. Число нейронов в слое может быть любым и не зависит от количества нейронов в других слоях. В общем случае сеть состоит из Q слоев, пронумерованных слева направо. Внешние входные сигналы подаются на входы нейронов входного слоя (его часто нумеруют как нулевой), а выходами сети являются выходные сигналы последнего слоя. Кроме входного и выходного слоев в многослойной нейронной сети есть один или несколько скрытых слоев. Связи от выходов нейронов некоторого слоя q к входам нейронов следующего слоя (q+1) называются последовательными.
В свою очередь, среди многослойных нейронных сетей выделяют следующие типы.
Game: Perform tasks and rest cool.5 people play!
Play game2) Сети без обратных связей. В таких сетях нейроны входного слоя получают входные сигналы, преобразуют их и передают нейронам первого скрытого слоя, и так далее вплоть до выходного, который выдает сигналы для интерпретатора и пользователя. Если не оговорено противное, то каждый выходной сигнал q-гo слоя подастся на вход всех нейронов (q+1)-гo слоя; однако возможен вариант соединения q-гo слоя с произвольным (q+p)-м слоем.
Среди многослойных сетей без обратных связей различают полносвязанные (выход каждого нейрона q-гo слоя связан с входом каждого нейрона (q+1)-гo слоя) и частично полносвязанные. Классическим вариантом слоистых сетей являются полносвязанные сети прямого распространения (рисунок 10).
Рисунок 10 – Многослойная (двухслойная) сеть прямого распространения
3) Сети с обратными связями. В сетях с обратными связями информация с последующих слоев передается на предыдущие. Среди них, в свою очередь, выделяют следующие:
· слоисто-циклические, отличающиеся тем, что слои замкнуты в кольцо: последний слой передает свои выходные сигналы первому; все слои равноправны и могут как получать входные сигналы, так и выдавать выходные;
· слоисто-полносвязанные состоят из слоев, каждый из которых представляет собой полносвязную сеть, а сигналы передаются как от слоя к слою, так и внутри слоя; в каждом слое цикл работы распадается на три части: прием сигналов с предыдущего слоя, обмен сигналами внутри слоя, выработка выходного сигнала и передача к последующему слою;
· полносвязанно-слоистые, по своей структуре аналогичные слоисто-полносвязанным, но функционирующим по-другому: в них не разделяются фазы обмена внутри слоя и передачи следующему, на каждом такте нейроны всех слоев принимают сигналы от нейронов как своего слоя, так и последующих.
В качестве примера сетей с обратными связями на рисунке 11 представлены частично-рекуррентные сети Элмана и Жордана.
Рисунок 11 – Частично-рекуррентные сети: а – Элмана, б – Жордана
В слабосвязных нейронных сетях нейроны располагаются в узлах прямоугольной или гексагональной решетки. Каждый нейрон связан с четырьмя (окрестность фон Неймана), шестью (окрестность Голея) или восемью (окрестность Мура) своими ближайшими соседями.
Известные нейронные сети можно разделить по типам структур нейронов на:
· гомогенные (однородные);
· гетерогенные.
Гомогенные сети состоят из нейронов одного типа с единой функцией активации, а в гетерогенную сеть входят нейроны с различными функциями активации.
Еще одна классификация делит нейронные сети на:
· синхронные;
· асинхронные.
В первом случае в каждый момент времени лишь один нейрон меняет свое состояние, во втором – состояние меняется сразу у целой группы нейронов, как правило, у всего слоя. Алгоритмически ход времени в нейронных сетях задается итерационным выполнением однотипных действий над нейронами.
По используемым на входах и выходах сигналам нейронные сети можно разделить на:
· аналоговые;
· бинарные.
Game: Perform tasks and rest cool.5 people play!
Play gameПо моделированию времени нейронные сети подразделяются на сети:
· с непрерывным временем;
· с дискретным временем.
Для программной реализации применяется как правило дискретное время.
По способу подачи информации на входы нейронной сети различают:
· подачу сигналов на синапсы входных нейронов;
· подачу сигналов на выходы входных нейронов;
· подачу сигналов в виде весов синапсов входных нейронов;
· аддитивную подачу на синапсы входных нейронов.
По способу съема информации с выходов нейронной сети различают:
· съем с выходов выходных нейронов;
· съем с синапсов выходных нейронов;
· съем в виде значений весов синапсов выходных нейронов;
· аддитивный съем с синапсов выходных нейронов.
По организации обучения разделяют обучение нейронных сетей:
· с учителем (supervised neural networks);
· без учителя (nonsupervised).
При обучении с учителем предполагается, что есть внешняя среда, которая предоставляет обучающие примеры (значения входов и соответствующие им значения выходов) на этапе обучения или оценивает правильность функционирования нейронной сети и в соответствии со своими критериями меняет состояние нейронной сети или поощряет (наказывает) нейронную сеть, запуская тем самым механизм изменения ее состояния.
По способу обучения разделяют обучение:
· по входам
· по выходам.
При обучении по входам обучающий пример представляет собой только вектор входных сигналов, а при обучении по выходам в него входит и вектор выходных сигналов, соответствующий входному вектору.
По способу предъявления примеров различают:
· предъявление одиночных примеров
· предъявление "страницы" примеров.
В первом случае изменение состояния нейронной сети (обучение) происходит после предъявления каждого примера. Во втором – после предъявления "страницы" (множества) примеров на основе анализа сразу их всех.
Под состоянием нейронной сети, которое может изменяться, обычно понимается:
· веса синапсов нейронов (карта весов – map) (коннекционистский подход);
Game: Perform tasks and rest cool.5 people play!
Play game· установление новых связей между нейронами (свойство биологических нейронов устанавливать новые связи и ликвидировать старые называется пластичностью).
По особенностям модели нейрона различают нейроны с разными нелинейными функциями:
пороговой ;
Наиболее часто в качестве функций активации используются следующие виды сигмоид:
Функция Ферми (экспоненциальная сигмоида):
Рациональная сигмоида (при =0 вырождается в т.н. пороговую функцию активации):
Гиперболический тангенс:
,
где s — выход сумматора нейрона, — произвольная константа.
Перечисленные функции относятся к однопараметрическим.
Также используются многопараметрические передаточные функции, например, .
Наиболее распространенные модели нейронных сетей:
· модель Хопфилда;
· машина Больцмана;
· сеть Кохонена;
· модель Хэмминга;
· многослойный персептрон.
рис.5. Базовые архитектуры нейронных сетей
Game: Perform tasks and rest cool.5 people play!
Play gameGame: Perform tasks and rest cool.5 people play!
Play gameпродолжение следует...
Часть 1 Архитектуры нейронных сетей. Классификация и виды нейросетей, принцип работы, применение
Часть 2 Архитектуры нейросетей. Нейросети прямого распространения - Архитектуры нейронных сетей. Классификация
Часть 3 Sequence Learning и парадигма seq2seq - Архитектуры нейронных сетей. Классификация
Комментарии
Оставить комментарий
Computational Neuroscience (вычислительная нейронаука) Теория и приложения искусственных нейронных сетей
Термины: Computational Neuroscience (вычислительная нейронаука) Теория и приложения искусственных нейронных сетей