Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

16.1.3. Агенты, интеллект и эволюция - Искусственный интеллект как эмпирическая

Лекция



Это продолжение увлекательной статьи про .

...

системе. Они выделяют клетки рецепторов наподобие клеток кожи, которые передают входную информацию другим скоплениям клеток, внутренним нейронам, основная задача которых сводится к передаче информации внутри скоплений клеток, и моторным нейронам, формирующим выход системы.

Нейронная активность имеет электрическую природу. Состояние возбуждения или покоя определяется характером ионных потоков в нейрон и из него. У типичного нейрона потенциал покоя составляет приблизительно -70 мВ. Когда клетка активна, окончание аксона выделяет определенные вещества. Эти химические вещества, называемые медиаторами (neurotransmitters), взаимодействуют с постсинаптической мембраной, обычно вливаясь в нужные рецепторы и возбуждая тем самым дальнейшие ионные токи. Потоки ионов, достигая критического уровня, около -50 мВ, формируют потенциал возбуждения (action potential) - триггерный механизм, однозначно определяющий степень возбуждения клетки. Таким образом, нейроны сообщаются, обмениваясь последовательностями двоичных кодов.

Существует два вида постсинаптических изменений, вызванных достижением потенциала возбуждения: тормозящие (inhibitory), наблюдаемые в основном в межнейронных структурах клеток, и возбуждающие (excitatory). Такие положительные и отрицательные потенциалы постоянно генерируются в синапсах дендритной системы. Когда результирующее влияние всех этих событий изменяет потенциалы мембран соответствующих нейронов от -70 мВ до примерно -50 мВ, пороговое значение превышается, и вновь инициируются ионные токи в аксонах этих клеток.

На уровне нейронной архитектуры в коре головного мозга (тонком слое, покрывающем полушария мозга) содержится приблизительно 1010 нейронов. Большая часть коры имеет складчатую форму, что увеличивает ее площадь поверхности. С точки зрения вычислительной системы необходимо учитывать не только количество синапсов, но и нагрузочные способности по входу и выходу. Шепард [Shephard, 1998] примерно оценивает оба этих параметра числом 105.

Кроме различий в клетках и архитектурах нейронных и компьютерных систем, существует более глубокая проблема когнитивного представления. Мы, к примеру, совершенно ничего не знаем о том, как в коре кодируются даже простейшие воспоминания. Или как человек узнает лица, и каким образом распознавание лица может соотноситься агентом с чувствами радости или печали. Мы очень много знаем о физико-химических аспектах устройства мозга, но относительно мало о том, как нервная система кодирует сведения и использует эти образы в нужном контексте.

Один из наиболее сложных вопросов, с которым сталкиваются исследователи и неврального, и вычислительного толка, касается роли врожденного знания в обучении. Можно ли провести эффективное обучение "с нуля", без начального знания, основываясь исключительно на опыте; или же должен присутствовать некий индуктивный порог? Опыт разработки обучающихся программ предполагает необходимость какого-либо начального знания, обычно выражающегося в форме индуктивного порога. Оказалось, что способность нейронных сетей строить осмысленное обобщение на основе обучающего множества зависит от числа нейронов, топологии сети и специфики алгоритмов обучения. Совокупность этих факторов составляет индуктивный порог, играющий не менее важную роль, чем в любом символьном представлении. Например, находится все больше подтверждений тому, что дети наследуют совокупность "аппаратно прошитых" когнитивных предпосылок (порогов), благодаря которым возможно обучение в таких областях, как язык и интуитивное понимание законов природы. Представление врожденных порогов в нейронных сетях сегодня является областью активных исследований [Elman и др., 1996].

Вопрос о врожденных порогах отходит на второй план, если обратить внимание на более сложные проблемы обучения. Предположим, нужно разработать вычислительную модель научного открытия и смоделировать переход Коперника от геоцентрического к гелиоцентрическому взгляду на устройство вселенной. Для этого требуется представить в компьютерной программе теории Коперника и Птолемея. Хотя эти взгляды можно представить в качестве активационных схем нейронной сети, такие сети ничего не скажут о них, как о теориях. Человек предпочитает получать объяснения вроде: "Коперник был озадачен сложностью системы Птолемея и предпочел более простую модель, в которой планеты вращаются вокруг Солнца". Подобные объяснения требуют символьного выражения. Очевидно, нейронные сети должны обеспечивать символьное обоснование. В конце концов, человеческий мозг - это нейронная сеть, но она неплохо умеет обращаться с символами. И тем не менее символьное обоснование в нейронных сетях - важная, но все еще открытая проблема.

Еще одной проблемой является роль развития в обучении. Дети не могут просто учиться на доступных данных. Их способность к обучению в конкретных областях проявляется на четко определенных стадиях развития [Karmiloff-Smith, 1992]. Возникает любопытный вопрос: является ли этот факт всецело следствием человеческой биологии, или же он отражает некие принципиально необходимые ограничения на способность интеллекта познавать закономерности окружающего мира? Могут ли подобные стадии развития служить механизмом для разбиения задачи обучения на более простые подзадачи? Возможно ли, что система искусственно налагаемых ограничений на развитие искусственной сети является необходимой основой для обучения в сложном мире?

Применение нейронных сетей для решения практических задач ставит дополнительные проблемы перед исследователями. Те самые свойства нейронных сетей, которые делают их такими привлекательными (способность адаптироваться, устойчивость к недостаточности или неоднозначности данных), одновременно создают препятствия для их практического применения. Поскольку нейронные сети обучаются, а не программируются, их поведение сложнее предсказать. Существует несколько общих принципов проектирования сетей, которые вели бы себя нужным образом в заданной предметной области. Однако сложно объяснить, почему нейронная сеть пришла к определенному выводу. Обычно такие объяснения принимают вид каких-то статистических соображений. Все вышеперечисленные проблемы являются предметом текущих исследований.

Возникает вопрос, так ли уж различаются в качестве моделей интеллекта коннекцио-нистские сети и символьные системы ИИ? В них достаточно много общего. В обоих подходах процесс "мышления" сводится к вычислительным операциям, имеющим фундаментальные и формальные ограничения, такие как описанная в главе 2 гипотеза Черча-Тьюринга (Church-Turing) [Luger, 1994]. Оба подхода предлагают модель разума, применимую в практических задачах. Более того, оба подхода отвергают философию дуализма и помещают истоки разума в структуру и функцию физических устройств.

Мы верим, что согласование этих двух очень разных подходов неизбежно. Исключительным вкладом в науку стало бы построение теории преобразования символьного представления в конфигурацию сети, и, в свою очередь, влияния на ее дальнейшую адаптацию. Такая теория помогла бы во многих исследованиях, например, интеграции в единую интеллектуальную систему нейросетевого восприятия и систем рассуждения на основе знаний. Тем не менее в ближайшее время у приверженцев обоих взглядов будет достаточно работы, и мы не видим никаких причин, мешающих им сосуществовать. Для тех же, кого смущает подобная противоречивость двух моделей интеллекта, приведем пример из физики, в которой свет иногда удобнее рассматривать как волну, а иногда - как поток частиц.

16.1.3. Агенты, интеллект и эволюция

Агентные вычисления и модульные теории познания ставят перед исследователями систем ИИ интересные вопросы. Одна из известных школ когнитологии полагает, что разум формируется из наборов специализированных функциональных элементов [Minsky, 1995], [Fodor, 1983]. Все модули имеют четкую специализацию и используют широкий диапазон врожденных структур и функций, от "аппаратно прошитого" решения задач до индуктивного порога. Это связано с разнообразием проблем, которыми они как практические агенты должны заниматься. В этом есть смысл: как можно обучить нейронную сеть заниматься и перцепцией, и двигательными функциями, и запоминанием, и логическими рассуждениями? Модульные теории интеллекта предоставляют базу для поиска ответа на этот вопрос, а также направление дальнейшего исследования таких вопросов, как природа индуктивного порога в отдельных модулях или механизмы модульного взаимодействия.

Генетические и эволюционные вычислительные модели обеспечивают новые захватывающие подходы к пониманию как человеческого, так и искусственного разума. Демонстрируя возможность рассмотрения разумного поведения как совокупности работы большого числа ограниченных независимых агентов, теория генетических и эволюционных вычислений решает проблему представления сложного разума в виде результата взаимодействия относительно простых структур.

В работе [Holland, 1995] приведен пример, в котором механизмы обеспечения хлебом большого города (например Нью-Йорка) демонстрируют процесс возникновения интеллекта в агентской системе. Вряд ли можно написать централизованный планировщик, который обеспечивал бы жителей Нью-Йорка привычным им разнообразием сортов хлеба. Да и неудачный эксперимент коммунистического мира по внедрению централизованного управления явно показал ограниченность такого подхода. Даже несмотря на практические сложности написания алгоритма такого централизованного планирования, слабо скоординированные в действиях городские пекари, торговцы и поставщики сырья и так неплохо справляются с решением проблемы. Эволюционные агентские системы не имеют центрального плана. Любой булочник владеет весьма ограниченными сведениями о потребностях города в хлебе. Он всего лишь старается оптимизировать возможности своего бизнеса. Решение глобальной проблемы складывается из коллективной деятельности таких независимых локальных агентов.

Демонстрируя, как целенаправленное, устойчивое к флуктуациям и почти оптимальное поведение может складываться из взаимодействия отдельных локальных агентов, эти модели дают еще один ответ на старый философский вопрос о происхождении разума. Главный урок эволюционных подходов к интеллекту состоит в том, что цельный интеллект может возникнуть и возникает из взаимодействия множества простых, отдельных, локальных, овеществленных агентских интеллектов.

Вторая главная особенность эволюционных моделей заключается в том, что они опираются на дарвиновский принцип естественного отбора как на основной механизм, формирующий поведение отдельных агентов. Возвращаясь к примеру с булочниками, трудно утверждать, что каждый отдельный пекарь ведет себя "глобально оптимальным" образом. Источник такой оптимальности- не централизованный проект, а простой факт. Булочники, которые плохо удовлетворяют нужды своих покупателей, разоряются. Путем неустанных, многократных селективных воздействий отдельные булочники приходят к модели поведения, которая обеспечивает как их собственное выживание, так и общественную полезность.

Комбинация распределенной, агентской архитектуры и адаптивных воздействий естественного отбора - мощная модель эволюции и работы разума. Эволюционные психологи [Cosmides и Tooby, 1992, 1994], [Вагкошидр., 1992] разработали модель формирования врожденной структуры и индуктивного порога человеческого мозга в процессе естественного отбора. Основа эволюционной психологии - это рассмотрение разума как модульной системы взаимодействующих специализированных агентов. В эволюционной психологии ум часто сравнивают со швейцарским ножом - набором специализированных инструментов, предназначенных для решения различных задач. Появляется все больше свидетельств тому, что человеческий интеллект действительно в высокой степени является модульной системой. В [Fodor, 1983] приводятся философские доводы в пользу модульной структуры интеллекта. Минский [Minsky, 1985] исследовал различные применения теорий модульности в сфере искусственного интеллекта. Такая архитектура имеет важное значение для теорий эволюции интеллекта. Сложно представить себе, как эволюция могла сформировать цельную систему такой сложности, как человеческий мозг. С другой стороны, правдоподобным выглядит тот факт, что эволюция в течение миллионов лет могла бы успешно сформировать отдельные, специализированные познавательные навыки. Затем она бы могла работать над комбинациями модулей, формируя механизмы их взаимодействия, обмена информацией и сотрудничества, позволяющие в результате решать все более сложные задачи познания [Mithen, 1996].

Теории нейронной селекции [Edelman, 1992] показывают, как эти же процессы могут отвечать за адаптацию отдельной нервной системы. Модели нейронного дарвинизма описывают адаптацию нейронных систем в терминах Дарвина: в процессе селекции в ответ на воздействия внешней среды происходит усиление одних цепочек в мозге и ослабление других. В отличие от символьных методов обучения, которые пытаются выделить информацию из обучающих данных и использовать ее для построения модели мира, теории нейронной селекции рассматривают влияние селективных воздействий на популяции нейронов и их взаимодействие. Эдельман [Edelman, 1992, С. 81] утверждает:

Рассматривая изучение мозга как науку о познании, я подразумеваю, что познание не является инструктивным процессом. Здесь не происходит непосредственной пересылки информации, как ее нет в эволюционных или иммунных процессах. Напротив, познание селективно.

Агентные технологии предоставляют также модели социального взаимодействия. Используя агентные подходы, экономисты построили информативные (если не полностью прогнозирующие) модели экономических рынков. Агентные технологии оказывают всевозрастающее влияние на построение распределенных компьютерных систем, разработку средств поиска в Internet и проектирование сред совместной разработки.

Наконец, агентные модели оказали немалое влияние на теорию сознания. Например, Даниэль Дэннетт [Dennett, 1991] рассматривает функцию и структуру сознания, отталкиваясь от агентной архитектуры интеллекта. Он начинает с замечания, что вопрос о местоположении сознания в мозге или разуме некорректен. Напротив, его множественная теория сознания (multiple draft theory of consciousness) основана на рассмотрении сознания во взаимодействии агентов в распределенной архитектуре интеллекта. Во время перцепции, управления двигательными функциями, решения задач, обучения и другой психической активности формируются объединения взаимодействующих агентов. Эти сочетания очень динамичны и изменяются в зависимости от потребностей в различных ситуациях. Сознание, по Дэннету, служит связующим механизмом этих объединений агентов, оно поддерживает взаимодействие агентов. Совокупность агентов становится основой когнитивной обработки данных.

Ограничения агентного представления интеллекта

Развитие эволюционного подхода привело к возникновению новых вопросов. Например, еще предстоит понять весь путь эволюции высокоуровневых познавательных способностей языка. Подобно попыткам палеонтологов реконструировать эволюцию видов, отслеживание развития этих высокоуровневых проблем связано с большим объемом кропотливой роботы. Необходимо перечислить все агенты, лежащие в основе архитектуры разума, и отследить их эволюцию во времени.

Важная проблема для агентских теорий - объяснение взаимодействий между модулями. Хотя модель ума как "швейцарского ножа" полезна для интуитивного понимания, модули, из которых состоит интеллект, не так независимы, как лезвия перочинного ножика. Разум демонстрирует широкие, весьма изменчивые взаимодействия между когнитивными областями: мы можем говорить о вещах, которые видим, что выявляет взаимодействие между визуальным и лингвистическим модулями. Мы можем сооружать здания, служащие специфичным социальным целям, что свидетельствует о взаимодействии между технической и социальной сторонами интеллекта. Поэты могут строить метафоры для описания зрительных сцен, демонстрирующие гибкое взаимодействие между визуальным и тактильным модулями. Исследование представлений и процессов, делающих возможными эти межмодульные взаимодействия, является областью текущих исследований [Karmiloff-Smith, 1992], [Mithen, 1996], [Lakoff и Johnson, 2000].

Все важнее становятся практические применения агентных технологий. Используя компьютерное моделирование на основе агентов, можно создать сложные системы, для которых не существует аналитического описания, и которые из-за этого ранее были недоступны для изучения. Методы моделирования применяются для описания широкого спектра явлений, например, адаптации человеческой иммунной системы, управления сложными процессами, включая ускорение частиц, поведения мировых рынков валют, метеорологии. Вопросы представления и вычислительной реализации, которые предстоит решить для создания таких моделей, определяют направление исследований в построении представлений знаний, алгоритмов и даже разработки компьютерной аппаратуры.

Другие практические вопросы, с которыми предстоит иметь дело агентным архитектурам, включают протоколы межагентного взаимодействия, особенно в случаях, когда локальные агенты имеют ограниченные знания о проблеме в целом или о том, какими знаниями уже могут обладать другие агенты. Более того, существует несколько алгоритмов для разбиения больших задач на агентно-ориентированные подзадачи и распределения ограниченных ресурсов между агентами. Эти и другие вопросы агентного представления были рассмотрены в подразделе 6.4.2.

Пожалуй, наиболее увлекательный аспект эволюционной теории интеллекта- это возможность описать различные виды психической деятельности единой моделью возникновения порядка из хаоса. Краткий обзор, проведенный в этом разделе, позволяет выделить работы, использующие эволюционную теорию для моделирования ряда процессов: от эволюции интеллекта до конструирования экономических и социальных моделей поведения. Есть нечто чрезвычайно привлекательное в той идее, что эволюционные процессы, описываемые теорией Дарвина, могут объяснить разумное поведение во многих масштабах: от взаимодействия индивидуальных нейронов до формирования молекулярной структуры мозга или функционирования экономических рынков и социальных систем. Оказывается, интеллект подобен фрактальной структуре, где одни и те же процессы действуют в любых масштабах и во всей системе в целом.

Далее будут рассмотрены психологические и философские аспекты человеческого мышления, которые повлияли на создание, разработку и применение теории искусственного интеллекта.

16.2. Теория интеллектуальных систем

Основная группа исследователей искусственного интеллекта сосредоточила свою деятельность на понимании человеческого разума совсем не случайно. Люди обеспечивают прототипы и примеры интеллектуальных действий. Поэтому разработчики искусственного интеллекта редко игнорируют "человеческий" подход, хотя обычно и не ставят перед собой цели заставить программы действовать по примеру людей. Так, в приложениях компьютерной диагностики программы зачастую моделируют рассуждения людей-экспертов, работающих в соответствующей области. А главное, понимание человеческого интеллекта - захватывающая и все еще открытая научная проблема.

Современная когнитология (cognitive science), или теория интеллектуальных систем (science of intelligent systems) [Luger, 1994], возникла с изобретением цифрового компьютера. Однако в главе 1 упоминалось, что у этой дисциплины были свои предшественники. Их список начинается с Аристотеля, Декарта и Буля и включает многих современных теоретиков, таких как Тьюринг, Мак-Каллок и Питтс, основоположники нейросетевых моделей, а также Джон фон Нейман - один из первых защитников концепции искусственной жизни. Эти исследования стали наукой лишь тогда, когда возникла возможность ставить эксперименты, основанные на теоретических соображениях, а точнее, с появлением компьютеров. Наконец-то можно задать вопрос: "Существует ли всеобъемлющая теория интеллекта?". Можно также спросить: "Может ли теория интеллектуальных систем помочь в создании искусственного разума?".

В нижеследующих разделах вкратце будет рассказано о том, как психология, эпистемология и социология повлияли на исследования в сфере ИИ.

16.2.1. Ограничения психологии

Ранние когнитологические исследования касались решения логических задач человеком. Такие системы учились играть в простые игры, планировать и осуществлять изучение понятий [Feigenbaum и Feldman, 1963], [Newell и Simon, 1972], [Simon, 1981]. В процессе работы над системой Logic Theorist (см. раздел 12.1) Ньюэлл и Саймон начали сравнивать свои вычислительные подходы со стратегиями поиска, применяемыми человеком. Исходными данными для них служили протоколы "мыслей вслух" (think-aloud protocols) - описания людьми своих мыслей в процессе обдумывания решения задачи, например, доказательства какой-нибудь теоремы. Ньюэлл и Саймон сравнили эти протоколы с поведениец компьютерной программы, работающей над той же задачей. Исследователи обнаружили поразительную схожесть и интересные отличия, как в задачах, так и в субъектах исследования.

Эти ранние проекты позволили создать методологию, применяемую в когнитологии в последующие десятилетия.

На основе данных, полученных от людей, решающих определенный класс проблем, строится схема представления и соответствующая стратегия поиска для решения задачи.

Отслеживается поведение компьютерной модели, решающей такую проблему.

Ведется наблюдение за людьми, работающими над решением задач, и отслеживаются измеряемые параметры их процесса решения, а именно: протоколы "мыслей вслух", движения глаз, записи промежуточных результатов.

Решения человека и компьютера сравниваются и анализируются.

Компьютерная модель пересматривается для следующего цикла экспериментов.

Эта эмпирическая методика описана в лекции Ньюэлла и Саймона, прочитанной по случаю вручения премии Тьюринга. Ее фрагмент был выбран в качестве эпиграфа к этой главе. Важным аспектом когнитологии является использование экспериментов для подтверждения работоспособности архитектуры решателя, будь то продукционная система, сеть связей или архитектура, основанная на взаимодействии распределенных агентов.

В последние годы к этим понятиям добавилось принципиально новое измерение. Теперь в процессе решения задач можно "разбирать" и изучать не только программы, но и людей, и другие формы жизни. Множество новых технологий получения изображений пополнили набор средств, применяемых для изучения активности коры мозга. К этим технологиям относится магнитная энцефалография (magnetoencephalography - MEG), которая регистрирует магнитные поля, создаваемые группами нейронов. В отличие от электрического магнитное поле не искажается костями и кожей черепа, следовательно, можно получить более четкое его изображение.

Другая технология - позитронная эмиссионная томография (positron emission tomography - PET). В кровеносный сосуд впрыскивается радиоактивное вещество, обычно О15. Когда определенная область мозга возбуждена, чувствительными детекторами регистрируется большее количество радиоактивного агента, чем в состоянии покоя этой области мозга. Сравнение изображений возбужденных и находящихся в покое областей помогает обнаруживать функциональную локализацию с разрешением примерно 1 см [Stytz и Frieder, 1990].

Еще один метод анализа нервной системы - функциональное магнитно-резонансное сканирование (functional magnetic resonance imaging - F-MRI). Этот подход происходит от более стандартного метода, основанного на ядерном магнитном резонансе (nuclear magnetic resonance - NMR). Подобно методу PET, в этом подходе для выявления функциональной локализации используется сравнение изображений возбужденных и находящихся в покое областей мозга.

Дальнейший вклад в локализацию функций мозга сделали программные алгоритмы, разработанные Бараком Перлмуттером и его коллегами [Pearlmutter и Рагга, 1997], [Tang и др., 1999, 2000а, 20006]. Они тесно связаны с перечисленными выше методами. Благодаря этим исследованиям появилась возможность получить сложные образцы шума, часто возникающего на выходе устройств для получения изображений нервной системы. Это важный шаг в исследованиях, поскольку такие показатели, как движения глаз, дыхание и сердцебиение, связаны с исследуемыми схемами возбуждения нейронов.

Результаты недавних исследований в когнитивной теории нейронных систем [Squire и Kosslyn, 1998], [Shephard, 1998], [Gazzaniga, 2000] значительно улучшили понимание роли нейронной составляющей в интеллектуальной деятельности. Хотя анализ и критика таких результатов выходит за пределы рассмотрения данной книги, коснемся нескольких важных вопросов.

В области восприятия и внимания существует проблема связывания (binding problem). Такие исследователи, как Энн Трисмэн [Triesman, 1993, 1998], отмечают, что представление восприятия зависит от распределенных нейронных кодов, отвечающих за сопоставление частей и качеств объектов, и ставят вопрос о том, какие механизмы "связывают" информацию, относящуюся к конкретному объекту, и позволяют отличать этот объект от других.

В области визуального поиска рассматривается вопрос о том, какие нейронные механизмы обеспечивают восприятие объектов, входящих в большие, сложные сцены. Некоторые эксперименты показывают, что фильтрация информации о незначительных объектах играет важную роль в определении целей поиска [Luck, 1998]. Вопрос о том, как мы "учимся" видеть, исследуется в работе [Sagi и Таппе, 1998].

Работы [Gilbert, 1992, 1998] посвящены гибкости восприятия. Из них следует, что видимая человеком картина не отражает точные физические характеристики сцены. Она значительно зависит от процессов, с помощью которых мозг пытается интерпретировать эту картину.

В [Ivry, 1998] рассматривается вопрос о том, каким образом кора мозга кодирует и индексирует соотносящуюся во времени информацию, включая интерпретацию ощущений и двигательную активность.

Стрессовые гормоны, вырабатываемые в состояниях эмоционального возбуждения, влияют на процессы памяти [Cahill и McGaugh, 1998]. Это соотносится с проблемой обоснования (grounding): почему мысли, слова, ощущения имеют осмысленное значение для агента? В каком смысле возможна "грусть в вещах", вергилиевская lacremae reruml

Акустико-фонетические аспекты речи основаны на важных организационных принципах, связывающих исследования в области нейронных систем с когнитивными и лингвистическими теориями [Miller и др., 1998]. В [Gazzaniga, 2000] рассматривается вопрос о том, как синтаксические и семантические составляющие сочетаются в коре мозга.

Как индивидуум учится определенному языку, и какие нейрофизиологические стадии соответствуют этому процессу? Этой проблеме посвящены работы [Kuhl, 1993, 1998].

В [O'Leary и др., 1999] затрагиваются следующие вопросы. Как понимать развитие, чем определяется пластичность критических периодов и реорганизации в процессе взросления, наблюдаемых в соматосенсорных системах млекопитающих? Критичны ли фазы развития для формирования интеллекта? Эти же вопросы рассматриваются в [Karmiloff-Smith, 1992], [Gazzaniga, 2000] и подразделе 16.1.2.

Практическая работа в сфере искусственного интеллекта не требует обширных познаний в вышеперечисленных и смежных нейронных и психологических областях. Но такие знания могут помочь в разработке интеллектуальных устройств, а также в определении места исследований ИИ в контексте общей теории интеллектуальных систем. Наконец, синтез психологии, нейрофизиологии и компьютерных наук- по-настоящему увлекательная задача. Но она требует детальной проработки эпистемологами, что будет нашей следующей темой для обсуждения.

16.2.2. Вопросы эпистемологии

Если не знаешь, куда идешь, придешь не туда, куда хочешь... - приписывается Йоги Берра (Yogi Berra)

Развитие искусственного интеллекта происходило в процессе решения множества важных задач и вопросов. Понимание естественных языков, планирование, рассуждения в условиях неопределенности и машинное обучение - все это типичные проблемы, которые отражают важные аспекты разумного поведения. Интеллектуальные системы, работающие в этих предметных областях, требуют знания целей и опыта в контексте конкретной социальной ситуации. Для этого в программе, которую человек пытается наделить "разумом", необходимо обеспечить возможность формирования понятий.

Процесс формирования понятий отражает как семантику, поддерживающую использование символов, так и структуру применяемых символов. Задача состоит в том, чтобы найти и использовать инвариантности, присущие данной предметной области. Термин "инвариант" используется для описания регулярностей или значимых, пригодных для использования, аспектов сложных рабочих сред. В данном рассмотрении термины символы и символьные системы используются в широком смысле. Они включают широкий спектр понятий: от четко определенных символов Ньюэла и Саймона [Newell и Simon, 1976] до узлов и сетевой архитектуры систем связей, а также эволюционирующих структур генетики и искусственной жизни.

Хотя рассматриваемые ниже вопросы характерны для большей части работ в сфере ИИ, остановимся на проблемах машинного обучения. Это обусловлено тремя причинами.

Во-первых, довольно глубокое изучение хотя бы одной ключевой предметной области искусственного интеллекта даст читателю более полное и точное представление о последних достижениях ИИ. Во-вторых, успехи в машинном обучении, а особенно в нейронных сетях, генетических алгоритмах и других эволюционных подходах, потенциально способны совершить революцию в сфере ИИ. Наконец, обучение- это одна из наиболее увлекательных областей исследований в искусственном интеллекте.

Несмотря на прогресс, обучение остается одной из наиболее трудных проблем, встающих перед исследователями ИИ. Далее мы обсудим три вопроса, сдерживающих сегодня продвижение в этой сфере: во-первых, обобщение и переобучение (generalization and overlearning), во-вторых, роль индуктивного порога (inductive bias) в обучении, в-третьих, дилемму эмпирика (empiricist's dilemma), или понимание эволюции без ограничений. Последние две проблемы взаимосвязаны. Присущий многим алгоритмам индуктивный порог является выражением рационалистической проблемы. Порог определяется ожиданиями, т.е. то, чему мы обучаемся, зачастую зависит от того, чему хочется научиться. Есть и другая проблема. Иногда мы не располагаем априорными догадками о результате. Это, например, можно наблюдать в исследованиях, посвященных искусственной жизни. Можно ли утверждать: "Построй это, и оно будет работать, как нужно"? Если верить Йоги Берра (см. эпиграф к разделу), то, скорее всего, нет! Эти темы будут затронуты в следующем разделе.

Проблема обобщения

Примеры, использованные для представления разнообразных моделей обучения (символьных, коннекционистских и эволюционных), зачастую были слишком неестественны. Например, архитектуры связей часто содержали всего несколько узлов или один скрытый слой. Такие примеры уместны, поскольку основные законы обучения можно адекватно объяснить в контексте нескольких нейронов или слоев. Но стоит помнить, что в реальных задачах нейронные сети обычно значительно больше, и проблема масштаба здесь имеет значение. Например, для обучения с обратным распространением ошибки требуется большое количество обучающих примеров, а для решения сколько-нибудь практически интересных задач нужны большие сети. Многие исследователи ([Necht-Nielsen, 1990]; [Zurada, 1992], [Freeman и Scapura, 1991]) работали над проблемой выбора оптимального числа входных данных, соотношения между числом входных параметров и узлов в скрытом слое, определением количества проходов процесса обучения, достаточного для обеспечения сходимости. Здесь мы только констатировали, что эти проблемы сложные, важные и в большинстве случаев открытые.

Количество и качество обучающих данных важны для любого обучающего алгоритма. Без обширных исходных знаний о предметной области алгоритм обучения может не справиться с выделением образов при получении зашумленных, недостаточных или даже испорченных данных.

Смежная проблема - вопрос "достаточности" в обучении. В каких случаях алгоритмы можно назвать достаточно пригодными для выделения важных границ или инвариантов предметной области задачи? Приберечь ли запас входных данных для тестирования алгоритма? Отвечает ли количество имеющихся данных требуемому качеству обучения? Должно быть, суждение о "достаточности" является в большей степени эвристическим или даже эстетическим: мы, люди, часто рассматриваем алгоритмы как "достаточно хорошие".

Проиллюстрируем проблему обобщения на примере, используя метод обратного распространения ошибки для нахождения функции по набору заданных точек (рис. 16.2).

Линии вокруг этого набора представляют функции, найденные алгоритмом обучения. Напомним, что по завершении обучения алгоритму

продолжение следует...

Продолжение:


Часть 1 Искусственный интеллект как эмпирическая проблема
Часть 2 16.1.3. Агенты, интеллект и эволюция - Искусственный интеллект как эмпирическая
Часть 3 Дилемма эмпирика - Искусственный интеллект как эмпирическая проблема
Часть 4 - Искусственный интеллект как эмпирическая проблема

Ответы на вопросы для самопроверки пишите в комментариях, мы проверим, или же задавайте свой вопрос по данной теме.

создано: 2014-09-22
обновлено: 2024-11-14
320



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Подходы и направления создания Искусственного интеллекта

Термины: Подходы и направления создания Искусственного интеллекта