Лекция
Привет, мой друг, тебе интересно узнать все про приобретение знаний, тогда с вдохновением прочти до конца. Для того чтобы лучше понимать что такое приобретение знаний, получение знаний , настоятельно рекомендую прочитать все из категории Машинное обучение.
Последние десятилетия XX в. мировое научное сообщество потратило на познание тайн мозга. За это время было открыто 90-95% того, что человечество знает о его функционировании сегодня. Применяя все более сложные исследовательские техники, ученые все глубже проникают в тайны мозга, изучают его функционирование в различных условиях. Сегодня они способны сказать, в какой части мозга размещены участки, отвечающие за определенные виды интеллектуальной деятельности. Многое прояснилось относительно обучения мозга. Можно утверждать, что его возможности мы еще не научились использовать не то, чтобы в полную силу, но даже на четверть.
Напомним, мозг построен из сотен миллиардов нейронов, создающих сложную сеть связей. Уже в момент рождения ребенок имеет все нейроны. Их столько же, сколько в мозге взрослого человека. Отсутствуют лишь связи между ними. Они формируются воспитанием. Формируются всю жизнь. В молодом возрасте, пока нейроны податливы и активны, формирование связей идет быстро и успешно. Уже в шестилетнем возрасте плотность сети связей довольно высокая. У студентов плотность сети увеличивается почти вдвое. Каждая новая информация прокладывает новый канал соединения между нейронами. Каналы, которые долго не используются, зарастают. Связи, которые не работают, исчезают, забываются.
Практический вывод такой: тот, кто хочет иметь тренированный, способный к обучению мозг, должен учиться всю жизнь. Мозг должен постоянно пребывать в активном, натренированном состоянии. Количество связей должно постоянно расти. Если же мозг не работает, он постепенно атрофируется, становится вялым, малоактивным, как и всякий другой орган.
Мы знаем, что мозг состоит из левого и правого полушарий, т.е. на самом деле у нас не один, а два мозга. Полушария соединены мозолистым телом для коммуникации и взаимодействия. Между левым и правым полушариями идет непрерывный диалог. Это и есть процесс думанья. Информация, которую получает одно из полушарий, сразу передается другому для оценки и сравнения. Идет непрерывная оценка информации, полученной одним полушарием, критериями другого полушария. Мы знаем, что каждое полушарие выполняет свою функцию. Каждое отвечает за различное видение и понимание окружающего мира. Левое анализирует окружающий мир со стороны логики, рациональности. Правое дает эмоциональную, чувственную, интуитивную оценку. Чтобы оценка мира (ситуации) была правильной и полной, нужно постоянно проверять логику чувствами, а чувства – логикой.
Мозолистое тело как канал соединения между полушариями состоит из огромного количества специальных клеток. Для нас важно, что между его клетками также устанавливаются связи, количество которых увеличивается в процессе обучения, поэтому обученный человек имеет повышенную способность комплексной логически-эмоциональной и эмоционально-логической оценки окружающего мира. Он не только лучше думает и тоньше чувствует, но обладает развитым чутьем, интуицией, которая есть следствие налаженной работы полушарий.
Исследования постоянно подтверждают, что общая интеллектуальная способность выше у людей, которые научились пользоваться обоими полушариями. Этот вывод чрезвычайно важен для обучения. Именно на пропорциональной нагрузке обоих полушарий – академического и эмоционального – нужно разрабатывать новые технологии обучения, точнее – технологии управления сбалансированной работой полушарий мозга.
Наши программы школьного и вузовского обучения эксплуатируют преимущественно левое полушарие, отвечающее за анализ и логику. Его беспощадно нагружают при изучении математики, физики, естественных наук. Возможности и резервы правого полушария используются мало. Фактически оно отдыхает в то время, когда должно интенсивно работать. Проанализировав ситуацию, известные американские педагоги А. и Б. Бьюзены, авторы известных в западном мире книг по педагогике, пишут: "Сосредоточиваясь только на половине способности мозга, люди ведут себя фактически как полугодовые".
Каждый педагог знает о пользе так называемых мнемонических приемов эмоционального действия, которые специально создаются, чтобы активизировать левое полушарие. Простейшие зарифмованные стихотворения существенно облегчают запоминание сложных логических понятий. Кто не знает выражения, которое помогло когда-то каждому из нас запомнить порядок цветов в спектре: "Каждый охотник желает знать, где сидит фазан" (красный, оранжевый, желтый, зеленый, голубой, синий, фиолетовый). "Пишешь что-нибудь куда-нибудь – черточки не забудь". Эти советы благодаря одновременному использованию логики и рифмы легко запоминаются.
Для продуктивного обучения надо позаботиться о гораздо более интенсивном взаимодействии обоих полушарий мозга. Необходимо создавать для этого благоприятные условия, изменяя устоявшиеся схемы умственной деятельности. Этим, кстати, мы решим еще одну важную проблему – качественного совместного обучения юношей и девушек. Известно, что мужской и женский мозг устроены по-разному, этот вопрос будет обсуждаться специально. У юношей больше развито логическое полушарие, у девушек – эмоциональное. С учетом этого следует отказаться от устаревших способов организации умственного труда школьников и студентов.
Что можно сделать уже сейчас, чтобы улучшить связи между полушариями и повысить их взаимодействие? Первоочередная задача – разблокировать правое, большей частью малоиспользуемое полушарие. Следует нагрузить его эмоционально окрашенной информацией. Этого можно достичь, тренируя воображение. Будем чаще создавать и применять "образы" всего, что следует понять, знать и запомнить обучающимся – от гипотенуз и катетов до знаков препинания и деепричастных оборотов. Чем больше абстракции, сухости, логики в учебном материале, тем больше следует обращаться к чувствам, вызывать эмоции учащихся. Сравните таблицу Д. Менделеева с балетным залом, в котором танцуют химические элементы. Пусть обучаемые нарисуют их, сохраняя главные черты. Водород пускай будет легким балетмейстером, подпрыгивающим до потолка, кислород – очень товарищеским, отбивающим у каждого элемента партнершу, тяжелое олово – сидящим в уголке зала, а благородный гелий – танцующим соло. Такое описание запомнят все.
Известно, что все люди хорошо запоминают знания, взволновавшие их. Наши воспоминания, связанные с переживаниями, очень сильные. Есть много способов эмоционально нагрузить студентов. Они могут дискутировать на важные темы, играть роли. Иногда достаточно, обсуждая какую-то проблему, обратить внимание на ее значение для цивилизации, науки, собственной карьеры, здоровья, благосостояния.
Рифмованный текст усваивается легче и быстрее. Об этом хорошо знают воспитатели дошкольных учреждений и используют стихотворения и песни при обучении малышей. Робота мозга шестилетнего ребенка и выпускника средней школы мало чем отличается, поэтому и в школе, и в университете нужно использовать рифмы, чтобы облегчить запоминание важного материала. Уже есть опыт изложения школьных и вузовских предметов в стихах. Математика, физика, химия звучат как поэмы. Однако, видимо, мы еще многого не понимаем в работе нашего мозга, потому что теряем чувство меры – вместо одного полушария нагружаем другое. Важно, чтобы синхронно работали оба полушария.
Хороший доступ к возможностям, которые скрыты в правой части мозга, открывается с помощью рисования. Всевозможные рисунки, графики, в том числе ментальные и познавательные карты, карты памяти, опорные конспекты, о которых мы будем вести речь дальше, объединяют логику с воображением.
Очень важны для эффективного обучения шутки и юмор. Обучаемые быстрее и легче запомнят материал, если он будет ассоциироваться со смешной историей. Своевременная, остроумная шутка педагога почти всегда гарантирует полную ассоциацию.
Эффективность обучения зависит от типа и структуры знаний. Есть два типа знаний: декларативные и процедурные. Декларатинные показывают то, что мы знаем. Процедурные означают, что мы умеем с этими знаниями делать. Лучше запоминаются процедурные знания. От характера знаний зависит их запоминание. Как облегчить мозгу запоминание?
Опираясь на новые результаты изучения мозга, педагоги настойчиво ищут такие способы организации его деятельности, которые устраняли бы недостатки нынешнего обучения и позволяли задействовать неиспользуемые резервы мозга. Нам открываются пути более тонкого руководства умственной деятельностью, деликатной обработки участков мозга с помощью тонких прикосновений там, где мы раньше действовали лопатой и кувалдой. В принципе ничего не меняется, лишь наши педагогические действия становятся более целенаправленными, выверенными, точными. Я бы сравнил грамотную педагогическую деятельность с микрохирургией, приносящей больше пользы больному за счет высокой целенаправленности воздействий.
Нашей целью должно быть развитие всех типов интеллекта учеников и студентов. Мы должны помочь каждому как можно раньше распознать свой ведущий интеллект, опираясь на который будут развиваться сопровождающие интеллекты. Множество развитых интеллектов всегда обеспечит более высокий общий уровень интеллекта, что гарантирует человеку гораздо лучшую приспособляемость к условиям жизни.
"Много талантов, если не интеллектов, теряется, расточается, поскольку их не заметили или уронили; лица с такими талантами – основные жертвы ограниченного, узкого подхода к уму", – утверждает Г. Гарднер. – Никому не надо доказывать, что наш мир преисполнен проблем; чтобы иметь шанс решить их, мы должны гораздо лучше использовать типы интеллекта, которыми владеем". Сегодня в учебных заведениях обращается чрезмерное внимание на языковой и логико-математический интеллект, другие типы используются явно недостаточно, поэтому некоторых студентов оценивают как слабых, медленных или таких, которые не имеют никаких способностей. Это большая ошибка.
Педагогам, которые хотели бы перестроить свое обучение на основе новых представлений о работе мозга и хотели бы, в частности, совершенствовать развитие всех видов интеллекта, следует обратить внимание на некоторые тонкости управления познавательной деятельностью студентов.
Работы в области приобретения знаний интеллектуальными системами были и остаются важнейшим направлением теории и практики искусственного интеллекта. Целью этих работ является создание методологий, технологий и программных средств переноса знаний (или, как иногда говорят, компетентности), в базу знаний системы. При этом в качестве источников знаний выступают эксперты (т.е. высококвалифицированные специалисты предметных областей), тексты и данные, например, хранимые в базах данных. Соответственно, развиваются различные методы приобретения знаний.
Машинному обучению в мире уделяется большое внимание. Существует множество алгоритмов машинного обучения, среди самых распространенных – алгоритмы класса C4. Один из алгоритмов этого класса С4.5, является, по существу, алгоритмом декомпозиции и строит дерево решений. Об этом говорит сайт https://intellect.icu . Исходной информацией для построения этого дерева является множество примеров. С каждой вершиной дерева ассоциируется наиболее (на текущем шаге) частотный класс примеров. На следующем шаге этот принцип рекурсивно применяется к текущей вершине, т.е. множество примеров, связанных с текущей вершиной также разбивается на подклассы. Алгоритм завершает свою работу либо при удовлетворении некоторого критерия либо при исчерпании подклассов (если они заданы).
Активно исследуются методы обучения причинам действий. Иногда говорят о так называемой теории действий, имея в виду ситуационное исчисление в духе Джона МакКарти. В этой теории причины действий и сами действия описываются в виде клаузальных структур (один из видов таких структур представляет собой импликацию, левая часть которой есть конъюнкция атомарных формул, а правая состоит из одной атомарной формулы).
Далее, методы индуктивного логического программирования модифицируются таким образом, чтобы быть применимыми к поиску таких структур. Когда такие структуры найдены, их можно использовать в языках логического программирования для рассуждений о действиях и их причинах.
Многие работы этого направления посвящены "нейронной парадигме". Нейросетевой подход используется в огромном количестве задач - для кластеризации информации из Интернета, автоматической генерации локальных каталогов, представления образов (в рекурсивных нейронных сетях). Среди активно изучаемых в последнее время тем - неоднородные нейронные модели с отношениями сходства. (Heterogeneous Neural Networks with similarity relation).
Это отношение сходства определяется на множестве входов и множестве состояний сети, а мерой сходства является скалярное произведение векторов либо эвклидово расстояние (где один вектор-вектор входов, а другой распределение весов нейронов, описывающих текущую ситуацию).
Работы по автоматическому порождению гипотез связаны, главным образом, с формализацией правдоподобных рассуждений, поиском зависимостей причинно-следственного типа между некоторыми сущностями. В качестве примеров можно привести порождение гипотез о свойствах химических соединений (прогноз биологических активностей), о возможных причинах дефектов (диагностика) и т.п.
Это сравнительно новое направление, основу которого составляют две процедуры: обнаружение закономерностей в исходной информации и использование обнаруженных закономерностей для предсказания (прогнозирования). Сюда относят задачи выбора информативных данных из большой их совокупности, выбора информативных характеристик некоторого объекта из более широкого множества его характеристик, задачи построения модели, позволяющие вычислять значения выбранных информативных характеристик по значениям других характеристик, и т.п.
Значительную часть этого направления составляют исследования по различным аспектам распознавания изображений, в частности, с помощью нейросетей (включая псевдооптические нейросети). Изучаются методы распознавания последовательностей видеообразов на основе декларативного подхода и извлечения семантически значимой информации. К этому же направлению принадлежат исследования по графической технологии программирования в Интернете.
Это новое (впрочем, в теоретических, поведенческих аспектах – скорее хорошо забытое старое) направление, изучающее интеллектуальные программные агенты и их коллективы. Интеллектуальный агент это программная система, обладающая:
Основные задачи в этой области таковы: реализация переговоров интеллектуальных агентов и разработка языков для этой цели, координация поведения агентов, разработка архитектуры языка программирования агентов.
Следует подчеркнуть, что агентские технологии появились примерно 6-7 лет назад. За это время интерес к этим технологиям переместился из сферы академических исследований в сферу коммерческих и промышленных приложений, а идеи и методы агентских технологий весьма быстро мигрировали из искусственного интеллекта в практику разработки программного обеспечения и другие вычислительные дисциплины.
Планирование поведения, или ИИ - планирование – это способность интеллектуальной системы синтезировать последовательность действий для достижения желаемого целевого состояния. Работы по созданию эффективных методов такого синтеза востребованы и активно ведутся уже около 30 лет. Планирование является основой интеллектуального управления, т. е. автоматического управления автономным целенаправленным поведением программно-технических систем.
Среди методов ИИ–планирования сегодня выделяют классическое планирование, т.е. планирование в условиях статической среды, динамическое планирование, т.е. планирование в условиях изменения среды и, главное, учета такого изменения, иерархическое планирование, т.е.. когда действия абстрактного плана высокого уровня конкретизируются более детальными планами нижнего уровня , частично - упорядоченное (или монотонное ) планирование, когда план строится на основе частично упорядоченного множества подпланов. При этом , общий план (элементами которого являются подпланы), обязан быть монотонным, а каждый из подпланов может быть немонотонным. Добавлю, что монотонность это такое свойство плана, когда каждое его действие уменьшает различия между текущим состоянием и целью поведения. Например, если план движения робота к цели таков, что каждый его шаг приближает к цели, то план монотонен, но если он наткнулся при этом на препятствие и требуется его обойти, то монотонность плана нарушится. Однако, если план обхода препятствия выделить в отдельный подплан и рассматривать оный как элемент исходного плана, то монотонность последнего восстановится.
Активно ведутся работы и в области распознавания планов, построения планировщиков и расширения их возможностей, эвристического планирования с ресурсными ограничениями, управления планированием посредством временной логики, планирования с использованием графов.
Рассматриваются подходы к планированию, при которых построение текущих планов выполняется непрерывно для каждого состояния системы в реальном времени. Для этого предусмотрен непрерывный мониторинг объекта управления.
Это направление связано с разработкой систем поддержки речевого общения, c решением проблем уточнения запроса в информационных системах, с задачами сегментации текстов по тематическим топикам, с задачами управления диалогом, с задачами анализа естественного языка с использованием различных эвристик. Сюда же включаются проблемы дискурса (иногда под дискурсом понимают совокупность речевых актов вместе с их результатами).
По прежнему актуальны обучения контекстному анализу текста, задачи приобретения знаний интеллектуальными системами и извлечения информации из текстов.
Важнейшей задачей в процессе извлечения информации, как, впрочем, и в процессе приобретения знаний, является минимизация роли эксперта – участника процесса.
Важность этого направления нельзя недооценивать. Причина тому - возрастание потоков текстовой информации, существующий социальный заказ на поиск релевантной информации в Интернете, на анализ текстовой информации, на извлечение данных из текстов. Таким образом, значение методов автоматического анализа текстов будет в дальнейшем возрастать.
Предметом исследований является также динамическое моделирование пользователя, в частности, в системах электронной коммерции, развитие фреймового подхода для представления запросов пользователя, адаптивный интерфейс, мониторинг и анализ покупательского поведения в Интернете.
Это направление представлено нечеткими схемами «вывода по аналогии», взглядом на теорию нечетких мер с вероятностных позиций, нечетким представлением аналитическими моделями для описания геометрических объектов, алгоритмами эволюционного моделирования с динамическими параметрами, такими как время жизни и размер популяции, методами решения оптимизационных задач с использованием технологий генетического поиска, гомеостатических и синергетических принципов и элементов самоорганизации.
Это обширная сфера деятельности внутри ИИ, ставящая перед собой задачи:
Сегодня можно выделить ряд направлений в искусственном интеллекте, которые во вполне обозримом будущем могут привести к качественным изменениям в технике и технологиях. Здесь я намерен изложить свой взгляд на некоторые из них.
По-видимому, рассуждения, основанные на прецедентах (CBR) - один из наиболее перспективных подходов в искусственном интеллекте, внедрение которого приведет к значительному прогрессу в ряде областей, а прорыва в этом направлении следует ожидать в ближайшие 3-5 лет. Некоторые из существующих и ожидаемых приложений CBR были перечислены выше.
Рассуждения о пространстве - не очень новая, но бурно развивающаяся сейчас область искусственого интеллекта, имеет все возрастающее прикладное значение в связи с работами по созданию автономных мобильных устройств, анализу изображений (в частности, аэрофотоснимков), задачами синтеза текстовых описаний по изображениям.
По-видимому, с помощью методов машинного обучения и автоматического формирования гипотез можно будет решить ряд полезных практических задач - от обнаружения закономерностей в данных до повышения степени адаптивности и "уровня интеллекта" различных технических устройств.
Подходы, основанные на технологии интеллектуальных агентов надо признать одними из наиболее перспективных при разработке больших программных продуктов, в том числе средств управления крупными и сложными системами (к таковым относятся телекоммуникационые системы, распределенные производства, системы управления войсками, транспортом, сетями, распределенный поиск информации). Не исключено также, что это направление исчезнет как отдельная научная дисциплина, растворившись в смежных областях, но оказав при этом на них решающее технологическое влияние.
Следует ожидать все большего влияния идей и методов (ИИ) на машинный анализ текстов (АТ) на естественном языке. Это влияние, скорее всего, коснется семантического анализа и связанных с ним методов синтаксического анализа - в этой области оно проявится в учете модели мира на заключительных стадиях семантического анализа и использовании знаний о предметной области и ситуативной информации для уменьшения переборов на более ранних стадиях (например, при построении деревьев синтаксического разбора).
Второй «канал связи» ИИ и АТ - использование методов машинного обучения в АТ; третий «канал» - использование рассуждений на основе прецедентов и рассуждений на основе аргументации для решения некоторых задач АТ, например задач уменьшения шума и повышения степени релевантности поиска.
К одному из наиболее важных и перспективных направлений в искусственном интеллекте следует сегодня отнести задачи автоматического планирования поведения. Область применения методов автоматического планирования - самые различные устройства с высокой степенью автономности и целенаправленным поведением, от бытовой техники до беспилотных космических кораблей для исследования глубокого космоса.
Инженерия знаний – это область информационной технологий, цель которой – накапливать и применять знания, не как объект обработки их человеком, но как объект для обработки их на компьютере. Для этого необходимо проанализировать знания и особенности их обработки человеком и компьютером, а также разработать их машинное представление. К сожалению точного и неоспоримого определения, что собой представляют знания, до сих пор не дано. Но тем не менее цель инженерии знаний – обеспечить использование знаний в компьютерных системах на более высоком уровне, чем до сих пор – актуальна. Но следует заметить, что возможность использования знаний осуществима только тогда, когда эти знания существуют, что вполне объяснимо. Технология накопления и суммирования знаний идет бок о бок с технологией использования знаний, они взаимно дополняют друг друга и ведут к созданию одной технологии, технологии обработки знаний.
В данной работе я постарался описать методы решения одной из проблем данного комплекса – это проблемы приобретения знаний, или говоря другими словами – обучения.
Методы приобретения знаний.
Приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. При этом в зависимости от способности системы обучения к логическим выводам возможны различные формы приобретения знаний, а также различные формы получаемой информации. Форма представления знаний для их использования определяется внутри системы, поэтому форма информации, которую она может принимать, зависит от того, какие способности имеет система для формализации информации до уровня знаний. Если обучающаяся система совсем лишена такой способности, то человек должен заранее подготовить все, вплоть до формализации информации, т. е. чем выше способности машины к логическим выводам, тем меньше нагрузка на человека.
Функции, необходимые обучающейся системе для приобретения знаний, различаются в зависимости от конфигурации системы. В дальнейшем при рассмотрении систем инженерии знаний предполагается, что Существует система с конфигурацией, показанной на рис, 1.1, которая включает базу знаний и механизм логических выводов, использующий эти знания при решении задач. Если база знаний пополняется знаниями о стандартной форме их представления, то этими знаниями также можно воспользоваться. Следовательно, от функций обучения требуется преобразование полученной извне информации в знания и пополнение ими базы знаний.
Рис.1 Базовая структура систем обработки знаний
Можно предложить следующую классификацию систем приобретения знаний, которая будет опираться на способность системы к восприятию знаний в разных форматах, качественно различающихся между собой и способностью к формализации (рис 2).
Рис 2.Классификация методов приобретения знаний.
Обучение без выводов.
Категорию А можно назвать обучением без выводов или механическим запоминанием, это простой процесс получения информации, при котором необязательны функции выводов, а полученная информация в виде программ или данных используется для решения задач в неизменном виде. Другими словами, это способ получения информации, характерный для существующих компьютеров.
Категория Б—это получение информации извне, представленной в форме знаний, т. е. В форме, которую можно использовать для выводов. Обучающейся Системе необходимо иметь функцию преобразования входной информации в формат, удобный для дальнейшего использования и включения в базу знании.
Приобретение знаний на этом этапе происходит в наиболее простой форме: это знания, предварительно подготовленные человеком во внутреннем формате, какими являются большинство специальных знании, изначально заданных в экспертных системах. В случае прикладных систем инженерии знаний необходимо преобразовать специальные знания из какой-либо области в машинный формат, но для этого нужен посредник, хорошо знающий как проблемную область, так и инженерию знаний. Таких посредников называют инженерами по знаниям. В общем случае для замены функции посредника можно использовать и специальные подпрограммы. Т.е. необходимо иметь функции выводов достаточно высокого уровня, но можно ограничиться и выводами на сравнительно низком уровне, а остальное доверить человеку — в этом и состоит приобретение знаний в диалоге. Примером служит хорошо известная система TEIRESIAS. Это система-консультант в области медицины, разработанная на базе системы MYCIN. Специалисты в проблемной области являются преподавателями обучающейся системы, а ученик — система инженерии знаний — изучает ответы на поставленные задачи и корректирует те правила в базе знаний, которые ранее приводили к ошибкам. Для подготовки знаний в экспертной системе необходимы вспомогательные средства типа редактора знаний, причем в процессе приобретения знаний в диалоге не только редактируются отдельные правила и факты, но и восполняются недостатки существующих правил, т. е. ведется редактирование базы знаний.
Если знания заданы во внешнем формате, например на естественном языке, то следует преобразовать их во внутренний формат. Для этого необходимо понимать внешнее представление, т. е. естественный язык, графические данные и т. п. Фактически приобретение знаний и их понимание тесно связаны. Проблема понимания сводится не только к преобразованию структуры предложений — необходимо получить формат, удобный для применения.
Аналогичная проблема — преобразование во внутренний формат советов, подсказок по решению задач, что называется "операционализацией" знаний В этом заключается центральная проблема искусственного интеллекта; она, в частности, изучает преобразование советов, подсказок, представленных в терминах проблемной области, в процедуры. Например, система UNDERSTAND выполняет операционализацию представления задачи о ханойской башне на английском языке путем построения соответствующих состояний и операций, приводящих к этим состояниям.
Приобретение знаний на метауровне
Выше было рассмотрено обучение на объектном уровне, а еще более сложная проблема - приобретение знаний на метауровне, т. е. знаний, основой которых является информация по управлению решением задач с использованием знаний на объектном уровне. Для знаний на метауровне пока не установлены ни формы представления и использования, ни связь со знаниями на объектном уровне, ни другая техника их систематизации. Поскольку не определена форма их представления с точки зрения использования, то трудно говорить о приобретении знаний на метауровне. Тем не менее с этой проблемой связаны многие надежды в инженерии знаний,
Приобретение знаний из примеров
Метод приобретение знаний из примеров отличается от предыдущего метода, тем , что здесь выполняется сбор отдельных фактов, их преобразование и обобщение, а только затем они будут использованы в качестве знаний. И соответственно от уровня сложности системы вывода в системе будут возникать разные по степени общности и сложности знания. Необходимо также упомянуть о том, что этот метод приобретения знаний почти не нашел практического применения, это может быть связано с тем, что входная информация представляет собой не систематизированный набор данных и для их обработки требуется наличие в системе обширных знаний по конкретной области.
По сравнению с предыдущим методом приобретения знаний, этот метод имеет большую степень свободы и соответственно необходимо описать общие положения этого принципа.
1. Языки представления. Обучение по примерам — это процесс сбора отдельных фактов, их обобщение и систематизация, поэтому необходим унифицированный язык представления примеров и общих правил. Эти правила, будучи результатом обучения, должны стать объектами для использования знаний, поэтому и образуют язык представления знаний. И наоборот, язык представления знаний должен учитывать и определять указанные выше условия приобретения знаний.
2. Способы описания объектов. В случае обучения .по примерам из описаний отдельных объектов создаются еще более общие описания объектов некоторого класса, при этом возникает важная проблема: как описать данный класс объектов. В полном классе некоторых объектов следует определить меньший класс объектов, обладающих общим свойством (объекты только в этом классе обладают заданным свойством), но в действительности проще определить список объектов и убедиться, что все объекты в нем обладают общим свойством. Для некоторого типа задач можно эффективно использовать ложные примеры или контрпримеры, убедительно показывающие, что данные объекты не входят в этот класс.. Иллюстрацией применения контрпримеров может служить понятие "почти то".
3. Правила обобщения. Для сбора отдельных примеров и создания общих правил необходимы правила обобщения. Предложено несколько способов их описания: замена постоянных атрибутов языка на переменные, исключение описаний с ограниченным применением и т. п. Очевидно, что эти способы тесно связаны с языком представления знаний.
4. Управление обучением. В процессе обучения по примерам можно применять различные стратегии структуризации информации и необходимо управлять этим процессом в ответ на входные данные. Существуют два классических метода: метод "снизу-вверх", при .котором, последовательно выбираются и структурируются отдельные сообщения, и метод "сверху-вниз", при котором сначала выдвигается гипотеза, а затем она корректируется по мере поступления информации. На практике эти методы комбинируются, хотя управление обучением с максимальным эффектом не такая уж простая проблема.
При изучении метода приобретения знаний по примерам можно выделить следующий ряд методов:
Параметрическое обучение.
Наиболее простая форма обучения по примерам или наблюдениям состоит в определении общего вида правила, которое должно стать результатом вывода, и последующей корректировки входящих в это правило параметров в зависимости от данных. При этом используют психологические модели обучения, системы управления обучением и другие методы.
Примером обучающейся системы этой категории в области искусственного интеллекта является система Meta-Dentral. Эта система выводит новые правила путем коррекции правил продукций в процессе обучения или на основе исходных массспектральных данных параметрическое обучение в ней представлено в несколько специфичном виде, но все же она относятся к указанной выше категории, поскольку в системе задана основная структура знаний, которая корректируется последовательно по отдельным данным.
Ярким примером применения этого метода приобретения знаний могут также служить системы распознавания образов (обсуждавшиеся ранее в другом докладе). В них ясно просматривается основной принцип этого метода - в ходе обучения нейронная сеть автоматически по определенным заранее законам корректирует веса связей между элементами и значения самих элементов.
Метод обучения по индукции.
Среди всех форм обучения необходимо особо выделить обучение на основе выводов по индукции - это обучение с использованием выводов высокого уровня, как и при обучении по аналогии. В процессе этого обучения путем обобщения совокупности имеющихся данных выводятся общие правила. Возможно обучение с преподавателем, когда входные данные задает человек, наблюдающий за состоянием обучающейся системы, и обучение без преподавателя, когда данные поступают в систему случайно. И в том и в другом случае выводы могут быть различными, они имеют и различную степень сложности в зависимости от того, задаются ли только корректные данные или в том числе и некорректные данные и т. п. Так или иначе, обучение этой категории включает открытие новых правил, построение теорий, создание структур и другие действия, причем модель теории или структуры, которые следует создать, заранее не задаются, поэтому их необходимо разработать так, чтобы можно было объяснить все правильные данные и контрпримеры.
Индуктивные выводы возможны в случае, когда представление результата вывода частично определяется из представления входной информации. В последнее время обращают на себя внимание программы генерации программ по образцу с использованием индуктивных выводов.
Как уже было сказано, индуктивный вывод — это вывод из заданных данных объясняющего их общего правила. Например, пусть известно, что есть некоторый многочлен от одной переменной. Давайте посмотрим, как выводится f(х), если последовательно задаются в качестве данных пары значений (0, f(0)), (1, f(1)), .... Вначале задается (0, 1), и естественно, что есть смысл вывести постоянную функцию f(х)=1. Затем задается (1, 1), эта пара удовлетворяет предложенной функции f{х)= 1. Следовательно в этот момент нет необходимости менять вывод. Наконец, задается (2, 3), что плохо согласуется с нашим выводом, поэтому откажемся от пего и после нескольких проб и ошибок выведем новую функцию f(х)==х2—х+1, которая удовлетворяет всем заданным до сих пор фактам (0, 1), (1, 1), (2,3). Далее мы убедимся, что эта же функция удовлетворяет фактам (3, 7), (4, 13), (5, 21) ..., поэтому нет необходимости менять этот вывод. Таким образом, из последовательности пар переменная-функция можно вывести многочлен второй степени. Грубо говоря, такой метод вывода можно назвать индуктивным.
Как видно из этого примера, при выводе в каждый момент времени объясняются все данные, полученные до этого момента. Разумеется, данные, полученные позже, уже могут и не удовлетворять этому выводу. В таких случаях приходится менять вывод. Следовательно, в общем случае индуктивный вывод—это неограниченно долгий процесс. И это не удивительно, если вспомнить процесс освоения человеком языков, процесс совершенствования программного обеспечения и т. п.
Для точного определения индуктивного вывода необходимо уточнить:
В качестве правил—объектов вывода—можно рассматривать главным образом индуктивные функции, формальные языки, программы и т. п. Кроме того, эти правила могут быть представлены в виде машины Тьюринга для вычисления функций, грамматики языков, операторов Пролога и другим способом. Машина Тьюринга—это математическая модель компьютера, ее в принципе можно считать программой. В случае когда объектом вывода является формальный язык, он сам определяет правила, а его грамматика — метод представления правил, поэтому говорят о грамматическом выводе.
Для показа примеров функции f можно использовать последовательность пар (х,f(х)) входных и выходных значений так, как указано выше, последовательность действий машины Тьюринга, вычисляющей и другие данные. Задание машине выводов пары входных и выходных значений (х, f(х)) функции f соответствует заданию системе автоматического синтеза программ входных значений х и выходных значений f(х), которые должны быть получены программой вычисления f в ответ на х. В этом смысле автоматический синтез программ по примерам также можно считать индуктивным выводом функции f. Формальные языки — это множество слов; поэтому, например, для языка L можно рассматривать _ва типа слов, принадлежащих и не принадлежащих этому языку. Первые назовем положительными, а вторые — отрицательными данными. Другими словами, есть два способа показа примеров формального языка: с помощью положительных и отрицательных данных. Когда объектом служат сами программы, тогда то же самое можно говорить о функциях языка Лисп, но для Пролога показ примеров осуществляется в виде фактов. Например, (3>4, истина), (2<=1, ложь). В этом случае положительным данным соответствуют данные с атрибутом "истина", а отрицательным — данные с атрибутом "ложь".
Вывод реализуется благодаря неограниченному повторению основного процесса
запрос входных данных -> предположение -> выходные данные.
Другими словами, при выводе последовательно получают примеры как входные данные, вычисляют предположение па данный момент и выдают результат вычислений. Предположение в каждый момент времени основано на ограниченном числе примеров, полученных до сих пор, поэтому обычно в качестве метода вывода используют машину Тьюринга, вычисляющую предположение по ограниченному числу примеров. Такую машину назовем машиной выводов.
Учитывая, что индуктивный вывод, как уже было отмечено, это неограниченно продолжающийся процесс, критерием правильности вывода, как правило, считают понятие идентификации в пределе. Это понятие введено Голдом, оно используется почти всегда в теории индуктивных выводов. Говорят, что машина вывода М идентифицирует в пределе правило R, если при показе примеров К последовательность выходных данных, генерируемых М, сходится к некоторому представлению т, а именно: все выходные данные, начиная с некоторого момента времени, совпадают с т, при этом т называют правильным представлением К.. Кроме того, говорят, что множество правил Г позволяет сделать индуктивный вывод, если существует некоторая машина выводов М, которая идентифицирует в пределе любое правило К из множества Г. Обратите внимание на то, что слова "позволяет сделать индуктивный вывод" не имеют смысла для единственного правила, а относятся только к множеству правил.
Обучение по аналогии.
Приобретение новых понятий возможно путем преобразования существующих знаний, похожих на те, которые собираются получить. Это важная функция, которую называют обучением на основе выводов по аналогии или просто обучением по аналогии. В нашей жизни много примеров, когда новые понятия или технические приемы приобретаются с помощью аналогии
Выводы по аналогии - один из важных объектов исследования искусственного интеллекта, наиболее интересные результаты здесь получены П. Уинстоном. Он использует выводы по аналогии, основываясь на следующей гипотезе: "Если две ситуации подобны по нескольким признакам, то они подобны и еще По одному признаку". Подобие двух ситуаций распознается путем обнаружения наилучших совпадений по наиболее важным признакам.
Аналогия—это метод выводов, при которых обнаруживается подобие между несколькими заданными объектами; благодаря переносу фактов и знаний, справедливых для одних объектов, на основе этого подобия на совсем другие объекты либо определяется. способ решения задач, либо предсказываются неизвестные факты и знания. Следовательно, когда человек сталкивается с неизвестной задачей, он на первых порах использует этот естественный метод вывода.
Направления исследования аналогии
Одна из важнейших проблем инженерии знаний— приобретение знаний. Под приобретением здесь понимается
получение знаний в виде, пригодном для их использования компьютерами, поэтому многие исследователи указывают, что ключом к знаниям является теория и методология машинного обучения. В общем случае машинное обучение включает приобретение новых декларативных знаний, систематизацию и хранение новых знаний, а также обнаружение новых фактов. Среди указанных форм обучения аналогия, о которой будет идти далее речь, связана, и частности, с проблемой машинного обнаружения новых фактов.
Под новыми фактами мы будем понимать факты, которые дедуктивно не выводятся из некоторых существующих знаний. Получение новых знаний также рассматривалось выше в отношении к индуктивному выводу . В общем случае при индуктивных выводах по заданным данным создается гипотеза, их объясняющая, а с помощью дедукции из этой гипотезы можно вывести новые факты. С другой стороны, при аналогии новые факты предсказываются путем использования некоторых преобразований уже известных знаний.
Индукция и аналогия крайне необходимы при обработке интеллектуальной информации, и поэтому желательно изложить основы их совместного применения. Шапиро ввел строгую формализацию индуктивных выводов в части вывода моделей с использованием логики предикатов первого порядка; в теории индуктивных выводов есть заметные успехи.
С целью обзора исследований аналогии, проведенных до настоящего времени, выделим два типа аналогии: для решения задач и для предсказаний. Аналогия первого типа применяется главным образом для повышения эффективности решения задач, которые, вообще говоря, можно решить и без аналогии. Например, благодаря использованию решений аналогичных задач в областях программирования и доказательства теорем можно прийти к выводам о программах или доказательствах. С другой стороны, используя аналогию для предсказаний, благодаря преобразованию знаний на основе подобия между объектами можно сделать заключение о том, что, возможно, справедливы новые факты. Например, если объектами аналогии является некая система аксиом, то знаниями могут быть теоремы, справедливые в этой системе. При этом, используя схожесть между системами аксиом, можно преобразовать теорему в одной из систем в логическую формулу для другой системы и сделать вывод о том, что эта формула есть теорема. Другими словами, аналогия используется и для решения некоторых строго сформулированных задач и для предсказаний, а также для приобретения не заданной ранее информации.
Примером использования метода приобретений знаний по аналогии может служить система доказательства теорем. При этом общая схема вывода выглядит следующим образом.
Рис. 3 Стратегия абстрагирования.
Если я не полностью рассказал про приобретение знаний? Напиши в комментариях Надеюсь, что теперь ты понял что такое приобретение знаний, получение знаний и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Машинное обучение
Комментарии
Оставить комментарий
Машинное обучение
Термины: Машинное обучение