Лекция
Привет, Вы узнаете о том , что такое start wordnet start схема работы, Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое start wordnet start схема работы , настоятельно рекомендую прочитать все из категории Создание вопросно-ответных систем.
l Семантический лексикон английского языка
l Состоит из синсетов (смыслов) l Синсет:
l несколько синонимичных слов
l описание значения
l Одно слово – несколько синсетов (значений)
l 150 000 слов, 115 000 синсетов, 207 000 пар «слово – синсет»
l Существительные
l Гиперонимы: Y – гипероним X, если X – разновидность Y lГипонимы: Y – гипоним X, если Y – разновидность X
l Равные по рангу: X и Y равны по рангу, если у них общий гипероним
l Голонимы: Y – голоним X, если X – часть Y
l Меронимы: Y – мероним X, если Y – часть X
l Глаголы
l Двигаться – гипероним Бегать
l Шептать – гипоним Говорить
l Спать – следование Храпеть
l Ходить – равный по рангу Бегать
l WordNet используется в системе Start при поиске совпадения с T-выражениями
l Пусть в базе есть T-выражение <bird can fly>
l Canary – гипоним Bird
l На вопрос: “Can canary fly?” Start ответит “Yes”
l «Универсальная база»
l Используется для выполнения запросов о фактах
l Модель «объект-свойство-значение»
l Пример: “Federico Fellini is a director of La Strada”
l Объект: La Strada l Свойство: director
l Значение: Federico Fellini
l Каждому объекту сопоставлен источник данных (data source):
l Star Wars imdb-movie
Вопрос
Who wrote the music for Star
Wars?
Who invented dynamite?
How big is Costa Rica?
How many people live in Kiribati?
Объект Свойство Значение
Star Wars Composer John Williams
Dynamite Inventor Alfred Nobel
Costa Rica Area 51,100 sq. km
Kiribati Population 94,149
What languages are Guernsey Languages English, spoken in French
Guernsey?
Show me paintings Monet Works [images]
by Monet
“Victor Fleming directed Gone with the wind”
l Преимущества:
l Единый формат запросов к базе
l Естественность использования модели
«объект-свойство-значение» l Недостатки:
l Необходимость написания «обертки» для каждого источника данных
l Wikipedia
l The World Factbook 2006
l Google
l Yahoo
l The Internet Movie Database
l Internet Public Library
l The Poetry Archives
l Biography.com
l Merriam-Webster Dictionary
l WorldBook
l Infoplease.com
l Metropla.net
l Weather.com
l Новая концепция развития сети Интернет
l Проблема машинного анализа информации, размещенной в Сети
l Вся информация в Сети должна размещаться на двух языках:
l Человеческом
l Компьютерном
l Для создания компьютерного описания ресурса используется формат RDF (Resource Description Framework), основанный на:
l Формат XML
l Триплеты «Объект – Отношение – Субъект»
l Предлагается к каждому информационному блоку составлять аннотацию на естественном языке
l Компромисс между машинно-читаемым и естественным описанием информации
l В базе знаний хранятся только аннотации с прикрепленными ссылками на источники
l Эффективная организация доступа к информации произвольного типа:
l Тексты
l Изображения l Мультимедиа
l Базы данных
l Процедуры
l Аннотации могут быть параметризованы
l Внедрение аннотаций:
l Добавление аннотаций в RDF описания документов
l Использование параметризованных аннотаций
(схем доступа к информации)
l Использование схем поиска ответов
l How many people live in Kiribati?
l What is the population of the Bahamas?
l Tell me Guam’s population.
1. <rdfs:Class ID="Country">
2. <rdfs:comment>A Country in the CIA Factbook</rdfs:comment>
3. </rdfs:Class>
4. <rdf:Property ID="population">
5. <rdfs:domain rdf:resource="#Country"/>
6. <rdfs:range rdf:resource="xsd:string"/>
7. <nl:ann text="Many people live in ?s"/>
8. <nl:ann text="population of ?s"/>
9. <nl:gen text="The population of ?s is ?o"/> 10. </rdf:Property>
l What is the country in Africa with the largest area?
l Tell me what Asian country has the highest population density.
l What country in Europe has the lowest infant mortality rate?
l What is the most populated South American country?
1. <nl:InformationAccessSchema>
2. <nl:ann>what country in $region has the largest
$attribute</nl:ann>
3. <nl:pattern>?x a :Country</nl:pattern>
4. <nl:pattern>?x map($attribute) ?val</nl:pattern>
5. <nl:pattern>?x :location $region</nl:pattern>
6. <nl:action>display(boundto(?x, max(?val)))</nl:action>
7. <nl:mapping>
8. <nl:hash variable="$attribute">
9. <nl:map value="population">:population</nl:map>
10. <nl:map value="area">:area</nl:map>
11. ...
12. </nl:hash>
13. </nl:mapping>
14. </nl:InformationAccessSchema>
l Is Canada’s coastline longer than Russia’s coastline?
l Which country has the larger population, Germany or Japan?
l Is Nigeria’s population bigger than that of South Africa?
1. <nl:InformationAccessSchema>
2. <nl:ann>$country-1’s $att is larger than $country-2’s $att</nl:ann>
3. <nl:pattern>?x a :Country</nl:pattern>
4. <nl:pattern>?x map($att) ?val-1</nl:pattern> 5. <nl:pattern>?y a :Country</nl:pattern>
6. <nl:pattern>?y map($att) ?val-2</nl:pattern>
7. <nl:action>display(gt(?val-1, ?val-2)))</nl:action>
8. <nl:mapping>
9. <nl:hash variable="$att">
10. <nl:map value="population">:population</nl:map>
11. <nl:map value="area">:area</nl:map>
12. ...
13. </nl:hash>
14. </nl:mapping>
15. </nl:InformationAccessSchema>
l What is the distance from Japan to South Korea?
l How far is the United States from Russia? l What’s the distance between Germany and England?
l План ответа на такой вопрос:
l Найти столицу одной страны
l Найти столицу другой страны
l Вычислить расстояние между ними
1. <nl:InformationPlanningSchema>
2. <nl:ann>distance between $country1 and $country2</ann>
3. <nl:plan>
4. <rdf:Seq>
5. <rdf:li>what is the capital of $country1 := ?capital1</rdf:li>
6. <rdf:li>what is the capital of $country1 := ?capital2</rdf:li>
7. <rdf:li>what is the distance between ?capital1 and ?capital2
8. := ?distance</rdf:li>
9. </rdf:Seq>
10. </nl:plan>
11. <nl:action>display(?distance)</nl:action>
12. </nl:InformationPlanningSchema>
l Преимущества:
l Описание информации на универсальном, естественном языке
l Одна параметризованная аннотация может обрабатывать сотни вопросов
l Автоматизация процесса составления аннотаций
l Запросы к Omnibase также описываются с помощью аннотаций lНедостатки:
l сложность внедрения
l Обработка составных запросов и их автоматическая декомпозиция
l Наращивание баз с целью повышения избыточности информации
l Автоматизация анализа семантических связей в документах
l Внедрение аннотаций
l Особые стратегии поиска ответов для различных предметных областей
В заключение, эта статья об start wordnet start схема работы подчеркивает важность того что вы тут, расширяете ваше сознание, знания, навыки и умения. Надеюсь, что теперь ты понял что такое start wordnet start схема работы и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Создание вопросно-ответных систем
Из статьи мы узнали кратко, но содержательно про start wordnet start схема работы
Комментарии
Оставить комментарий
Создание вопросно-ответных систем
Термины: Создание вопросно-ответных систем