Лекция
Привет, сегодня поговорим про передвижной робот с голосовым управлением, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое передвижной робот с голосовым управлением , настоятельно рекомендую прочитать все из категории Робототехника.
Речь является идеальным способом управления и коммуникации в робототехнике. Схема устройства распознавания речи (УРР), которой будет посвящена эта глава, функционирует независимо от основного «интеллекта» роботы (ЦПУ). Этот факт является позитивным, поскольку ресурс ЦПУ робота не используется для решения задачи распознавания речи. Задача ЦПУ сводится к тому, чтобы время от времени опрашивать шины выхода устройства распознавания для обнаружения возможных поступивших речевых команд. Данный процесс может быть оптимизирован путем подключения одной из выходных шин устройства распознавания к шине прерываний ЦПУ. При этом распознаваемое слово вызовет прерывание, оповещая ЦПУ, что команда была произнесена. Преимущество использования прерывания в том, что при этом отпадает необходимость постоянного опроса состояния устройства распознавания, что, таким образом, экономит ресурс ЦПУ.
Другим преимуществом отдельного законченного блока устройства распознавания речи (УРР) является его программируемость. Вы можете запрограммировать и «научить» УРР распознаванию тех конкретных слов, которые вы предполагаете использовать в качестве команд. Легко создать интерфейс, сопрягающий УРР с ЦПУ робота.
Большинство сегодняшних систем распознавания речи, появляющихся на рынке, представляют собой специальное матобеспечение, требующее наличия рабочего компьютера (как правило, системы РС или совместимого) и звуковой карты. Система УРР в своей основе представляет собой программу, хотя для своей работы требует некоторого «железа» (звуковая карта). Такие программы функционируют обычно под платформой DOS или Windows, занимая при этом определенную часть памяти и ресурса ЦПУ, допуская в то же время одновременную работу других программ, таких как Word или Lotus. Одновременная работа программы УРР замедляет работу других программ, использующих данные программы УРР.
Распознавание речи используется не только в робототехнике, но находит множество применений вне ее. Распознавание речи найдет применение как способ управления роботами в виртуальной реальности (ВР), приборах, играх, инструментах и компьютерах. Данная технология обладает в долгосрочной перспективе очень хорошим потенциалом, поэтому компании развивают методы распознавания речи. Возможность управлять и отдавать команды компьютеру (или прибору) непосредственно голосом сделает процесс управления таким устройством гораздо более простым, эффективным и удобным. Такой тип управления голосом в своей основе позволит пользователю осуществлять параллельно и другие операции (т. е. при голосовой работе с компьютером или прибором глаза и руки остаются «свободными» для другой работы).
В этой главе мы рассмотрим три проекта построения устройств распознавания речи. Первый проект представляет собой собственно схему УРР. Второй проект посвящен интерфейсу, связывающему УРР с мобильным шасси, взятым от радиоуправляемой модели автомобиля. Наконец, в третьем проекте рассматривается плата универсального интерфейса для набора УРР.
Проект 1: Программируемая схема распознавания речи
Первым проектом является создание программируемой схемы распозна-, -т вания речи. Термин «программируемый» используется в том смысле, что вы T"7V можете запрограммировать устройство для распознавания 40 отдельных слов по вашему выбору. «Сердцем» устройства является единственная ИС типа HM2007 – ИС распознавания речи. ИС обеспечивает распознавание слов длиной 0,96 с или 1,92 с.
При длине слова 0,96 с и статической оперативной памяти (RAM) размером 8Кх8 возможно распознавание до 40 отдельных слов. Возможно включение опции распознавания более длинных слов длиной 1,92 с. Хотя при этом количество распознаваемых слов сокращается до 20, появляется возможность распознавания не только отдельных слов, но и коротких фраз. В нашем проекте мы будем использовать интервал распознавания 0,96 с, что образует библиотеку из 40 распознаваемых слов.
Обучение процессу восприятия речи
Мы принимаем собственные способности к распознаванию речи как нечто само собой разумеющееся. Однако процесс выделения речи одного человека в толпе собравшихся на вечеринке лежит далеко за пределами возможностей современных систем УРР. Такие системы, точно так же как и мы, сталкиваются с нелегкими задачами разделения сигналов и фильтрации посторонних шумов.
Для надежной работы устройства УРР расстояние от говорящего до микрофона УРР не должно превышать 30 см. При использовании УРР на подвижном шасси робота, мы включили две небольшие радиостанции типа Walkie-Talkie. Выход одной из радиостанций соединен с микрофонным входом УРР. Другая радиостанция используется для собственно подачи голосовых команд роботу. Такая конфигурация снимает проблему удаленности от УРР и снижает посторонние шумы.
Задача распознавания речи не совпадает с задачей «понимания» речи. Если компьютер способен реагировать на звуковую команду, то это не означает, что он ее «понимает». Будущие системы распознавания речи, возможно, приобретут возможности распознавания смысловых и интонационных оттенков значения слов, т. е. будут реагировать по типу «Делай то, что я подразумеваю, а не то, что я произношу». Тем не менее подобные системы – вопрос отдаленного будущего.
Распознавание речи в зависимости и независимо от говорящего
В процессе распознавания речи можно выделить две задачи: распознавание речи для конкретного говорящего и независимо от него. Система распознавания речи «обучается» речью конкретного человека, который будет в дальнейшем ее использовать. Подобные системы способны запоминать значительное количество команд и распознавать их с вероятностью более 95 %. Недостатком такого подхода является то, что система достаточно точно распознает команды только того человека, который производил ее «обучение». Такой подход является наиболее распространенным для систем, основанных на использовании программного обеспечения персональных компьютеров.
Система, не зависящая от говорящего, «обучается» для понимания команд независимо от того, кто их произносит. По этой причине система должна иметь возможность адекватно реагировать на широкий спектр моделей речи, включая интонационное своеобразие и особенности произношения ключевых слов. В этом случае набор командных слов, как правило, значительно меньше, однако достижение необходимой точности реагирования и в этом случае возможно. Для промышленных целей чаще требуются именно системы распознавания, независимые по отношению к говорящему.
Наше УРР относится к системам, настроенным на речь конкретного человека. Мы можем сделать нашу систему отчасти «независимой» путем резервирования для каждого ключевого слова нескольких речевых моделей, каждая из которых программируется отдельно и занимает соответствующее место. Каждая из этих речевых моделей будет вызывать выполнение одной и той же команды.
Виды распознавания речи
Системы УРР имеют еще одно специфическое ограничение, которое относится к виду или стилю распознаваемой речи. Предполагается существование трех видов речи: раздельная, связная и непрерывная.
Раздельная речьСистемы УРР, оперирующие с раздельной речью, обрабатывают слова, которые произносятся раздельно. На сегодняшний день это наиболее распространенные системы УРР. В данном случае пользователю необходимо делать паузы между командными словами. В нашем устройстве РР будут использоваться как раз отдельные слова.
Связная речьСвязная речь занимает промежуточное положение между произнесением отдельных слов и непрерывным потоком речи. В этом случае пользователь может произносить группы слов в качестве команд. ИС HM2007 может быть установлена на распознавание слов или фраз длиной до 1,92 с. В этом случае словарь команд сокращается до 20 единиц.
Непрерывная речьНепрерывный поток разговорной речи мы используем в повседневной жизни. Для УРР распознавание непрерывной речи представляет фантастически трудную задачу, поскольку в таком потоке слова проявляют тенденцию к слиянию. Например, фраза «Здравствуйте, как вы поживаете?» фонетически звучит как «Здраствуте, каквыпоживате». Подобные системы распознавания непрерывного потока речи уже появились на рынке и находятся в процессе постоянного развития.
Схемное решение УРР
Демонстрационная схема выполнена на ИС HM2007, включенной в режим ручной моды. В данной моде для программирования ИС HM2007 используется микрофон и простейшая клавиатура.
КлавиатураВ качестве клавиатуры использована стандартная телефонная клавиатура, имеющая 12 нормально разомкнутых кнопок.
При включении питания ИС HM2007 осуществляет тестирование «бортовой» статической ОП. После завершения тестирования зажигаются цифры «00» на бортовом семисегментном индикаторе, зажигается красный светодиод, и устройство ожидает подачи команды.
ОбучениеНажмите «1» (на индикаторе загорится «01»), и светодиод погаснет. Затем нажмите «Т» (Training – обучение), и светодиод загорится снова.
Держите микрофон поближе ко рту и произнесите ключевое (обучающее) слово. Допустим, в качестве обучающего слова используется слово «компьютер». Произнесите «компьютер» в микрофон. Если устройство воспримет слово, то это вызовет мигание светодиода. Слово компьютер запрограммировано как слово под номером «01». Теперь если УРР «услышит» слово «компьютер», то оно отобразит число «01» на индикаторе.
Если диод не будет мигать после произнесения слова «компьютер», то либо попробуйте повторить это слово громче, либо начните сначала – наберите «01» а затем «Т».
Продолжайте введение образцов новых слов в УРР. Для второго слова нажмите «02» и затем «Т». Напомню, что устройство способно запомнить 40 слов. Понятно, что нет необходимости вводить все 40 слов. Введите необходимое вам количество слов и перейдите к следующему этапу.
Проверка функции распознаванияПроизнесите одно из ранее запомненных слов в микрофон. На цифровом индикаторе должен высветиться соответствующий номер. Об этом говорит сайт https://intellect.icu . Допустим, ключевое слово «директория» было введено под номером 25. Соответственно, произнесение слова «директория» должно вызвать зажигание цифры 25 на цифровом индикаторе.
Коды ошибок• 55 = слишком длинное слово
• 66 = слишком короткое слово
• 77 = соответствующего слова не найдено
Очистка памятиВы можете удалять отдельные записи ключевых слов путем набора номера слова и кнопки CLR. Для полной очистки памяти необходимо набрать 99 и кнопку CLR.
Особенности ИС HM2007ИС HM2007 для распознавания речи представляет собой однокристальную ИС КМОП-структуры высокой степени интеграции. В ИС имеется аналоговый вход, анализатор голоса, блок распознавания и блок контроля системных функций. ИС может использоваться самостоятельно или под управлением ЦПУ.
Характеристики• Однокристальная ИС для распознавания речи КМОП-структуры высокой степени интеграции
• Распознавание речи конкретного источника
• Поддержка внешней ОП
• До 40 распознаваемых ключевых слов
• Максимальная длина слова 1,92 с
• Возможность подключения микрофона
• Возможность работы в ручной моде и под управлением ЦПУ
• Время реагирования менее 300 мс
• Напряжение питания 5 В
Конструкция устройстваУстройство РР можно изготовить на основе готового набора деталей, поставляемого Images Company (см. список деталей в конце этой главы). Принципиальная схема приведена на рис. 7.1. Монтаж деталей удобно осуществлять на печатной плате.
Рис. 7.1. Схема устройства распознавания речи
Припаяйте выводы клавиатуры к печатной плате согласно рис. 7.2. Клавиатура имеет семь проводников, которые соединяются с ИС HM2007 на печатной плате. Каждый вывод клавиатуры соотносится с соответствующим выводом ИС HM2007.
Рис. 7.2. Распайка клавиатуры для УРР
На рис. 7.3. изображено расположение деталей на печатной плате со стороны компонентов. На рис. 7.4 изображено УРР в сборе.
Рис. 7.3. Вид сверху расположения деталей на печатной плате
Рис. 7.4. Устройство РР в сборе
Демонстрационная схема УРР позволяет производить эксперименты по распознаванию речи как в зависимости, так и независимо от говорящего. Обычно система настраивается под конкретного человека в предположении, что он будет ее использовать.
Мы можем использовать другой способ и «обучить» систему реагировать относительно независимо от говорящего. Для достижения этой цели мы будем использовать четыре модели «обучения» для каждого командного ключевого слова.
Для упрощения последующей цифровой обработки сообщений используем следующую логику. Для обозначения ключевого слова мы будем использовать только первую цифру (младший разряд) на цифровом индикаторе.
Таким образом, модели «01», «11», «21» и «31» будут распознаваться как одно и то же ключевое слово. Поскольку учитывается только младший разряд, то во всех случаях распознаваемое слово будет обозначаться как «1». Аналогично, модели «04», «14», «24» и «34» будут соответствовать ключевому слову «4».
Проблемы могут возникнуть при распознавании кодов ошибок.
• 55 = слишком длинное слово
• 66 = слишком короткое слово
• 77 = соответствующего слова не найдено
В использованной логике эти коды будут интерпретироваться как ключевые слова «5», «6» и «7» соответственно. Для решения проблемы существуют два пути. Первый способ использует специальную логическую схему (см. рис. 7.5), которая выдает сигнал высокого уровня при появлении цифр 5, 6 или 7 в старшем разряде, который является сигналом блокировки. Такая схема выдает сигнал высокого уровня на линию при появлении цифр 5,6 или 7, который интерпретируется интерфейсом как сигнал запрета. Другой путь решения проблемы предполагает использование PIC микроконтроллера для чтения 8-разрядного кода с выхода УРР. Любое значение более 40 будет интерпретироваться как ошибка и соответственно игнорироваться. Мы не приводим здесь схемы интерфейса для PIC микроконтроллера, поскольку для любого, умеющего работать с PICBASIC программатором и PIC ИС (см. гл. 6), это не составит большого труда. В гл. 15 мы используем встроенный PIC в схеме УРР, используемого в устройстве управления рукой робота.
Рис. 7.5. Детектор ошибки на основе состояния старшего полубайта BCD
8-битный код на выходе ИС 74LS373 является кодом с фиксацией состояния. Этот код не представляет собой обычный байт (8 двоичных разрядов), но является двумя 4-битными двоично-десятичными кодами (полубайт). В таблице 7.1 приведено соответствие между двоично-десятичным кодом и стандартным двоичным числом.
Как вы можете заметить, до числа 10 двоичный и двоично-десятичный коды совпадают. На числе 10 в двоично-десятичном коде единица «перепрыгивает» в старший полубайт, а младший полубайт обнуляется. В простом двоичном коде подобная операция (перенесение единицы в старший полубайт и обнуление младшего) осуществляется на числе 16. Если вход компьютера настроен на чтение двоичных чисел, то при подаче двоично-десятичного кода возникнут ошибки.
Таблица 7.1Проект 2: Схема интерфейса
Основой схемы интерфейса является дешифратор 4028. ИС 4028 считывает двоично-десятичный код логики низкого уровня с выхода ИС 74LS373, расположенной на плате УРР, и выдает соответствующие сигналы высокого уровня (см. таблицу соответствий 7.2).
Принципиальная схема интерфейса изображена на рис. 7.6. Входы A,B,C, и D ИС 4028 подключены к нижнему полубайту двоично-десятичного кода ИС 74LS373. Когда я разобрал радиоуправляемую модель автомобиля, то обнаружил несколько проводов, которые при подаче питающего напряжения обеспечивают основные функции движения. Робот-автомобиль имеет четыре режима движения: движение вперед, поворот направо, поворот налево и задний ход.
Рис. 7.6. Схема интерфейса переделанной модели автомобиля
Каждый режим движения обеспечивается соответствующим включением двигателя или комбинации двигатель-соленоид. Управление включением может осуществляться с помощью NPN транзистора. К выходам ИС 4028, обозначенным Q1-Q4, подключены четыре транзистора, которые осуществляют необходимое управление.
Для наглядности иллюстрации на рис. 7.6 показан только один NPN транзистор, соединенный с выходом Q1 и управляющий работой двигателя. Модель радиоуправляемого автомобиля, которую я использовал, уже снята с производства. Тем не менее подойдет любая недорогая модель подобного радиоуправляемого автомобиля, поскольку они работают аналогично. Снимите схему радиоуправления с автомобиля. Останется провод управления работой двигателя, который для запуска двигателя должен быть соединен с источником питания или с землей. Повороты автомобиля обычно осуществляются недорогими соленоидами. Проверьте провода поворотных соленоидов для определения типа управления (подача напряжения питания или заземление).
Ручные станции Walkie-talkie
У компании Radio Shack имеется в продаже большой ассортимент недорогих ручных станций Walkie-talkie. Поскольку для нормальной работы УРР расстояние до микрофона не должно превышать 30 см, использование пары ручных станций Walkie-talkie позволит значительно увеличить радиус управления роботом-платформой, использующей УРР. Выход громкоговорителя станции соединен с выводом 46 ИС HM2007 через разделительный конденсатор С1, который блокирует протекание постоянного тока от станции.
Акустическая связь
Если вы не хотите разбирать станцию и спаивать проводниками УРР и Walkie-talkie непосредственно, то можете попробовать использовать акустическую связь.
Для этой цели вы должны скрепить микрофон из набора УРР и громкоговоритель станции. Для уменьшения влияния посторонних шумов необходимо поместить микрофон и громкоговоритель в отдельную коробку.
«Обучение» и управление роботом-передвижкой
При использовании Walkie-talkie процесс «обучения» командным словам УРР, установленного на передвижной платформе, необходимо осуществлять также с использованием Walkie-talkie. Подключение интерфейса не нарушает работы бортового цифрового индикатора, поэтому он может быть использован для проверки точности распознавания записанных команд. Определите радиус действия станций Walkie-talkie. Не допускайте перемещений платформы за границы этого радиуса, в противном случае вы будете бежать за платформой, выкрикивая «стоп, стоп!» в микрофон станции. Управление роботом напоминает просто процесс общения и производит сильное впечатление.
Новые возможности платы УРР
Робот-платформа, управляемый голосом, изображен на рис. 7.7. Плата управления немного отличается от изображенной на рис. 7.4. Причиной этого является то, что мне удалось достать прототип последней версии набора УРР.
Рис. 7.7. Модель автомобиля с голосовым управлением
Последняя версия упрощает построение интерфейса для УРР. Для удобства соединения в плате имеются 9 монтажных пистонов (8 отверстий под 2 полубайта двоично-десятичного кода и отверстие под землю), которые соединены с выходом ИС 74LS373, расположенной на плате. Старший полубайт выхода 74LS373 управляет работой ИС 4028. Запускающий сигнал можно снимать с выводов красного светодиода.
В дополнение к изменениям схемы интерфейса на плате имеется вход 3. В для обновления памяти. Такое включение делает статическую ОП энергонезависимой. Иными словами, вы можете подавать или снимать питание с платы без потери информации о ключевых словах, записанной в ОП. В оригинальной версии выключение питания приводило к потере информации, записанной в ОП.
Проект 3: общая схема интерфейса УРР
Интерфейс УРР для робота-передвижки является специализированной схемой, предназначенной для конкретной цели. Следующая схема интерфейса (см. рис. 7.8) представляет собой более универсальное устройство, дающее возможность управлять целым набором устройств, таких как роботы, электрические схемы и приборы.
Рис. 7.8. Общая схема интерфейса для УРР
Для того чтобы сильно не усложнять схему и в то же время повысить надежность и точность распознавания системы УРР, мы снова ограничимся списком из 10 управляющих команд. Если вы хотите расширить этот список до полных 40 команд, то можете спроектировать интерфейс на основе идей, изложенных в этой главе. Использование 10 ключей управления позволяет нам использовать для каждого ключа 4 возможных варианта распознавания, как мы уже делали выше. Каждый из четырех вариантов распознавания, связанный с ключевым словом, позволяет запоминать различные варианты произнесения ключевого слова. Понятно, что четыре варианта произношения для каждого ключевого управляющего слова позволят повысить надежность и точность распознавания УРР.
Мы будем нумеровать места команд, как мы это делали выше, поэтому все места, соответствующие одному и тому же ключевому слову, будут иметь соответственно одинаковый младший десятичный разряд. Принцип записи будет ясен из примера.
Предположим, что мы проектируем электрическое кресло-каталку с голосовым управлением. Для управления движением кресла мы будем использовать следующий список команд:
• Вперед
• Назад
• Направо
• Налево
• Стоп
• Выключить
• Включить
• Блокировать
• Разблокировать
• Стоп (Команда «стоп» является жизненно важной, поэтому требует дублирования)
Первой командой для обучения распознавания УРР является «вперед». Мы будем использовать номера ячеек 10, 20, 30 и 40. При исключении старшего десятичного разряда в каждом номере мы получим одинаковое значение младшего десятичного разряда, равное 0. Точно так же команда «назад» записывается в ячейки 01, 11, 21 и 31. После исключения старшего десятичного разряда мы получим номер команды равный 1.
Интерфейс должен опознавать коды ошибок и не смешивать их с командами под номерами 5, 6 и 7. Для этого используется схема, состоящая из двух ИС И-НЕ типа 4011, включенных по схеме логических И и ИЛИ (как показано на рис. 7.8), которая обнаруживает коды ошибок 55, 66 и 77.
Соединение с платой УРР
Плата УРР имеет 9 отверстий под пайку, соединяющих ИС 74LS373 и 7448 для подключения схемы интерфейса (см. рис. 7.8). Восемь шин представляют 2 четырехбитных двоично-десятичных кода, девятая шина – земляная. Имеется контактная площадка красного светодиода. К этой площадке припаивается проводник, который является запускающим входом платы интерфейса.
Принцип работы устройства
Прежде всего интерфейс должен реагировать на любое слово, воспринятое УРР. Когда УРР «слышит» слово, оно пытается его распознать, что вызывает немедленное мигание светодиода.
Ток через светодиод используется для запуска интерфейса (реакция на слово). Для формирования импульса запуска используется компаратор, подключенный к катоду светодиода. Опорное напряжение составляет 3,64 В и формируется резистивным делителем 5,6 кОм и 15 кОм.
Выход компаратора имеет нормально высокий уровень. При поступлении импульса амплитудой 4,5 В с катода светодиода, на выходе компаратора формируется отрицательный импульс запуска. В качестве компаратора использован ОУ типа 741.
Процесс распознавания речи занимает до 300 мс. Во время этой задержки состояние двоично-десятичных выходов сохраняется неизменным. Если интерфейс работает слишком быстро, то он завершит обновление информации на выходе до появления входной информации, содержащейся в двоично-десятичных кодах.
Для предотвращения этого явления мы обеспечиваем задержку отрицательного импульса запуска, используя две ИС таймеров типа 555 (или одну ИС типа 556), включенных по схеме одновибратора. Отрицательный импульс с выхода компаратора запускает первый одновибратор, который выдает импульс длиной 470 мс, подаваемый на вход второго одновибратора. Второй одновибратор генерирует импульс длиной 220 мс.
Импульс длиной 470 мс предоставляет более чем достаточно времени для обновления выходов двоично-десятичного кода. Задний отрицательный фронт этого импульса запускает второй одновибратор, который выдает положительный импульс продолжительностью 220 мс. В это время происходит обновление выходов интерфейса при условии, что детектор кодов ошибок имеет высокий логический уровень на выходе.
Выход второго одновибратора (импульс 220 мс) соединен с одним из входов логического элемента И. Другой вход соединен с двумя другими логическими элементами (ИЛИ-НЕ и ИЛИ), которые образуют детектор кодов ошибок. Детектор кода ошибок соединен со старшим полубайтом двоично-десятичного кода. При наличии кода, соответствующего цифрам 5, 6 или 7 на входе детектора, он выдает низкий логический уровень на выходе. Для остальных цифр детектор имеет высокий выходной уровень. В этом случае позитивный импульс с выхода второго одновибратора запускает интерфейс для принятия младшего полубайта двоично-десятичного кода.
Высокий логический уровень на выходе детектора кода ошибок в комбинации с положительным импульсом с выхода второго одновибратора вызывает появление высокого уровня на выходе логического элемента И, что разблокирует ИС 74LS373. Когда ИС 74LS373 разблокирована, то код, содержащийся в младшем полубайте двоично-десятичного кода, поступает с ИС и записывается в ней. Четыре выхода ИС 74LS373 соединены с входами двоично-десятичного дешифратора 4028.
С другой стороны, если на выходе детектора кода ошибок присутствует сигнал низкого уровня, что происходит при наличии цифр 5, 6 или 7 в старшем разряде, то соответствующий выход элемента И имеет низкий уровень. В этом случае, при наличии положительного импульса от второго одновибратора на втором выводе логического элемента И, его выход по-прежнему имеет логически низкий уровень, тем самым ИС 74S373 блокируется, и информация младшего разряда не поступает на дешифратор 4028.
Таким путем, детектор кода ошибок отделяет числа 55, 66 и 77 от команд под номерами 5, 6 и 7.
При прохождении двоично-десятичного кода через ИС 74LS373, он поступает на вход дешифратора 4028. Дешифратор считывает данный код и выдает сигнал высокого уровня на соответствующей шине выхода (с номерами от 0 до 9).
Усовершенствование выхода интерфейса
Выходы высокого логического уровня ИС 4028 можно использовать для управления нагрузками переменного и постоянного тока. Однако лучшим вариантом является подключение выходов 4028 к триггерам. Дело в том, что в конкретный момент на выходе ИС 4028 присутствует единственный сигнал высокого уровня. По этой причине если в какой-то момент один из выходов включается, то сигнал на выходе, задействованном до того, пропадает, что представляет определенное неудобство. Наличие триггера позволяет решить эту проблему. При первом включении на выходе триггера появится сигнал высокого уровня, который сохранится до подачи на него следующего импульса. Такая схема позволит осуществлять двойное управление (включение и выключение) с помощью одной команды.
Первоначально имеется возможность активировать любое количество выходов без риска сброса уже включенных. Затем та же самая команда может быть использована для включения нагрузки (при первом произнесении) и затем ее выключения (при следующем произнесении). Таким образом, вместо использования пары команд для включения/выключения устройства (например: включить свет/выключить свет) возможно использование единственной команды, которая в «четный» раз выключает устройство (свет-свет). В некоторых случаях это позволяет удвоить список допустимых команд.
На рис. 7.9 показана схема триггера на ИС 4013. Каждая ИС содержит два триггера. Входы триггеров соединены непосредственно с выходами ИС 4028.
Рис. 7.9. Половина триггера 4013 для запоминания сигнала. Соединяется непосредственно с выходом ИС 4028, изображенной на рис. 7.8, и предназначена для сохранения включенного состояния схемы при включении следующей команды
На рис. 7.10 изображена одна схема и два фрагмента схем присоединения к выходу триггера для управления нагрузками различных типов. На части А изображен Дарлингтоновский NPN транзистор, управляющий резистивной нагрузкой в цепи постоянного тока. Подобная схема может быть использована для управления электромагнитным реле, как показано в В. Реле, соответственно, может управлять цепями постоянного или переменного тока. В части С выход 4013 соединен с оптопарой, управляющей симистором.
Рис. 7.10. Данные схемы могут быть подключены к интерфейсу, чтобы обеспечить управление схем с помощью УРР. В схеме на позиции А в качестве ключа используется триггер, управляющий Darlington транзистором. В позиции В транзистор заменен реле, что позволяет управлять сильноточными резистивными или индуктивными нагрузками постоянного и переменного тока. Схема на позиции С, объединенная с триггером позиции А позволяет осуществить гальваническую развязку между силовыми и управляющими цепями, управляя при этом включением нагрузки переменного тока
Работа устройства
Схема УРР первоначально «обучается», как описано выше. После соеди нения с интерфейсом, любая команда вызовет свечение светодиода или какую-то реакцию устройства в зависимости от того, что присоединено к вы ходам двоично-десятичного дешифратора 4028.
Улучшение процесса распознавания
Существует набор приемов для улучшения и оптимизации процесса распознавания. Прежде всего это выбор слов-команд. Избегайте омонимов и сходно звучащих слов, например, таких как спать, брать, встать, класть. Для оптимизации распознавания используйте максимально различные по звучанию слова. Во многих случаях полезно использовать синонимы или слова, имеющие приблизительно тот же смысл. Например, вместо слова «спать» используйте «дремать» или «уснуть». Вместо «брать» используйте «захватить» или «поднять». Вместо «встать» – «подняться». Слово «класть» можно заменить на «положить». Небольшие филологические изыскания помогут справиться с этой проблемой.
Настройка и сопряжение оборудования
Расстояние. Расстояние ото рта говорящего до микрофона должно быть одинаковым при «обучении» системы и ее эксплуатации.
Стресс. Под действием стрессового состояния или волнения голос изменяется. Например, если вы используете джойстик с голосовым управлением для контроля полета вашего любимого тренажера военного самолета, то в момент жаркого воздушного боя ваш голос, выкрикивающий команды «Огонь! Огонь! Крен влево!», будет немного отличаться от голоса в ситуации, когда вы спокойно сидите за столом и программируете УРР. По этой причине во время процесса программирования звуковых команд вы должны имитировать состояние стресса или возбуждения, которое вы чувствуете во время игры.
Напряженное усилие. Физический стресс является еще одним фактором. Когда вы программируете тренажерное оборудование (беговую дорожку или велосипедный тренажер) для управления голосом, вы должны подражать людям с немного сбитым дыханием.
Окружающий шум. Окружающие шумы всегда представляют собой проблему. Как было отмечено выше, постоянный шум (например, от кондиционера) оказывает меньшее влияние, чем шум, носящий случайный характер (работающий телевизор).
Рука робота, управляемая УРР
В гл. 15 будет рассмотрен еще один вариант интерфейса, управляющий рукой робота.
Список деталей для УРР
• (1) ИС1 HM2007
• (1) ИС2 SRAM 8K x 8
• (1) ИС3 74LS373
• (2) ИС4 и ИС5 7448
• (1) резонатор кварцевый 3,57 МГц
• (1) печатная плата УРР
• (1) клавиатура 12-кнопочная
• (2) индикатор 7 сегментов
• (2) сборка резисторов 220 Ом, 0,25 Вт, 16 выводов
• (1) резистор 22 кОм 0,25 Вт
• (1) резистор 5,6 кОм 0,25 Вт
• (1) конденсатор 0,047 мкФ
• (1) С2 конденсатор 100 мкФ 16 В
• (1) С5 конденсатор 0,1 мкФ
• (1) регулятор напряжения 7805
• (1) микрофон
• (1) зажим батареи 9 В
• полный набор деталей УРР
Список деталей интерфейса
• (2) ИС 4011 2 элемента ИЛИ-НЕ
• (1) ИС 74LS373 8 D триггеров
• (1) ИС 4028 двоично-десятичный дешифратор
• (1) ИС таймер 555
• (1) ОУ LM741
• (1) резистор 5,6 кОм
• (1) резистор 15 кОм
• (1) резистор 330 Ом
• (2) резистор 10 кОм
• (10) резистор 470 Ом
• (1) конденсатор 47 мкФ
• (1) конденсатор 22 мкФ
• (2) конденсатор 0,01 мкФ
• (10) светодиод миниатюрный
• Дополнительно: ИС 4013 2 D-триггера, транзистор TIP 120 NPN Darlington
В общем, мой друг ты одолел чтение этой статьи об передвижной робот с голосовым управлением. Работы впереди у тебя будет много. Смело пиши комментарии, развивайся и счастье окажется в твоих руках. Надеюсь, что теперь ты понял что такое передвижной робот с голосовым управлением и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Робототехника
Комментарии
Оставить комментарий
Робототехника
Термины: Робототехника