Вам бонус- начислено 1 монета за дневную активность. Сейчас у вас 1 монета

3.Характеристика основных задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

Лекция



Привет, Вы узнаете о том , что такое характеристика основных задач решаемых при построении речевого интерфейса динамический диапазон звуковых сигналов , Разберем основные их виды и особенности использования. Еще будет много подробных примеров и описаний. Для того чтобы лучше понимать что такое характеристика основных задач решаемых при построении речевого интерфейса динамический диапазон звуковых сигналов , настоятельно рекомендую прочитать все из категории Методы и средства компьютерных информационных технологий.

3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

Речевой интерфейс является аппаратно-программным комплексом, так как для его реализации требуется использование внешних (дополнительных) по отношению к компьютерной системе аппаратных средств (микрофон и средства вывода звука, например, наушники, а также звуковая

плата). Это обстоятельство накладывает дополнительные требования не только на уровне разработки компьютерных программ, обеспечивающих компьютер способностью говорить и слышать, но и на аппаратном уровне, от которого зависит, в частности, качество воспроизведения звука, оперативность обработки информации и др

К основным классам задач речевого интерфейса следует отнести:

• синтез речи – эта задача включает в себя комплекс подзадач и заключается в обеспечении возможности произнесение речи компьютером на основе произвольного орфографического текста;

• анализ и распознавание речи – комплекс задач, включающих запись, оцифровку и анализ речи для распознавания полученного речевого сообщения компьютерной системой;

• понимание (интерпретация) речи – это комплекс задач, связанных с анализом смысла речевых сообщений и формированием реакции (ответа) компьютерной системы. Часто указанная задача

является подзадачей задачи распознавания речи;

• распознавание голоса – комплекс задач, включающих анализ особенностей голоса говорящего с целью выявления каких-либо его индивидуальных (личностных) особенностей и качеств. Данный комплекс задач называют также верификацией и идентификацией речи;

• компьютерное клонирование голоса и дикции [4] (Лобанов Б.М.2002ст-Комп_К_П_Г) – это создание близкой копии, но не биологической, а компьютерной, и не всего существа в целом (в данном случае человека), а только одной из его интеллектуальных функций: чтение произвольного

орфографического текста. При этом ставится задача максимально полного сохранения

персональных акустических особенностей голоса, фонетических особенностей произношения и

акцента, а также просодической (интонационной) индивидуальности речи (мелодика, ритмика,

динамика).

Помимо перечисленных выше задач, входящих в группу задач разработки собственно речевого

интерфейса, следует также отметить, что имеется ряд вспомогательных задач, решением которых

занимаются научно-технические коллективы, разрабатывающие речевые системы. Об этом говорит сайт https://intellect.icu . Это связано с тем,

что задача реализации речевого интерфейса до сих пор не решена окончательно. Еще есть много

вопросов, ответы на которые ищут многие научные коллективы как в нашей стране, так и за рубежом. К

таким задачам, в частности, относятся следующие:

• исследование особенностей фонетического строения речи различных естественных языков; исследование особенностей интонационной окраски речи различных языков;

• выявление наборов параметров для описания речи, используемых как для синтеза речи, так и для ее распознавания;

• разработка новых методов синтеза речи;

• исследование различий речи разных дикторов и, в частности, мужского и женского голоса;

• разработка новых методов распознавания речи;

• поиск оптимальных путей передачи речи по каналам связи;

• разработка специальных шумоподавляющих микрофонов;

• разработка специальной аппаратуры для исследования характеристик речи;

• разработка новых методов оцифровки и оптимального сжатия речевого сигнала;

• разработка специальных звуковых карт, ориентированных на синтез и анализ речи;

• формирование баз данных с «образцами» речи различных дикторов с целью повышения естественности звучания синтезированной речи;

• исследование строения речевого тракта человека и особенностей образования звуков речи;

• исследование строения органов слуха человека;

• исследование особенностей восприятия речи человеком;

• поиск путей оптимального использования речевого интерфейса в различных технических и бытовых системах и разработка соответствующих технологий и др.

 

Динамический диапазон звуковых сигналов

Человек слышит звук в чрезвычайно широком диапазоне звуковых давлений. Этот диапазон простирается от абсолютного порога слышимости до болевого порога 140 дБ SPL относительно нулевого уровня, за который принято давление 0,00002 Па (рис.1.). Зона риска на этом рисунке обозначает область звуковых давлений, которые при длительном воздействии могут привести к полной потери слуха. Болевой порог для тональных звуков зависит от частоты, для звуков с произвольным спектром за болевой порог принят уровень давления 120 дБ SPL. График абсолютного порога слышимости достаточно точно описывается эмпирическим равенством
3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

 

В тишине чувствительность слуха человека повышается, а в атмосфере громких звуков – понижается, слух адаптируется к окружающей звуковой среде, поэтому динамический диапазон слуха не такой большой – около 70..80 дБ. Сверху он ограничен давлением 100 дБ SPL, а снизу шумом с уровнем -30…35 дБ SPL. Этот динамический диапазон может сдвигаться вверх и вниз до 20 дБ. Для комфортного восприятия музыки рекомендуется, чтобы звуковое давление не превышало 104 дБ SPL в домашних условиях и 112 дБ SPL, в специально оборудованных помещениях. Динамический диапазон музыки определяется отношением в децибелах самого громкого звука (фортиссимо) и самого тихого звука (пианиссимо). Динамический диапазон симфонической музыки составляет 65…75 дБ, а на концертах рок-музыки он возрастает

3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

до 105 дБ, при этом пики звуковых давлений могут достигать 122…130 дБ SPL. Динамический диапазон вокальных исполнителей - не превышает 35…45 дБ (табл.1). Динамический диапазон музыки существенно зависит от выбора максимального звукового давления Pmax , так как он ограничивается снизу абсолютным порогом слышимости. Эта зависимость наиболее сильно выражена на краях звукового диапазона. На рис. 2 приведены примеры изменения динамического диапазона тональных звуков. В зависимости от выбора Pmax и частоты тональных звуков динамический диапазон звука 80 дБ уменьшается на краях звукового диапазона до 40 – 50 дБ. Именно поэтому принято измерять динамический диапазон звуков на частоте 1 кГц, на которой он может достигать 117 дБ. Шум помещения маскирует звук и этим уменьшает его динамический диапазон музыки снизу. На рис.3. показано как при уменьшении звукового давления от 120 до 80 дб SPL динамический диапазон музыки из-за шума помещения уменьшается с 90 до 50 дБ.

         Влиянием шума можно полностью пренебречь только при условии, что его уровень на 10…20 дБ SPL ниже минимального уровня музыкальных звуков. В студиях звукозаписи уровень шума не превышает 20…30 дБ SPL, ночью в квартирах «тихих» домов этот уровень равен 40 дБ SPL, любой разговор увеличивает уровень шума до 60дБ SPL. Именно поэтому тихая музыка часто тонет в шумах помещения прослушивания и невольно возникает желание увеличить громкость. Шум квантования, являющийся белым шумом, заметен на слух при его интенсивности всего 4 дБ SPL, даже когда общий шум аудио аппаратуры в помещении достигает 50 дБ SPL. Эти цифры необходимо сопоставить с тем, что полной шкале FS цифрового измерителя уровня соответствуют уровень между 105 и 112 дБ SPL. Поэтому для бытовых помещений динамический диапазон музыки не должен превышать 101 - 108 дБ.

3.Характеристика основных  задач, решаемых при построении речевого интерфейса. Динамический диапазон звуковых сигналов.

В заключение, эта статья об характеристика основных задач решаемых при построении речевого интерфейса динамический диапазон звуковых сигналов подчеркивает важность того что вы тут, расширяете ваше сознание, знания, навыки и умения. Надеюсь, что теперь ты понял что такое характеристика основных задач решаемых при построении речевого интерфейса динамический диапазон звуковых сигналов и для чего все это нужно, а если не понял, или есть замечания, то не стесняйся, пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Методы и средства компьютерных информационных технологий

Из статьи мы узнали кратко, но содержательно про характеристика основных задач решаемых при построении речевого интерфейса динамический диапазон звуковых сигналов
создано: 2016-02-26
обновлено: 2021-03-13
315



Рейтиг 9 of 10. count vote: 2
Вы довольны ?:


Поделиться:

Найди готовое или заработай

С нашими удобными сервисами без комиссии*

Как это работает? | Узнать цену?

Найти исполнителя
$0 / весь год.
  • У вас есть задание, но нет времени его делать
  • Вы хотите найти профессионала для выплнения задания
  • Возможно примерение функции гаранта на сделку
  • Приорететная поддержка
  • идеально подходит для студентов, у которых нет времени для решения заданий
Готовое решение
$0 / весь год.
  • Вы можите продать(исполнителем) или купить(заказчиком) готовое решение
  • Вам предоставят готовое решение
  • Будет предоставлено в минимальные сроки т.к. задание уже готовое
  • Вы получите базовую гарантию 8 дней
  • Вы можете заработать на материалах
  • подходит как для студентов так и для преподавателей
Я исполнитель
$0 / весь год.
  • Вы профессионал своего дела
  • У вас есть опыт и желание зарабатывать
  • Вы хотите помочь в решении задач или написании работ
  • Возможно примерение функции гаранта на сделку
  • подходит для опытных студентов так и для преподавателей

Комментарии


Оставить комментарий
Если у вас есть какое-либо предложение, идея, благодарность или комментарий, не стесняйтесь писать. Мы очень ценим отзывы и рады услышать ваше мнение.
To reply

Методы и средства компьютерных информационных технологий

Термины: Методы и средства компьютерных информационных технологий