4. Моделирование речи
4. Моделирование речи
Искусственная речь и связанные с ней проблемы
Говорящие машины уже существуют. Словарь их пока небольшой и состоит из слов, произнесённых человеком и записанных на магнитный барабан. Наиболее известный тому пример – говорящие часы, работающие на многих телефонных станциях.
Машины, использующие предварительно записанную речь, довольно дёшевы и очень удобны, если число сообщений невелико, но непригодны, если требуется обычная непрерывная речь. Одна из причин состоит в том, что с возрастанием числа хранимых слов хранилище записанных слов становится слишком большим и дорогим. Другой причиной является то, что в разговорной речи одно и то же слово может участвовать в предложениях разного типа, с различными ударениями, интонациями и несколькими вариантами произношения. Поэтому невыгодно использовать непосредственную запись речи для говорящих машин более общего типа. Выгоднее машины, в некотором смысле моделирующие работу голосовой системы человека. Машины, которые не воспроизводят ранее записанную речь, а синтезируют её, называют «синтезаторами речи».
История синтезаторов речи очень стара. Наиболее ранние были непосредственными копиями человеческого речевого аппарата и использовали воздуходувные меха, язычки и резонаторы. Управляли этими машинами, как правило, вручную, с помощью набора рычагов. Одна из таких машин была построена Вольфгангом фон Кемпелиа в конце XVIII века. Известно, что она очень хорошо имитировала речь, хотя не совсем правильно воспроизводила некоторые звуки. В 1920 году акустическая модель Р. Пэджета произносила целые фразы, например: «Алло, Лондон, вы слушаете?» или «О, Лейла, я люблю Вас!». Для этого автору приходилось руками очень искусно изменять форму резонирующей полости машины.
При дальнейшем моделировании оказалось (как часто бывает при моделировании функций человеческого организма), что воспроизведение человеческой речи исключительно сложно. Развитие говорящих машин стало действительно возможным только с появлением современной электронной техники, которая позволяет достигнуть необходимого уровня сложности.
Убедиться в сложности речевых сигналов позволяют спектрографы или анализаторы спектра. Простейшим прибором для частотного анализа является резонансный частотомер, содержащий ряд упругих стальных пластин с различной частотой собственных колебаний. При подаче на электромагнит этого прибора сигналов речи поле электромагнита возбуждает только ту пластину, собственная частота которой совпадает с частотой исследуемого сигнала.
На рис. 23 показан получающийся таким способом частотно – временной спектр звука сирены с постепенно повышающейся частотой, а на рис. 24 – спектр звука отдельного слова, произнесённого человеком. Как видно из рисунков, звуковые колебания, образующие речь (в отличие от речи автомата – сирены), содержат много составляющих, которые в сумме создают сложную звуковую картину. К сожалению, эти картины очень отличаются не только у различных дикторов, но даже у одного и того же человека в разное время.
Рис. 23. Спектр звука сирены Рис. 24. Спектр слова, произнесённого человеком
Взгляните на шесть контурных диаграмм английского слова «You» (рис. 25) – и вы убедитесь в этом.
Рис. 25. Контурные диаграммы английского слова «You»
Диаграммы получены от пяти различных людей, только нижние две диаграммы – от одного человека (на диаграммах контурные линии отображают различную интенсивность звучания).
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ «МАЛЕНЬКИХ ЧЕЛОВЕЧКОВ»
МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ «МАЛЕНЬКИХ ЧЕЛОВЕЧКОВ» С каждой новой модификацией детерминированность шагов АРИЗ возрастает. Усиливается и информационное обеспечение. Тем не менее АРИЗ не отменяет необходимости думать, он лишь управляет процессом мышления, предохраняя от
3.8. Моделирование
3.8. Моделирование До сих пор, говоря об ассоциациях представлений, мы полностью игнорировали их динамический, временной аспект, т. е. рассматривали связываемые представления как статические и не имеющие никакой координаты во времени. Между тем идея времени может активно
Проектирование и моделирование
Проектирование и моделирование Роботы оказались способны к выполнению не только циклических операций. Компании – производители широко используют системы компьютерного проектирования (computer aided design CAD), управляемого компьютерного производства (computer aided manufacturing CAM) и
Распознавание речи
Распознавание речи Диапазон слышимости человеческого уха лежит в пределах от 10 до 15.000 Гц. Для регистрации звуковых колебаний могут использоваться микрофоны и усилители, причем диапазон «слышимости» микрофона, как правило, превышает возможности уха. Для робототехники
Проект 1: Программируемая схема распознавания речи
Проект 1: Программируемая схема распознавания речи Первым проектом является создание программируемой схемы распозна-, -т вания речи. Термин «программируемый» используется в том смысле, что вы T"7V можете запрограммировать устройство для распознавания 40 отдельных слов по
Обучение процессу восприятия речи
Обучение процессу восприятия речи Мы принимаем собственные способности к распознаванию речи как нечто само собой разумеющееся. Однако процесс выделения речи одного человека в толпе собравшихся на вечеринке лежит далеко за пределами возможностей современных систем
Распознавание речи в зависимости и независимо от говорящего
Распознавание речи в зависимости и независимо от говорящего В процессе распознавания речи можно выделить две задачи: распознавание речи для конкретного говорящего и независимо от него. Система распознавания речи «обучается» речью конкретного человека, который будет в
Виды распознавания речи
Виды распознавания речи Системы УРР имеют еще одно специфическое ограничение, которое относится к виду или стилю распознаваемой речи. Предполагается существование трех видов речи: раздельная, связная и непрерывная.Раздельная речьСистемы УРР, оперирующие с раздельной
Список деталей для интерфейса распознавания речи
Список деталей для интерфейса распознавания речи • (5) Транзистор NPN TIP 120• (5) Транзистор PNP TIP 125• (1) ИС 74154 4/16 – декодер• (1) ИС 4011 логический элемент ИЛИ-НЕ• (1) ИС 4049 – 6 буферов• (1) ИС 741 операционный усилитель• (1) Резистор 5,6 кОм, 0,25 Вт• (1) Резистор 15 кОм, 0,25 Вт• (1) Головная
Модель и моделирование
Модель и моделирование Современные научно – технические исследования и промышленное строительство ведутся с огромным размахом, и на них затрачивается много средств (вспомним хотя бы о космических исследованиях). Поэтому ошибки или просчёты могут привести к
Моделирование радиоэлектронных устройств из радиокубиков
Моделирование радиоэлектронных устройств из радиокубиков Радиокубики – это небольшие пластмассовые коробки, в которые вмонтированы различные радиодетали и магниты, притягивающие кубики один к другому и соединяющие их в единое работающее устройство (рис. 10). На каждом
Простейшие устройства речи роботов
Простейшие устройства речи роботов Каждому ясно, что проще всего сделать говорящую модель, если в неё установить магнитофон. В отдельных случаях это решение подходит. Но в таком варианте больше механики, чем электроники, а сейчас электронные синтезаторы речи и вокодеры
Моделирование речи автоматов
Моделирование речи автоматов Как мы уже видели из рис. 23, спектр речи автомата – сирены значительно проще речи человека. Чтобы получить сигнал сирены, нужно сформировать звуковой сигнал, частота которого периодически изменялась бы по пилообразному
5. Моделирование слуха
5. Моделирование слуха Бионика и слух Исключительное значение для роботостроения имеет совершенствование технических приборов, воспринимающих звуковые сигналы. Звук быстро позволяет передавать командные и управляющие сигналы. Разработка новых систем слуха, пригодных
Моделирование систем слуха
Моделирование систем слуха Прежде чем приступить к конструированию устройства слуха роботов, смоделируем отдельные элементы этих систем.На рис. 34 – 37 показаны схемы усилителей звуковой частоты.Начинать конструирование моделей слуховых систем лучше всего с
6. Моделирование зрения
6. Моделирование зрения Специалисты в области бионики ведут работы по моделированию некоторых функций человеческого глаза. Создана электронная модель сетчатки, воспроизводящая работу фоторецепторов в центральной ямке и на периферии, предложено устройство, аналогичное