5. Моделирование слуха
5. Моделирование слуха
Бионика и слух
Исключительное значение для роботостроения имеет совершенствование технических приборов, воспринимающих звуковые сигналы. Звук быстро позволяет передавать командные и управляющие сигналы. Разработка новых систем слуха, пригодных для роботов, также основана на бионических исследованиях.
Способность человеческого мозга разбираться с помощью слухового аппарата в хаосе звуков является одним из его самых чудесных свойств. «Наивысшим и совершеннейшим человеческим приспособлением» назвал звуковую речь человека выдающийся русский физиолог И. П. Павлов. Физическая природа звуковой речи хранит в себе множество тайн. Как образуются звуки в голосовом аппарате человека, как они воспринимаются слухом и от чего зависит характер звука – вот проблемы, которые ещё по сей день занимают интересы учёных, работающих в самых разнообразных областях науки. Чтобы машины могли безошибочно выделять какой – то один образ из множества других сходных, нужно точное знание его признаков. Но как выбрать такие признаки? Над решением этой задачи во всём мире работают физиологи, специалисты по бионике, психологии и инженеры, математики и конструкторы. Если фотоэлемент можно назвать грубой моделью органа зрения, то микрофон напоминает органы слуха в гораздо меньшей степени.
Учёные-бионики, преодолевая трудности, пытаются разгадать секреты слуха человека. К таким секретам относится, например, способность выделять нужный голос среди шума и десятков других голосов. Задача сложная, но нельзя отказываться от неё только потому, что она трудна.
Речь состоит из слогов, слов, фраз и т.д. Элементарной частью речи является звук (фонема). С физической точки зрения звуки речи различают по частоте, громкости и продолжительности. В речи нет чётких границ между звуками. Одни специалисты пытаются распознавать речь по фонемам, другие считают, что для этого следует использовать форманты частоты, присущие звучанию каждой буквы, произносимой человеком. Примером удачного решения задачи является фонетическая пишущая машинка, созданная учёными Г. Олсоном и Г. Беларом.
Устройство можно рассматривать как сложный аналог слухового аппарата, части мозга, нервной системы и нервно-мышечного аппарата человека, печатающего под диктовку. Бионическая схема человека, печатающего под диктовку, и схема фонетической пишущей машинки показаны на рис. 33. Чтобы понять принцип работы устройства, проследим, как перерабатывается звуковая информация по пути её следования.
Звуковая энергия улавливается наружным ухом человека, передаётся по слуховому проходу и воздействует на барабанную перепонку среднего уха. Механическое движение перепонки передаётся жидкости, которая заполняет улитку (внутреннее ухо), при помощи слуховых косточек, перемещающихся нелинейно. При этом происходит компрессия сигнала, т.е. более громкие звуки уменьшаются сильнее, чем тихие.
На рис. 33 показаны схематическое изображение «развёрнутой» улитки и частоты, воспринимаемые pa зличными её участками. Здесь происходит первичный анализ информации. Окончательно её анализирует мозг, куда сигналы поступают по слуховому нерву. На основе результатов этого анализа мозг вырабатывает команды, посылаемые мышцам руки, нажимающей на соответствующие клавиши пишущей машинки.
В машине, распознающей речь, голос оператора воспринимает микрофон и преобразует в электрические колебания.
После усиления и компрессии речевой сигнал поступает на анализатор частот – блок из восьми полосовых фильтров, охватывающих диапазон 250… 10000 Гц, и систему детекторов сравнения амплитуд. Последняя собрана так, что реле, соответствующее данному каналу, включается, лишь когда уровень в этом канале больше среднего в двух соседних.
Речь опознается по группе фонем, составляющих слог, а не по отдельным фонемам (так как распознать многие фонемы вне контекста очень трудно). В слоговой памяти хранятся комбинации сигналов, соответствующие различным произношениям одного и того же слога или слова. Распознавание слога представляет собой определённый вид процесса сравнения с имеющимися в слоговой памяти образцовыми матрицами звукосочетаний.
Если слог опознан, срабатывает то реле из памяти написания, которое связано с написанием данного слога. В памяти написания (орфографической памяти) имеются типовые комбинации сочетания букв, представляющих 40 фонем для заданных 100 слогов. Реле соединено с линиями очерёдности следования букв и с линиями кода букв в блоке управления печатанием, который, в свою очередь, управляет работой буквенных приводов – происходит печатание выбранных букв.
Таким образом, слово печатается в соответствии с заранее определённым написанием, которое по необходимости должно быть одинаковым для одинаково звучащих слов. Именно поэтому устройство и было названо «фонетической пишущей машинкой».
Рис. 33 Схема фонетической пишущей машинки
Действующие, проектируемые и перспективные приборы для опознавания речи можно разделить на несколько видов. Мы дали им совершенно условные названия.
«Сезам» – устройство, в котором реализовано сказочное заклинание «Сезам, откройся!». Реагирует только на одно, два или три слова, но произнесённые любыми голосами. Может, если угодно, в самом деле открывать дверь в вашем подъезде.
«Жучка» – устройство, хорошо понимающее краткий командный язык из двух – трёх десятков слов. Обычно оно настроено на голос одного оператора. Как мы уже отметили, такой прибор способен управлять автомобилем или самолётом. Одна американская фирма успешно применила его в отделе технического контроля для записи параметров только что изготовленных цветных кинескопов. Другая фирма заставила «Жучку» запоминать свободные места в большом складском помещении и отправлять туда прибывающие контейнеры. Прибор незаменим при сложных научных экспериментах, когда надо записывать результаты, а руки исследователя заняты на пульте управления.
«Эксперт» – анализатор для выделения голоса одного из нескольких говорящих. Может помочь при опознании преступника, стать настройщиком музыкальных инструментов или контролёром качества звучания радиоприёмников, телевизоров и магнитофонов.
«Собеседник» – его действия могут быть самыми разнообразными: совет по телефону, когда врач сомневается в установлении диагноза, устный ответ программисту о результатах вычислений на ЭВМ, ответ на запрос о состоянии текущего счета в банке и т.п. Другая модификация – «Электронный секретарь», соединённый с пишущей машинкой.
«Переводчик» – название устройства не требует комментариев. Это искусственное ухо, подключённое к ЭВМ с программой автоматического перевода с одного языка на другой.
«Интегральный робот» – автомат, двигающийся впереди человека в опасных ситуациях. Подчиняется голосовым командам и докладывает пославшим его людям о том, что воспринимает. Мог бы помочь во время ремонта атомного реактора или путешествия на малоизученную планету.
Человеческое ухо существует в одном варианте. Искусственных, как видим, намечается несколько. Тем лучше! В том – то и сила техники, что она не копирует слепо природу.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ «МАЛЕНЬКИХ ЧЕЛОВЕЧКОВ»
МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ «МАЛЕНЬКИХ ЧЕЛОВЕЧКОВ» С каждой новой модификацией детерминированность шагов АРИЗ возрастает. Усиливается и информационное обеспечение. Тем не менее АРИЗ не отменяет необходимости думать, он лишь управляет процессом мышления, предохраняя от
3.8. Моделирование
3.8. Моделирование До сих пор, говоря об ассоциациях представлений, мы полностью игнорировали их динамический, временной аспект, т. е. рассматривали связываемые представления как статические и не имеющие никакой координаты во времени. Между тем идея времени может активно
Проектирование и моделирование
Проектирование и моделирование Роботы оказались способны к выполнению не только циклических операций. Компании – производители широко используют системы компьютерного проектирования (computer aided design CAD), управляемого компьютерного производства (computer aided manufacturing CAM) и
4.5.2. Ускорители нанотехнологии. Квантовое моделирование и масштабные эксперименты
4.5.2. Ускорители нанотехнологии. Квантовое моделирование и масштабные эксперименты Выше говорилось о том, что научные достижения имеют тенденцию «эмигрировать» из лабораторий и превращаться в инновационные проекты, причем этот процесс протекает ускоренно, что и
3. Моделирование – экспериментальная основа роботостроения
3. Моделирование – экспериментальная основа роботостроения Пытаться конструировать радиоэлектронные системы роботов, не представляя хорошо их теории и физических основ, – это значит работать с очень низким коэффициентом полезного действия. Создать какую – либо
Модель и моделирование
Модель и моделирование Современные научно – технические исследования и промышленное строительство ведутся с огромным размахом, и на них затрачивается много средств (вспомним хотя бы о космических исследованиях). Поэтому ошибки или просчёты могут привести к
Моделирование радиоэлектронных устройств из радиокубиков
Моделирование радиоэлектронных устройств из радиокубиков Радиокубики – это небольшие пластмассовые коробки, в которые вмонтированы различные радиодетали и магниты, притягивающие кубики один к другому и соединяющие их в единое работающее устройство (рис. 10). На каждом
Моделирование робото-технических радиоэлектронных устройств из модулей
Моделирование робото-технических радиоэлектронных устройств из модулей Типовые модули являются основой всех промышленных радиоэлектронных разработок. В этом отношении наиболее убедителен пример конструирования современных ЭВМ. Первые ламповые ЭВМ состояли из
4. Моделирование речи
4. Моделирование речи Искусственная речь и связанные с ней проблемы Говорящие машины уже существуют. Словарь их пока небольшой и состоит из слов, произнесённых человеком и записанных на магнитный барабан. Наиболее известный тому пример – говорящие часы, работающие на
Моделирование речи автоматов
Моделирование речи автоматов Как мы уже видели из рис. 23, спектр речи автомата – сирены значительно проще речи человека. Чтобы получить сигнал сирены, нужно сформировать звуковой сигнал, частота которого периодически изменялась бы по пилообразному
Моделирование систем слуха
Моделирование систем слуха Прежде чем приступить к конструированию устройства слуха роботов, смоделируем отдельные элементы этих систем.На рис. 34 – 37 показаны схемы усилителей звуковой частоты.Начинать конструирование моделей слуховых систем лучше всего с
6. Моделирование зрения
6. Моделирование зрения Специалисты в области бионики ведут работы по моделированию некоторых функций человеческого глаза. Создана электронная модель сетчатки, воспроизводящая работу фоторецепторов в центральной ямке и на периферии, предложено устройство, аналогичное
8. Моделирование нервной системы (нейроны и нейронные сети)
8. Моделирование нервной системы (нейроны и нейронные сети) Кибернетика и нервная система Многое в работе нервной системы человека до сих пор непонятно учёным. Тем не менее общие закономерности управления, установленные кибернетикой, справедливы и для неё. Кибернетика
9. Моделирование памяти и вычислительных систем
9. Моделирование памяти и вычислительных систем На пути к созданию искусственного мозга Важнейшим объектом исследования нейрокибернетики является самая сложная биологическая система – человеческий мозг. Исследуя процессы, происходящие в головном мозге, можно изучить