КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Моделирование слуха
Первоначально модели этого класса ограничивались лишь уровнем первичного спектрального анализа речевого сигнала. При их разработке использовались результаты психоакустических (психофизических) экспериментов, полученные методами маскировки. Очевидно, что параметры таких моделей отражали как особенности собственно периферического спектрального анализатора слуховой системы, так и алгоритмы принятия решений испытуемыми. Вряд ли целесообразно использовать подобные модели в качестве блока первичного анализа сигнала в полной функциональной модели восприятия речи: некоторые процедуры обработки сигнала окажутся учтенными в модели дважды - и в характеристиках первичного анализатора, и в правилах принятия решений. С этой точки зрения более адекватными представляются модели, основанные на данных нейрофизиологии и учитывающие гидромеханические характеристики "улитки" внутреннего уха. Подобного рода модель в течение почти двух десятилетий разрабатывается и используется для анализа экспериментальных сигналов в лаборатории физиологии речи Института физиологии им. И.П.Павлова РАН [Чистович и др., 1986]. В ней, помимо характеристик "улитки", учтены эффекты двухтонового подавления и периферической кратковременной адаптации. Последующая обработка полученного с помощью модели представления речевого сигнала включает сегментацию (структура и параметры блока выбраны на основе психоакустических данных) и выделение локальных (по частоте) параметров спектра. Аналогичные модели используются многими зарубежными исследователями. Некоторые из них расширены за счет введения блоков, воспроизводящих дальнейшие преобразования сигнала: латеральное торможение [Shamma, 1988] и получение синхронного спектра [Sachs, 1982; Seneff, 1988]. В последние годы (видимо, благодаря значительному увеличению мощности персональных ЭВМ) появились модели с элементами "нейронных сетей", воспроизводящие функциональные свойства не только "улитки" и волосковых клеток, но и нейронов кохлеарных ядер [Visual Representations..., 1993], что существенно расширяет возможности моделей в плане выделения признаков для первичного субъективного описания сигналов. Спектральное представление сигнала на выходе таких моделей характеризуется тем, что в области первой форманты выделяются изолированные гармоники, особенно для женских голосов с высокой частотой основного тона. При использовании традиционного описания сегментов речевого потока в терминах формантных частот это создает дополнительную проблему оценки положения первой форманты по амплитудам соответствующих гармоник. Однако результаты психоакустических исследований [Чистович, Шупляков, 1971] показывают, что при восприятии гласных за первую форманту слушатель принимает именно максимальную гармонику в соответствующей частотной области.
Дата добавления: 2015-06-04; Просмотров: 525; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |