КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Система распознавания речи фирмы Speereo Software United Kingdom Limited
Промышленные системы распознавания речи IBM Voice Type Dictation – фонетическая пишущая машинка фирмы IBM 1. 32000 слов + 2000 слов личного словаря (английский язык). 2. 70 – 100 слов/мин. 3. Статистические языковые модели. 4. Стандартные фразы. 5. В любую среду: OS/2, Windows, DOS. 6. Спец. словарь: радиология и модели языков. 7. PCMCIA для мобильных работ. - изолированно произносимые команды; - с подстройкой под диктора; - плата ввода; - синтез введенного текста; - 95%; - подстраивается к языковой модели; - речь – текст в звуковом окне – текст в речевом редакторе; - управление оборудованием и меню; - 45 – 60 минут – обучение системы; 150 предложений; - английский UK и USA, французский, немецкий, итальянский, испанский, арабские языки. 1. До 150000 слов английского языка. 2. В темпе с процессом. 3. Статистические языковые модели. 4. 600 командных фраз. 5. В любую среду: MS Windows 95, 98, Millenium, NT4.0, 2000, XP. 6. Спец. словарь: радиология и модели языков. 7. PCMCIA для мобильных работ. - изолированно произносимые команды; - без подстройки под диктора; - 99,9% в офисном помещении; - 97% в автомобиле, идущем со скоростью 120 км/час; - подстраивается к языковой модели; - управление оборудованием и меню; - английский UK.
Рис. 7.12. Архитектура Speech Engine фирмы Speereo.
ЛИТЕРАТУРА
1. Minsky M., Papert S. Perseptrons. - Cambridge, MA: MIT Press, 1969. 2. Тутубалин В.Н. Теория вероятности. - М.: Издательство Московского университета, 1972г. 232 стр. 3. Bourlard H., Wellekens C.J. Speech Pattern Discrimination and Multilayer Perceptrons. Computer Speech and Language, vol. 3, 1989. Pp. 1 - 19. 4. Kharlamov A.A. Attention Mechanism Usage to Form Framework-structures on a Semantic Net. In Neurocomputers and Attention. Volume II: Connectionism and neurocomputers. (A.V.Holden, V.I.Kryukov eds). - Manchester, New York: Manchester University Press, 1991. Pp. 747 - 756. 5. Кемени Дж.Дж., Снелл Дж.Л. Конечные цепи Маркова. - М.: "Наука", 1970г. 272 стр. 6. Juang B. -H. On the Hidden Markov Model and Dynamic Time Warping for Speech Recognition - A Unified View. AT&T Bell Laboratories Journal. Vol. 63, No. 7, September 1984. Pp 1213 - 1243. 7. Baum L.E. et al. A Maximization Technique Occuring in the Statistical Analysis of Probabilistic Functions of Markov Chains. Ann. Math. Statist., v. 41, 1970. Pp. 164 - 171. 8. Sakoe H., Chiba S. A Dynamic Programming Approach to Continuous Speech Recognition. Proc. Int. Congress on Acoustics, Budapest, Hungary, Paper 20 C-13, 1971. 9. Харламов А.А. Нейроподобные элементы с временной суммацией входного сигнала и блоки ассоциативной памяти на основе этих элементов. В сб.: "Вопросы кибернетики. Устройства и системы" под ред. Н.Н.Евтихиева. -М.: МИРЭА, 1983. Стр. 57 - 68. 10. Фомин С.В., Беркинблит М.Б. Математические проблемы в биологии. - М.: Наука, 1973. 200 стр. 11. Widrow B. Generalization and Information Storage in Networks of Adaline 'Neurons'. In: Selforeganizing Systems 1962, M.C.Yovitz, G.T.Jacoby, G.D.Goldstein eds. - Washington, DC: Spartan Books, 1962. Pp. 435 - 461. 12. Widrow B., Hoff M.E. Adaptive switching circuits. In: IRE WESCON Conv. Rec., pt. 4, 1960. Pp. 96 - 104. 13. Widrow B., Stearns S.D. Adaptive Signal Processing. - Englewood Cliffs, NJ: Prentice-Hall, 1985. 14. Lewis II P.M., Cjates C.L. Threshold logic. - New York: John Wiley and Sons, 1967. 15. Rumelhart D.E., McCleland J.L. Parallel Distributed Processing. - Cambridge, Massachusetts: MIT Press, Volumes I and II, 1986. 16. Parker D.B. Learning-Logic. Center for Computational Research in Economics and Management Science, Mass. Inst. of Tech., Rep. TR-47, April 1985. 17. Величко В.М., Загоруйко Н.Г. Математическое распознавание ограниченного набора устных команд // Вычислительные системы. Новосибирск: 1969. Вып. 36. -С. 101 - 110. 18. Винцюк Т.К. Распознавание слов устной речи методами динамического программирования. //Кибернетика. 1968, № 1. -С. 81 - 88. 19. Слуцкер Г.С. Нелинейный метод анализа речевых сигналов //Тр. НИИР, 1968. Вып. 2. 20. Shannon C., Weaver W. The Mathematical Theory of Communication // Urbana: University of Illinois Press, 1969. 21. Якобсон Р.О. Речевая коммуникация; Язык в отношении к другим системам коммуникации // Избранные работы. М.: Прогресс, 1985. 22. Л.В. Бондарко. Звуковой строй современного русского языка. М.: Просвещение, 1997. 23. Лекции по языкознанию (http://www.tula.net/tgpu/resources/yazykozn/index.htm). Составитель Г.Н. Мерцалова. Тульский государственный педагогический университет им Л.Н. Толстого. 24. В. Ф. Ундриц, К. Л. Хилов, Н. Н. Лозанов, В. К. Супрунов. Болезни уха, горла и носа (руководство для врачей). Медицина, 1969.
Дата добавления: 2014-01-11; Просмотров: 556; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |