Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Системы синтеза речи




 

Системы речевого вывода информации базируются либо на выборке из слова­ря готовых оцифрованных звуковых последовательностей, либо на синтезато­рах речи. Самым простым вариантом является выборка готовых звуковых последовательностей (как в автоответчике), но ввиду большого размера «зву­ковых» файлов, вывод большого числа слов в этом случае практически невоз­можен. В таких простых системах часто используются меню, по которым пользо­ватель может выбрать те высказывания, которые он бы хотел услышать. При наличии нужных записей в базе данных их текст озвучивается. Такие системы используются, например, в будильниках, в автомобильных навигационных сис­темах.

Формирование речевого вывода более функционально полными синтезаторами речи и выполняется в несколько этапов.

Задачей первого этапа является отфильтровать шумовые символы текста (знаки препинания, кавычки, тире, скобки). Эта задача решается модулем норма­лизации, который также обрабатывает контекстно-зависимые сокращения, фор­маты дат, времени, денежных единиц.

Модуль преобразования на втором этапе переводит текст из орфографического в фонетический формат (из букв в звуки). Для некоторых языков, например для английского, это непростой процесс, ибо многие слова читаются не по буквам, а по особым правилам произношения отдельных буквенных сочетаний.

Модуль анализа выполняет одновременно лексикографическую и синтаксическую обработку для выбора варианта произношения, ритма и интонации.

Фонетический модуль, получив от модуля анализа фонетическое представление исходного текста, обогащает звучание речи дифтонгами, трифтонгами, четырехзвучиями и другими полезными составляющими.

Модуль обработки звука преобразует фонетические данные в звуковые сигналы: генерируемые волновые последовательности (с частотой порядка 10 кГц) модули­руются фонетическим потоком. На этой стадии выполняется управление громко­стью, скоростью речи, тембром голоса.

Среди программ синтеза речи можно назвать шведскую систему Infovox, систему Monologue английской фирмы First Byte, систему Pro Verbe компании Elan Informatique и др.

Компьютерные средства обеспечения звуковых технологий

Звуковые платы (sound blaster) используются для создания, записи и воспроизве­дения различных звуковых сигналов: музыки, речи, шумовых эффектов. В режиме создания звука плата действует как музыкальный инструмент. Звук, со­здаваемый с помощью звуковой платы, называют «синтезированным».

В режиме записи звука плата производит оцифровку звуковых сигналов для по­следующей их записи в память компьютера.

В режиме воспроизведения звука плата работает аналогично цифровому аудио­плейеру, преобразуя считанные из памяти цифровые сигналы в аналоговые зву­ковые.

Функционально плата содержит несколько модулей:

· модуль для записи и воспроизведения звука;

· модуль синтезатора звука;

· модуль интерфейсов.

Модуль записи и воспроизведения звука использует для оцифровки звука анало­го-цифровые преобразователи (АЦП), а для обратного преобразования — цифро-аналоговые преобразователи. На качество звука и в том и в другом случае суще­ственно влияет разрядность преобразователей.

Качество оцифровки, а соответственно, и последующего звучания оцифрованной аудиоинформации, при прочих равных условиях, зависит от раз­рядности преобразования и частоты дискретизации:

· разрядность преобразования определяет динамический диапазон сигнала;

· частота дискретизации — верхнюю границу диапазона частот звукового сигнала.

Модуль синтезатора звука. Для синтеза звукового сигнала используется два ос­новных метода:

· синтез с помощью частотной модуляции, или FM-синтез;

· синтез с использованием таблицы волн (Wave Table), или табличный WT-синтез.

FM-синтез звука осуществляется с использованием специальных генераторов сигналов, называемых операторами. В операторе можно выделить два базовых элемента: фазовый модулятор и генератор огибаблиющей. Фазовый модулятор оп­ределяет частоту (высоту) тона, а генератор огибающей — его амплитуду (гром­кость). В общем случае, для воспроизведения голоса одного инструмента достаточно двух опера­торов:

· первый генерирует колебания несущей частоты, то есть основной тон;

· второй — модулирующую частоту, то есть обертоны.

Современные звуковые платы способны воспроизводить несколько голосов, на­пример, синтезатор с 18 операторами может имитировать 9 разных голосов. При этом многие 16-разрядные звуковые платы используют 4-операторные синтезаторы (например, Yamaha OPL3). Звук, синтезированный FM-методом, имеет обычно некоторый «металлический» оттенок, т. е. не похож на звук настоящего музы­кального инструмента.

WT-синтез обеспечивает более качественное звучание. В основе этого синтеза ле­жат записанные заранее и хранящиеся в памяти образцы звучания музыкальных инструментов (MIDI-файлы). Синтезаторы этого типа (например, Yamaha OPL4) создают музыку путем манипулирования образцами звучания инструментов, «за­шитыми» в ПЗУ платы или хранящимися на диске ПК. Лучшие звуковые платы позволяют хранить и использовать до 8 Мбайт выборок. При использовании вы­борок, загружаемых с диска, хорошая плата должна иметь ОЗУ емкостью не менее 1 Мбайт. Выпускаются также табличные расширители, позволяющие увеличить массив используемых MIDI-файлов.

Модуль интерфейсов включает в себя интерфейс музыкальных инструментов, обычно MIDI (Musical Instrument Digital Interface), и средства воспроизведения звука в соответствующем формате. Кроме того, в него могут входить интерфейсы одного или нескольких дисководов CD-ROM. Через этот модуль можно проигры­вать CD-ROM, разговаривать через модем и воспроизводить свою собственную компьютерную музыку.

В состав многих звуковых плат, кроме названных трех модулей, включаются:

· устройство смешения сигналов от различных источников — микшер; управление амплитудой смешиваемых сигналов выполняется обычно программным способом;

· модемный и игровой порты, последний обеспечивает качественное звуковое сопровождение компьютерных игр;

· усилители мощности сигнала с регулятором громкости (такие платы имеют два выхода: линейный — до усилителя и конечный — после усилителя).

Сейчас выпускается огромное количество самых разных звуковых карт и расши­рителей MIDI-файлов. Современные качественные звуковые платы соответству­ют стандарту Basic General MIDI, предусматривающему поддержку 128 инструментов и многотонального исполнения — как минимум 16 каналов одновременно. Рекомендовать какую-либо плату однозначно не представляется возможным, мож­но высказать лишь общие соображения:

· среди недорогих одноплатных звуковых карт заслуживает внимание Sound Galaxy Waverider фирмы Aztech;

· для более требовательных музыкантов рекомендуется расширитель DB50XG с любой 16-битной платой, например Sound Blaster Value;

· для особых ценителей качества звучания рекомендуется плата Turtle Beath NBS-2000.

Для работы с видеоинформацией необходимо иметь функционально более разно­образное оборудование.

Видеоконтроллеры (видеоадаптеры) являются внутрисистемными устройствами, преобразующими данные в сигнал, отображаемый монитором, и непосредственно управляющими мониторами и выводом информации на их экран. Видеоконтрол­лер содержит: графический контроллер, растровую оперативную память (видео­память, хранящую воспроизводимую на экране информацию), микросхемы ПЗУ, цифроаналоговый преобразователь.

Контроллер (специализированный процессор) формирует управляющие сигналы для монитора и управляет выводом закодированного изображения из видеопамя­ти, регенерацией ее содержимого, взаимодействием с центральным процессором. Контроллер с аппаратной поддержкой некоторых функций, позволяющей освободить центральный процессор от выполнения части типовых операции, называется акселератором (ускорителем). Акселераторы эффективны при работе со сложной графикой: многооконным интерфейсом, трехмерной (3D) графикой. Основ­ными компонентами специализированного процессора являются: SVGA-ядро, ядро 2D-ускорителя, ядро 3D-ускорителя, видеоядро, контроллер памяти, интерфейс системной шины, интерфейс внешнего порта ввода-вывода. Аппаратно большая часть этих компонентов реализуется на одном кристалле видеоконтроллера.

В процессе формирования 3D-изображения аппаратный 3D-ускоритель взаимодействует с программным обеспечением, сам процесс имеет несколько этапов:

· определение состояния объектов;

· определение соответствующих текущему состоянию геометрических трехмер­ных моделей;

· разбиение этих моделей на простые элементы — графические примитивы, в ка­честве которых чаще используют треугольники (именно на этом этапе подклю­чается аппаратный ЗD-ускоритель);

· преобразование параметров примитивов в целочисленные значения, с которы­ми работают аппаратные компоненты;

· закраска примитивов и финальная обработка.

Основные аппаратные элементы ЗD-ускорителя: геометрический процессор, ме­ханизм установки и механизм закраски примитивов. Характеристиками ускори­телей являются максимальная пропускная способность (треугольников в секунду), максимальная производительность закраски (точек в секунду), скорость (кадров в секунду).

Важная характеристика — емкость видеопамяти, она определяет количество хра­нимых в памяти пикселов и их атрибутов. Видеоконтроллер должен обеспечить естественное качественное изображение на экране монитора, что возможно при большом числе воспроизводимых цветовых оттенков, высокой разрешающей спо­собности и высокой скорости вывода изображения на экран.

Под разрешающей способностью понимается то количество выводимых на экран монитора пикселов, которое может обеспечить видеоконтроллер.

Плата видеозахвата (video grabber, видеограббер) выполняет захват кадров ви­део, их преобразование (в то числе и оцифровку) и запись в память компьютера.

Платы видеозахвата бывают двух типов:

· грабберы кадров (frame grabber) предназначены для захвата неподвижных изоб­ражений;

· платы захвата (capture board) могут захватывать целые видеофильмы. Они позволяют получать с видеокамеры или видеомагнитофона, а при наличии тю­нера и с антенны отдельные телевизионные кадры и их связанные последова­тельности для дальнейшей обработки в компьютере и вывода на принтер или обратно на видео.

При оцифровке видеосигнала формируются огромные массивы информации. По­этому возникают серьезные проблемы с динамикой процесса, ибо для пересылки одного 256-цветного полноэкранного изображения с разрешающей способностью 1024 х 760 пикселов необходимо передать около 1 Мбайт данных, что может по­требовать до 10 с и более.

Ввиду большого объема видеофайлов, они при передаче и записи в память сжима­ются (выполняется компрессия видеоданных); при воспроизведении картинки выполняется обратная процедура — декомпрессия. В настоящее время существует несколько методов сжатия данных, реализуемых как программно, так и аппаратно. Средства сжатия данных обычно называют КОДЕКами (CODEC — Compressor-DECompressor). Широкое распространение получили, например КОДЕКи: Motion JPEG-INDEO, Cinepak и т. д.

Платы видеозахвата второго типа, несмотря на указанные трудности, открывают широкие перспективы по созданию и обработке динамических изображений в ре­альном масштабе времени — живого видео.

Видеотерминальные устройства

 

Видеотерминальные устройства предназначены для оперативного отображения текстовой и графической информации в целях визуального восприятия ее пользо­вателем. Видеотерминал состоит из видеомонитора (дисплея) и видеоконтроллера (видеоадаптера). Видеоконтроллеры входят в состав системного блока ПК (нахо­дятся на видеокарте, устанавливаемой в разъем материнской платы), а видеомо­ниторы — это внешние устройства ПК. Видеомонитор, дисплей или просто мони­тор — устройство визуализации информации на экране. В стационарных ПК пока еще чаще всего информация визуализируется на экране электронно-лучевой трубки (ЭЛТ), в портативных ПК — на плоских индикаторах. Видеоконтроллер предназ­начен для преобразования данных в сигнал, отображаемый монитором, и для уп­равления работой монитора.

Видеомониторы на плоских панелях

Видеомониторы на плоских панелях (ВМПП) весьма разнообразны. Сейчас при­меняются:

· мониторы на жидкокристаллических индикаторах (LCD - Liquid Cristal Display);

· плазменные мониторы (PDP - Plasma Display Panels);

· электролюминесцентные мониторы (FED - Field Emission Display);

· самоизлучающие мониторы (LEP - Light Emission Plastics).

Мониторы на жидкокристаллических индикаторах

Современные ЖК мониторы также называют плоскими панелями, активными матрицами двойного сканирования, тонкопленочными транзисторами.

Существует два вида ЖК мониторов:

· DSTN (dual-scan twisted nematic - кристаллические экраны с двойным сканированием);

· TFT (thin film transistor - на тонкопленочных транзисторах), также их называют соответственно пассивными и активными матрицами. Такие мониторы состоят из следующих слоев: поляризующего фильтра, стеклянного слоя, электрода, слоя управления, жидких кристаллов, ещё одного слоя управления, электрода, слоя стекла и поляризующего фильтра.

Как работает ЖК монитор

Поперечное сечение панели на тонкопленочных транзисторах представляет собой многослойную систему. Крайний слой любой из сторон выполнен из стекла. Между этими слоями расположен тонкопленочный транзистор, панель цветного фильтра, обеспечивающая нужный цвет - красный, синий или зеленый, и слой жидких кристаллов. Вдобавок ко всему существует флуоресцентная подсветка, освещающая экран изнутри.

При нормальных условиях, когда нет электрического заряда, жидкие кристаллы находятся в аморфном состоянии. В этом состоянии жидкие кристаллы пропускают свет. Количеством света, проходящего через жидкие кристаллы, можно управлять с помощью электрических зарядов - при этом изменяется ориентация кристаллов.

Как и в традиционных электроннолучевых трубках, пиксель формируется из трех участков - красного, зеленого и синего. А различные цвета получаются в результате изменения величины соответствующего электрического заряда (что приводит к повороту кристалла и изменению яркости проходящего светового потока).

TFT экран состоит из целой сетки таких пикселей, где работой каждого цветового участка каждого пикселя управляет отдельный транзистор. Именно здесь стоит поговорить о разрешении. Для нормального обеспечения экранного разрешения 1024х768 (режим SVGA) монитор должен располагать именно таким количеством пикселей.

Преимущества ЖК мониторов:

· ЖК мониторы более экономичные;

· нет электромагнитного излучения в сравнении c ЭЛТ-мониторами;

· не мерцают, как ЭЛТ-мониторы;

· легкие и не такие объемные;

· большая видимая область экрана.

Плазменные мониторы

Прообразом для создания плазменных экранных матриц (Plasma Display Panels) стали самые обычные лампы дневного освещения. На поверхность внутренней стороны стенок выведены микроскопические электроды, образующие две симметричные матрицы, а снаружи эта конструкция покрыта слоем люминофора. Когда на контакты подается ток, между ними возникает крошечный разряд, который заставляет светиться (в ультрафиолетовой части спектра) располагающиеся рядом молекулы газа. Следствием этого является освещение участка люминофора, как это происходит в обычных ЭЛТ-мониторах.

Основные плюсы этой технологии это: во-первых, плазменные мониторы выгодно отличаются от своих конкурентов высокой яркостью и контрастностью изображения; во-вторых, в их габаритах составляющая толщины представляет собой ничтожно малую долю. Основные минусы, не позволяющие использовать эту технологию для производства мониторов, это низкая разрешающая способность и крайне высокая энергоемкость. Кроме того, стоимость таких устройств является заоблачной для массового пользователя. Да и проблемы с цветопередачей для PDP также актуальны, как и для всех прочих решений, отличных от ЭЛТ.

Электролюминесцентные мониторы

Электролюминесцентные мониторы (FED — Field Emission Display) в качестве панели используют две тонкие стеклянные пластины с нанесенными на них про­зрачными проводами. На одну из этих пластин нанесен слой люминофора. Пла­стины складываются так, что провода пластин пересекаются, образуя сетку. Меж­ду пересекающимися проводами образуются пикселы. На пару пересекающихся проводов подается напряжение, создающее электрическое поле, достаточное для возбуждения свечения люминофора в пикселе, находящемся в месте пересече­ния.

Самоизлучающие мониторы

Самоизлучающие мониторы (LEP — Light Emission Plastics) используют в каче­стве панели полупроводниковую пластину, элементы которой под действием элек­трического тока начинают светиться. Конструкция панели примерно такая же, как панели FED, но через полупроводниковые пикселы пластины пропускается ток (а не создается электрическое поле). На сегодняшний день имеются монохромные (желтого свечения) LEP-дисплеи, приближающиеся по эффективности к диспле­ям LCD, но уступающие им по сроку службы.

Удалось создать органический полупроводник, имеющий широкий спектр излу­чения — в диапазоне от синего до инфракрасного с эффективностью (коэффици­ентом полезного действия по мощности) излучения порядка 1 %. Фирмы СDТ и Seiko-Epson планируют в ближайшее время на основе этого материала создать полноразмерный цветной дисплей.

Достоинства LEP-панелей:

· пластик сам излучает свет, поэтому не нужна подсветка как в LCD-мониторе;

· LEP-монитор обеспечивает 180-градусный угол обзора;

· LEP-дисплей работает при низком напряжении питания (менее 3 В) и имеет малый вес, поэтому их можно использовать в портативных ПК.

LЕР-дисплей обладает крайне малым временем переключения (менее 1 мс), его мож­но использовать для воспроизведения видеоинформации.

 




Поделиться с друзьями:


Дата добавления: 2014-01-06; Просмотров: 556; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.056 сек.