Гибридный подход обещает распознавание речи на любом языке на SoftOut, новости, программы, обзоры и полезные статьи

добавить программу

сообщить новость

в закладки

Комментарии программ

MPRIORITY 1.0
Программы нет (от fingert)

RonyaSoft CD DVD Label Ma
Я хотел бы с Вами поговорить. (от sosamba-novg1)

ArtCursors 5.18
Это обычная условность (от sosamba-novg1)

Диагностика - ремонт - мо
Добрый день! Ваш сайт несомненно п... (от Сергей)

Финансовый анализ предпри
Вы получили один из величайших интернет-сайто... (от Sowngds)

Автобаза 1
Светодиодные светильники от производителя! Эк... (от Ltn Led)

DLT - Детектор Лжи-Времен
вв (от вв)

Комиссионная торговля
Доброго времени суток! Как можно получить клю... (от Сергей Р.)

SameTools OST a recuperac
Спасибо за интересную и полезную статью. Я по... (от Gerardohop)

ВС:Бухгалтерия 6.3
Печенье с предсказаниями fortune-cookies ru п... (от Печенье с предсказаниями)

	Гибридный подход обещает распознавание речи на любом языке

Несмотря на постоянный и значительный прирост вычислительной мощности процессоров, распознавание речи улучшается гораздо медленнее, чем электроника. Конечно, речевые функции понемногу распространяются в телефонах, планшетах и компьютерах, но до полного исчезновения клавиатур еще очень далеко.

Гибридный подход обещает распознавание речи на любом языке

Вопрос распознавания речи в реальном времени даже в наше время является крайне непростой задачей. Даже при полном отсечении шумов оказывается трудно найти соответствие между звуком, снятым с микрофона, и фактически произнесенной фонемой. Даже носители одного языка говорят с уникальными особенностями – у любого человека можно найти какой-нибудь дефект артикуляции. Также речь зависит от возраста, полая, состояния здоровья и образования. В итоге получается парадоксальная ситуация – повышение мощности процессоров само по себе никак не улучшают распознавание речи.

Подход норвежских ученых сочетает в себе лучшие черты из всех предыдущих технологий и обещает серьезный прорыв в распознавании речи. Опытный образец системы способен находить общие характеристики самой механики человеческого голоса. По акустическому давлению, зафиксированному на микрофоне, система определяет, какие органы участвуют в звукоизвлечении, что сильно упрощает определение отдельных звуков, фонем и слогов.

Большинство известных решений для распознавания речи просят пользователей указать информацию о себе, включая возраст и основной язык/диалект, прежде чем приступить к транскрибированию речи в первый раз. При создании профиля также приходится прочитать пробный текст, что программа настроилась на ваше произношение. Это необходимо, поскольку программе нужны начальные данные для так называемого статистического распознавания. Статистический подход помогает улучшать качество распознавания по мере накопления опыта – алгоритм под названием «Байесовский вывод» помогает сопоставить конкретный звук голоса со звуками из словаря. У статистического подхода есть фундаментальный недостаток – первое время после создания нового профиля точность оставляет желать лучшего.

Другой главенствующий подход к распознаванию – так называемая дедукция, где основой является доскональное изучение структуры конкретного языка, правил словообразования и произношения. Обычно при таком подходе звуки определяются по локализации пиковых резонирующих частот, скажем, если пик размещается в диапазоне 750-1200 герц, это, скорее всего, звук «а». Если пик лежит в промежутке 350-800 герц, это может быть звук «у».

Система, созданная учеными из NTNU, сочетает в себе оба подхода: она собирает данные для изучения индивидуальных особенностей произношения с постепенным повышением точности, но, при этом реализована проверка фонетических правил на базе анализа человеческой речи в целом.

Измерение давления на мембране микрофона должно обеспечить гораздо более высокую точность распознавания речи, чем прежде. Например, звуки можно поделить на звонкие (где голосовые связки вибрируют) и глухие (где вибрации связок нет). Анализ звукового давления позволяет определить вибрацию звуковых связок напрямую, а не по косвенным факторам вроде пиковых резонансных частот, захваченных микрофоном.

Поскольку анатомически все люди на Земле говорят примерно одинаково (команде авторов удалось доказать это научными методам), новый механизм распознавания речи совершенно не привязан к конкретным языкам. Таким образом, в отличие от прежних технологий, новую разработку можно легко адаптировать к новому языку без значительных усилий. Это, в частности, позволяет записывать в текстовом виде идиомы, произносимые представителями языковых меньшинств, на что существующие коммерческие решения просто неспособны.

В данный момент коллектив авторов развивает свой модуль распознавания речи, не привязанный к конкретному языку, чтобы в итоге создать новый коммерческий продукт. В перспективе, он должен очень хорошо справляться с транскрибированием текста сразу на нескольких языках, а для определения конкретного языка системе понадобится всего 30-60 секунд прослушивания.

По материалам сайтов PhysORG и GizMag.

Дата публикации: 27.08.2012 (просмотров: 1316)
Обсудить Гибридный подход обещает распознавание речи на любом языке на форуме.

Последние новости и обзоры программ:

Новая версия Revisor VMS 1.9.2

Вышла обновленная версия Grizzly Антивирус (1.0.40.344)

Сооснователь Apple не видит условий для начала "войны машин"

Samsung Grand Duos взорвался в кармане у жителя Индонезии

Бывший разработчик Telegram раскрыл новые подробности конфликта с Дуровым

В США спрогнозировали будущее российской космонавтики

Россияне оказались готовы к разговору с умным холодильником

Разработан метод создания живой сетчатки глаза при помощи 3D-печати

Siri признана самым тупым искусственным интеллектом

Поддержка Firefox для Windows XP и Vista прекратится в 2018 году

Все новости и обзоры программ

Оставьте Ваш комментарий или мнение о новости:
Гибридный подход обещает распознавание речи на любом языке
Просим Вас оставлять сообщения по теме и уважать своих собеседников и авторов новостного сообщения.

Комментарии на нашем сайте:

	Разделы и сервисы сайта

Для разработчиков программ

Flash игры On-Line на сайте

Чит коды и прохождения игр

Новости и обзоры программ

Контакты, обратная связь

Форум обсуждения софта

Информация о проекте

Оценённые программы

Интернет Контроль Сервер (16274/3903)

New Time 1.0.2 (16321/3918)

Smart Kassir for EGAIS & On-Line KKT 6.2 (10185/7716)

SoftOut 1.0 (30170/3622)

Lim Block Folder 1.4.3 (12801/539)

SameTools OST a PST Windows 8 3.0 1.0.1 (4397/1935)

Toolsbaer NSF to PST Conversion Tool 1.0 (4055/1380)

Все по количеству оценок »
Программы по популярности »


	На сайте доступно для скачивания: FreeWare - бесплатные программы ShareWare - условно бесплатные Flash игры в режиме On-Line Чит коды и обзоры игр Наши разработки и проекты: Агент почтовых сообщений Создание дистрибутива программ Форум разработчиков и пользователей софта	Сервис для разработчиков: Добавить программу Опубликовать новость или обзор программы Платные услуги для продвижения программ Размещение рекламы на сайте
	Copyright © 2008 - 2024 www.softout.ru Быстро и бесплатно скачать программы на SoftOut - сборник лучших программ (загруженно за 2 с.) Программы для Windows 7, Linux, Symbian, Google Android, Apple iPhone и iPad, компьютерные и flash игры, чит-коды, документация windows, инструкции и фильтры photoshop, ежедневные новости и обзоры софта. Программы можно скачать по ссылкам авторов или с нашего сайта без SMS и паролей. Использование материалов сайта разрешено только с указанием прямой ссылки!

скачать программы

поиск программы

Лучшие программы

Программы для Windows

Мобильные программы

О компьютерах

Секреты Windows

Хитрости Photoshop

Комментарии программ

Гибридный подход обещает распознавание речи на любом языке

Комментарии на нашем сайте:

Разделы и сервисы сайта

Рекомендуем скачать

Оценённые программы