ВС:Бухгалтерия 6.3 Печенье с предсказаниями fortune-cookies ru п... (от Печенье с предсказаниями)
Microsoft улучшила голосовое распознавание в Windows Phone 8
Методика машинного обучения Deep Neural Networks (DNN), созданная Джефри Хинтоном, помогает Microsoft в совершенствовании ее системы голосового распознавания. Корпорация сообщила, что модель DNN позволила удвоить скорость распознавания голоса в среде Windows Phone и снизить при этом число ошибок в словах на 15%. Теперь поисковая система Bing Voice Search, по заверениям разработчиков, гораздо лучше работает в условиях повышенного шума. Правда, пока эти новшества будут доступны только пользователям Windows Phone на территории США.
Новая акустическая модель и декодер Bing Voice Search for Windows Phone является результатом совместной работы команды Bing Voice с Microsoft Research – корпоративной сетью из 12 исследовательских лабораторий, которая занимается всем: от продления заряда батареи мобильных устройств и машинного обучения до изучения экономики и теории игр. Модель нейронных сетей DNN, как считает Microsoft, помогла исследователям создать более умную акустическую модель для реалистичного голосового воспроизводства языка. Основная идея корпорации заключается в том, чтобы воссоздать схему, как человеческий мозг «слушает» и интерпретирует речь.
Вообще, «глубинные нейронные сети» – это вычислительный фреймворк для автоматического распознавания структур, выстроенный по образу и подобию базовых механизмов работы человеческого мозга. Тщательно проработанные математические формулы в сочетании с высокой вычислительной мощью и большими рядами данных позволяют DNN «обучаться» и «действовать» более приближенно к человеческой способности распознавать изображения и речь, чем это делают традиционные голосовые технологии.
Возможности разработок Хинтона были продемонстрированы еще в прошлом году в Китае: в реальном времени машинный переводчик транслировал речь Рика Рашида, главы Microsoft Research, с английского на китайский язык. Устройство не только обеспечило точный перевод, но также сохранило интонации и акцент говорящего.
Так или иначе, применение DNN в программных системах распознавании речи – не самая простая задача. DNN-модели могут содержать сотни миллионов параметров, отвечающих за различные аспекты человеческого голоса. Но модели можно обучать, что и сделали с успехом ученые Microsoft Research при помощи собственных разработок. Результатом стал удобный интерфейс Bing Voice Search, понятный даже неопытному пользователю.
Новый и улучшенный модуль Bing Voice Search появится на платформе Windows Phone 8 уже в ноябре этого года, но пока будет доступен только жителям США.
По материалам сайтов The TechNet и TechCrunch.
Получить дополнительную информацию о компании Microsoft Corporation можно на сайте компании Softline.
Оставьте Ваш комментарий или мнение о новости: Microsoft улучшила голосовое распознавание в Windows Phone 8 Просим Вас оставлять сообщения по теме и уважать своих собеседников и авторов новостного сообщения.