Microsoft 365 Blog

Компания Microsoft внедрила в текстовый редактор Word (входит в пакет приложений Office) функцию расшифровки голосовых аудиозаписей. Об этом сообщается в блоге Microsoft.

Сервис, получивший название Transcribe, расшифровывает как загруженные сторонние аудиофайлы в формате mp3, wav, m4a или mp4, так и записи, сделанные непосредственно через Word. Готовый текст можно редактировать и добавлять в основной документ. Если в беседе участвует два человека, то Transcribe помечает реплики каждого собеседника.

Пока что функция Transcribe работает лишь в веб-версии Word 365 с рядом ограничений. Например, пользователям доступна расшифровка только англоязычных записей (поддержку других языков обещают внедрить позднее). Кроме того, максимальный размер файла для расшифровки не должен превышать 200 МБ, а продолжительность расшифровки составляет не более пяти часов в месяц. Мобильную версию Transcribe компания обещает представить к концу 2020 года, пишет VC.ru.

Напомним, в июне функцию расшифровки голосовых сообщений запустила соцсеть "ВКонтакте". Тестировать эту функцию компания начала в марте, но тогда для расшифровки использовалась сторонняя технология. Теперь же за распознавание речи отвечает новая нейросеть, созданная командой исследований "ВКонтакте" с учетом высокой нагрузки платформы, а также русскоязычного сленга.

"Голосовые сообщения - очень популярный формат общения "ВКонтакте". Ежемесячно аудиосообщениями обмениваются 30 миллионов пользователей, поэтому новая технология VK рассчитана на самые высокие нагрузки. При этом нейросеть расшифровывает записи быстрее, чем человек, хорошо понимает разговорный язык и заимствованную лексику, а также справляется с аудио низкого качества и нечеткой речью", - отмечали в компании.