Поделиться
VK Telegram OK

Приложение Speechify для Windows использует локальные модели для транскрипции и диктовки

Приложения
AGILog · 2026-03-31 13:11

Компания Speechify, специализирующаяся на голосовом ИИ, только что запустила собственное приложение для Windows, в котором используются локально сохраненные модели для диктовки в разных приложениях и чтения вслух статей, документов или PDF-файлов с помощью своей библиотеки голосов.

Компания сотрудничает с такими компаниями, как Wispr Flow, Willow и Superwhisper, которые также предоставляют приложения для диктовки и транскрипции на разных платформах.

Speechify заявила, что приложение Windows полностью обрабатывает голос на устройстве на компьютерах Copilot + (на которых установлены процессоры AMD, Intel и Qualcomm) и других ПК с Windows 11, на которых установлены графические процессоры Intel и AMD.

Приложение поддерживает три модели, работающие на устройстве: нейронное преобразование текста в речь, распознавание голосовой активности в режиме реального времени и транскрипция с помощью шепота. Пользователи могут настроить приложение для перехода на облачные модели или даже изменять их во время использования.

Компания, у которой более 50 миллионов пользователей, заявила, что VITS Neural может генерировать аудио с семью различными настройками скорости, позволяя пользователям читать вслух документы или веб-страницы. Компания использует Модель Silero с открытым исходным кодом для обнаружения голосовой активности.

“Более миллиарда человек на этой планете используют Windows. С запуском этой версии Windows мы заботимся о том, чтобы чтение, а теперь и запись никогда не были препятствием, независимо от того, каким устройством вы пользуетесь и как предпочитаете работать. Мы особенно рады этой возможности на предприятии, учитывая, как много профессионалов запросили Speechify для своих ПК”, - сказал Клифф Вейцман, основатель и генеральный директор Speechify, в своем заявлении.

В прошлом месяце компания запустила Транскрипцию собраний, похожую на гранолу , но эта функция была доступна только для собраний в браузере. Теперь, когда у компании есть приложения для разных платформ, она, скорее всего, добавит эту функцию в собственные приложения для записи собраний в любом приложении или браузере.

Еще несколько лет назад Speechify в основном концентрировался на вариантах преобразования текста в речь, таких как чтение статей и электронных писем, а также создание подкастов из документов. В последнее время компания пытается стать полноценным голосовым приложением для пользователей, запустив диктовку, транскрипцию встреч и голосового помощника .