Приложение для записи заметок Granola на базе искусственного интеллекта, стоимость которого оценивается в 250 миллионов долларов, стало популярным инструментом среди основателей технологической индустрии и венчурных капиталистов. Но один разработчик считает, что существует спрос на более приватную, локальную альтернативу, доступную только за единовременную плату и без подписки. Это привело к созданию нового приложения для Mac под названием Talat .
Разработчик из Йоркшира, Англия Ник Пэйн, который называет себя компьютерным ботаником, говорит, что идея создания локального ИИ-блокнота возникла в основном из-за серии счастливых случайностей.
“Я думаю, что Granola великолепна; это яркий пример того, что можно сделать с приложением Electron [фреймворком для создания настольных приложений], если уделять ему достаточно любви и заботы”, - сказал он AGI_LOG. “Когда я впервые попробовал это приложение, я был поражен тем, что оно позволяет записывать системный звук на моем Mac без записи видео, что в то время было стандартным решением. Это привело к множеству исследований, в результате которых был обнаружен относительно новый и плохо документированный Apple API”.
Чтобы упростить работу с этим API (Core Audio Taps, который позволяет разработчикам подключаться к аудиопотокам Mac), Пейн решил создать аудиотеку с открытым исходным кодом AudioTee .
“В течение этого времени я постепенно собирал набор инструментов, но так и не нашел ничего, что могло бы стать самостоятельным продуктом, а не просто крутой технической демонстрацией”, - сказал Пэйн. “Современные модели транскрипции на хостинге - те же, что и у Granola, - просто невероятны, и это невероятно здорово — видеть, как ваша речь разворачивается на экране почти в режиме реального времени. Но меня всегда раздражало, что компромисс требовал предоставления не только моих данных, но и моих аудиоданных, моего настоящего голоса”, - добавил он.
Затем он наткнулся на программный инструментарий под названием FluidAudio, платформу Swift, которая обеспечивает полностью локальный аудио- ИИ с низкой задержкой на устройствах Apple. Это позволяет запускать небольшие и быстрые модели транскрипции непосредственно на нейронном движке Mac — специализированном оборудовании Apple для обработки данных с помощью искусственного интеллекта.
Именно эта статья заставила Пейна осознать, что он может превратить свое исследование в реальный продукт — такой, при котором ваши аудиозаписи никогда не покидают ваш Mac, а ваши расшифровки не хранятся на серверах другой компании.
Talat , который был создан совместно с давним другом и бывшим коллегой Пейна, Майком Франклином, является результатом интереса Пейна к аудиопространству. В результате вы получаете единовременную покупку в размере 20 МБ, для которой не требуется создавать учетную запись или даже делиться аналитическими данными с разработчиками. Также не взимается постоянная плата.
В то время как у некоторых разработчиков ИИ-заметок может быть больше возможностей, Talat предлагает упрощенный набор функций. Он записывает звук с микрофона вашего компьютера, когда вы находитесь в приложениях для собраний, таких как Zoom, Teams, Meet и других, и расшифровывает его в режиме реального времени. Приложение пытается назначить докладчиков в режиме реального времени, но вы можете переназначить их по мере необходимости. Вы также можете делать заметки, а также редактировать, удалять или разделять фрагменты стенограммы. По окончании собрания местный LLM подготавливает резюме с ключевыми моментами, решениями и пунктами действий.
В Talat также доступен поиск по заметкам, стенограммам и резюме.
Помимо обеспечения конфиденциальности, Пейн сказал, что цель состоит в том, чтобы предоставить пользователям больше возможностей.
“Мы ориентируемся на возможность настройки и даем пользователям возможность контролировать, куда отправляются их данные: выберите свой собственный LLM, автоматический экспорт в [приложение для создания заметок] Obsidian, веб-приложения, которые выводят данные после завершения собрания, Сервер MCP, ”который является стандартизированным способом подключения инструментов искусственного интеллекта к внешним источникам данных“, чтобы получать их по требованию", - пояснил он.
По сути, искусственный интеллект представляет собой смесь, “в основном собранную воедино и абстрагированную с помощью FluidAudio”, — отметил Пэйн, которому он приписывает большую часть тяжелой работы. В заключение отметим, что по умолчанию в приложении используется модель Al под названием Qwen3-4B-4bit, которая может работать даже на довольно скромном оборудовании.
Однако пользователи могут переключить это на любого облачного провайдера LLM по своему выбору, или они могут выбрать один из двух вариантов Parakeet — моделей распознавания речи, разработанных Nvidia, — или использовать Ollama (инструмент для локального запуска моделей искусственного интеллекта), что дает им больше контроля над процессом. Со временем Talat добавит поддержку большего количества встроенных функций, а также интеграцию с другими приложениями, такими как Google Calendar и Notion.
После запуска пользователи компьютеров Mac серии M (на которых установлены собственные процессоры Apple, начиная с M1) могут бесплатно загрузить приложение и попробовать его в течение 10 часов, прежде чем принять решение о покупке.
Талат доступен по цене 49 долларов в этой предварительной версии, которая все еще находится в стадии активной разработки.
Когда приложение выйдет в версии 1.0, его цена возрастет до 99 долларов.
Пэйн и Франклин разрабатывают программу Talat и планируют в будущем сделать основной продукт одноразовой покупкой.