Question 1

Какая точность транскрибации на русском?

Accepted Answer

Диктуй использует Whisper Large-v3-turbo через Groq — это та же базовая модель, что у Wispr Flow и SuperWhisper. На чистой русской речи (диктор, подкаст, интервью без шумов) точность 95-98%. На записях с фоновым шумом, акцентом или быстрой речью — 88-93%. На mixed RU+EN речи (типичной для IT и vibe coding) — 92-96%, что значительно выше встроенных решений Windows/macOS, которые на mixed теряют 30-50% качества.

Question 2

Какие форматы аудио и видео поддерживаются?

Accepted Answer

Аудио: MP3, WAV, M4A, OGG, FLAC. Видео: MP4, WebM (Диктуй автоматически извлечёт аудиодорожку). Telegram-голосовые в OGG работают «из коробки» — просто перетащите файл из мессенджера в окно Диктуй. Лимит размера файла — 2 часа аудио или ~500 МБ. Длинные файлы автоматически разбиваются на чанки и транскрибируются параллельно.

Question 3

Можно ли транскрибировать бесплатно?

Accepted Answer

Да. Free-тариф Диктуй даёт 30 минут транскрибации в месяц **навсегда** — без карты, без trial-периода, без скрытых лимитов. Этого достаточно, чтобы попробовать на реальном файле и понять подходит ли. Если нужно больше — Starter 249₽/мес (150 мин), Pro 449₽/мес (300 мин), Unlimited 599₽/мес (без лимита). Все тарифы оплачиваются картами МИР, СБП и зарубежными — без прокси-карт.

Question 4

Где хранятся файлы и обрабатываются персональные данные?

Accepted Answer

Файлы загружаются на сервера Groq (США) только на время транскрибации — после получения результата они удаляются автоматически. Текстовый результат хранится в вашем личном кабинете на серверах в РФ (Beget VPS) согласно требованиям 152-ФЗ о локализации персональных данных граждан РФ. Подробнее — в [политике конфиденциальности](/privacy). Для медицинских записей и юридических документов с особо чувствительными данными мы не рекомендуем использовать облачную транскрибацию — это касается всех сервисов на Whisper, не только Диктуй.

Question 5

Чем транскрибация в Диктуй отличается от Я.SpeechKit и GigaChat?

Accepted Answer

Я.SpeechKit и GigaChat — это API для разработчиков, без готового UI. Чтобы расшифровать MP3, нужно написать код на Python, отправить файл через REST, получить JSON, разобрать его. Диктуй — десктоп-приложение с drag-and-drop: перетащил файл → получил готовый текст в окне с возможностью копирования и экспорта в TXT/DOCX/SRT. Целевая аудитория Я.SpeechKit — разработчики и контактные центры; Диктуй — обычные пользователи, журналисты, копирайтеры, vibe-coder'ы, юристы.

Question 6

Можно ли экспортировать в субтитры (SRT) для видео?

Accepted Answer

Да. После транскрибации видеофайла Диктуй сохраняет временные метки сегментов и предлагает экспорт в SRT (стандартный формат субтитров для YouTube, Premiere, Final Cut, DaVinci) и VTT (для веб-плееров). Если расшифровывали аудио (без видео) — экспорт доступен в TXT (просто текст) и DOCX (с разбиением по говорящим, если они различимы по интонации).

Question 7

Сколько времени занимает транскрибация часа аудио?

Accepted Answer

На Whisper Large-v3-turbo через Groq — час аудио расшифровывается за 1-3 минуты благодаря параллельной обработке чанков. Это в 5-10 раз быстрее, чем у конкурентов на не-Groq инфраструктуре (Sonix, Otter тратят 10-20 минут на час). Если сервер Groq перегружен (пиковые часы), может занять до 5 минут — но это всё равно радикально быстрее ручной расшифровки (которая занимает 4-6 часов на час записи).

Сервис	Цена	Точность RU	Платформы	Оплата
Диктуй	0₽ (30 мин) → 449₽/мес Pro	95%+ (Whisper Large-v3-turbo)	Win + Mac	МИР, СБП, карты
SpeakFlow	690₽/мес	Whisper (версия не указана)	Win (macOS сломан в 1.3.60)	Российские карты
Sonix	$10/час с файла	Whisper / собственный движок	Только web	Карты в долларах
Otter.ai	$16.99/мес Pro	Собственный движок (плох на русском)	Web + iOS/Android	Карты в долларах
Voicy	$8.49/мес или $220 lifetime	Whisper	Win + Chrome	Карты в долларах

Транскрибация аудио в текст на русском

Что такое транскрибация и зачем она нужна

Как работает в Диктуй: 3 шага

Перетащите файл

Whisper Large-v3 расшифровывает

Готовый текст

Точность на русском в 2026: конкретные цифры

Поддерживаемые форматы

Кому пригодится: 6 реальных сценариев

Интервью и подкасты

Лекции и вебинары

Совещания и встречи

Заметки голосом

Видеоконтент

Журналистика и юриспруденция

Сравнение с другими сервисами транскрибации

Сколько стоит транскрибация в Диктуй

Часто задаваемые вопросы

Попробуйте бесплатно — 30 минут навсегда