Голос в текст и диктовка в реальном времени
Включите микрофон и говорите – текст печатается сам по мере речи. Знаки препинания и заглавные буквы можно расставить при обработке текста. Голосовой ввод текста онлайн, без установки программ, точность 92,9%, поддержка ~100 языков.
- В реальном времени
- Авто-пунктуация и числа
- ~100 языков
- Без установки
- Точность 92,9%
- Данные в РФ (152-ФЗ)
Как перевести голос в текст: говорите – текст печатается сам
Голос в текст – это голосовой ввод с микрофона в реальном времени: вы говорите, а текст печатается на экране сам. Это живая диктовка онлайн, без загрузки готового аудиофайла на расшифровку. Потоковое распознавание идёт синхронно с речью, без ожидания конца записи, и слова появляются почти без задержки. Чтобы записать речь в текст, программы не нужны – хватает браузера и микрофона.
Разрешите микрофон и начните
Чтобы напечатать текст голосом онлайн, выполните три шага:
- Нажмите «Начать диктовку» и разрешите браузеру доступ к микрофону.
- Говорите как обычно – текст печатается сам по мере речи; делайте паузы там, где нужны точки.
- Скопируйте готовый текст в заметку, документ или чат одной кнопкой.
Регистрация для веб-диктовки не нужна – голосовой блокнот открывается онлайн и готов к работе сразу.
Реальное время vs загрузка файла
Главное отличие диктовки – текст печатается сам по ходу речи, без ожидания конца записи. Когда речь идёт о готовых записях, лучше подойдёт транскрибация готовых записей: вы загружаете аудио или видео и получаете текст с тайм-кодами и делением на спикеров. А живую речь распознаёт диктовка, и это удобно для заметок и черновиков, когда набор текста голосом нужен прямо сейчас.
Что умеет диктовка: пунктуация, языки, точность
Голосовой ввод сам расставляет пунктуацию, заглавные буквы и числа уже при финальной обработке, поэтому расшифровка читается как готовый текст. Palatine Speech распознаёт русскую речь с точностью WAcc 92,9% (WER 7,10%) по бенчмарку на семи датасетах. Голосом записать текст можно почти на любом языке: сервис поддерживает около 100 языков и сам определяет язык диктовки.
Авто-пунктуация, числа и заглавные
После диктовки модель ставит точки, запятые и заглавные буквы, корректно пишет числа, даты и термины. От вас нужны лишь естественные паузы там, где должны стоять знаки препинания. Так авто-пунктуация и числа попадают на свои места, и готовый текст не приходится править вручную.
~100 языков с автоопределением
Palatine Speech поддерживает около 100 языков с автоопределением, включая русский и языки СНГ. Переключать раскладку или выбирать язык вручную не нужно – система определяет язык диктовки сама. Это удобно, если во время диктовки вы переходите с одного языка на другой.
Диктовка без установки – в браузере на ПК и телефоне
Диктовка работает в браузере на ПК и телефоне без установки программ. Голосовой набор текста на компьютере не требует драйверов, плагинов или подписки – запись текста голосом онлайн доступна сразу после нажатия кнопки. Если вы привыкли диктовать в Word, используйте нашу браузерную диктовку как альтернативу: тот же голосовой ввод в браузере, только без привязки к редактору.
Работает онлайн без программ
Голосовой ввод в браузере не требует установки: откройте страницу, разрешите микрофон – и диктуйте. Это работает на Windows, macOS, Android и iPhone. Нет ни инсталляторов, ни обязательной регистрации для веб-диктовки – голосовой блокнот превращает речь в текст прямо на странице.
Мобильная диктовка через бот
Диктовать с телефона можно и без открытого браузера. Telegram-бот @VoicePalatineBot заменяет мобильную диктовку: надиктуйте голосовое, перешлите Telegram-боту – и получите текст, до 100 расшифровок в день бесплатно. По сути это и есть мобильная диктовка: вы записываете войс привычным способом, а текст для заметки или чата приходит сразу.
Кому подходит голосовой ввод
Голосовой ввод текста выручает там, где печатать руками медленно или неудобно. Диктовка онлайн помогает на ходу фиксировать голосом мысли, черновики и конспекты, а правкой готового текста заняться уже потом.
Заметки и черновики на ходу
Надиктовать голосовое и получить текст удобно, когда руки заняты или вы в дороге. Журналист, например, наговаривает черновик статьи прямо в браузере и потом редактирует готовый текст, а автор книги надиктовывает первую версию «потоком» и оставляет вычитку на потом.
Учёба и доступная альтернатива клавиатуре
Студент диктует конспект лекции, и текст печатается быстрее, чем руками. А для людей с ограничениями голосовой ввод становится доступной альтернативой клавиатуре. И там, и там диктовка снимает барьер набора и помогает записать речь в текст без лишних усилий.
В диктовке всё решает задержка. Потоковая модель Palatine распознаёт речь по мере произнесения: слова появляются на экране на лету, а не после того, как вы договорите. Пунктуацию, заглавные буквы и числа удобно расставить уже при финальной обработке, а в самом потоке текст идёт по мере речи — поэтому диктовать получается так же естественно, как говорить вслух.
Безопасность: данные в России
Обработка записей соответствует требованиям 152-ФЗ в 4 ЦОД Tier III в РФ. Данные передаются по TLS, оплата проходит картами МИР и через СБП, без VPN и зарубежных сервисов. Диктовать через сервис безопасно: записи остаются в российском контуре.
152-ФЗ и ЦОД
Серверы Palatine Speech размещены в четырёх ЦОД уровня Tier III на территории России. Обработка голоса отвечает требованиям 152-ФЗ, и данные не передаются третьим лицам. Для диктовки это значит, что ваша речь не покидает российскую инфраструктуру.
Не обучаем на ваших записях
Мы не обучаем модели на ваших записях. То, что вы надиктовали, нужно только чтобы вернуть вам текст, и больше нигде не используется. Для приватности голосового ввода это базовое требование, и мы его соблюдаем.
Точность и советы для точной диктовки
На чистом микрофоне точность распознавания достигает WAcc 92,9% (WER 7,10%). Для шумной обстановки есть отдельная модель – на шумной диктовке она удерживает точность ~90%. Качество диктовки зависит и от того, как вы говорите, поэтому несколько простых приёмов заметно улучшают результат.
WER/WAcc и модель под шум
WER (доля ошибок) и WAcc (точность слов) – это метрики качества распознавания. У Palatine Speech WER 7,10% и WAcc 92,9% на семи датасетах. Для шумной диктовки есть отдельная модель: она поднимает точность примерно до 90% и сохраняет текст разборчивым даже в неидеальных условиях.
Как говорить, чтобы распознало точнее
Советы для точной диктовки:
- Говорите ровно и в обычном темпе, без проглатывания окончаний.
- Держите микрофон ближе ко рту и убирайте лишний фоновый шум.
- Проговаривайте сложные термины и имена чётко.
- Делайте паузы там, где должны стоять точки, – так авто-пунктуация сработает аккуратнее.
Потоковое распознавание подключается в продукты через WebSocket-API от 0,29 ₽/мин – если диктовку нужно встроить в своё приложение. Попробовать диктовку и транскрибацию можно бесплатно: новым пользователям после регистрации по запросу выделяем пробные минуты, а в боте лимит обновляется каждый день.
Ответы на вопросы
Не нашли ответ на свой вопрос? Напишите нам
Как перевести голос в текст онлайн?
Нажмите «Начать диктовку», разрешите доступ к микрофону и говорите — текст печатается в реальном времени по мере речи, а пунктуацию можно навести после, при обработке. Скопировать его можно одной кнопкой.
Нужно ли устанавливать программу для диктовки?
Нет. Голосовой ввод работает в браузере на ПК и телефоне без установки программ и драйверов. Регистрация для веб-диктовки не нужна.
Расставляет ли диктовка знаки препинания?
Да. Голосовой ввод расставляет пунктуацию, заглавные буквы и числа автоматически на этапе обработки. Делайте естественные паузы там, где нужны знаки.
Какая точность распознавания голоса?
На чистом микрофоне WAcc 92,9% (WER 7,10%) по бенчмарку на семи датасетах. Для шумной диктовки отдельная модель держит точность около 90%.
Какие языки поддерживает голосовой ввод?
Около 100 языков, включая русский и языки СНГ. Язык диктовки определяется автоматически.
Можно ли диктовать с телефона?
Да. В браузере телефона работает та же диктовка, а удобнее — надиктуйте голосовое в Telegram и перешлите боту @VoicePalatineBot: 100 расшифровок в день бесплатно.
Чем диктовка отличается от транскрибации файлов?
Диктовка распознаёт живую речь в реальном времени с микрофона, а транскрибация расшифровывает уже готовые записи. Для аудио и видео используйте транскрибацию файлов на /transkribatsiya-audio-v-tekst/.
Голосовой ввод бесплатный?
Диктовку в браузере и 100 расшифровок в день в боте можно использовать бесплатно. Новым пользователям сервиса выделяем 1000 минут по запросу.
Безопасно ли диктовать через ваш сервис?
Данные обрабатываются в РФ в 4 ЦОД Tier III по 152-ФЗ, передаются по TLS. Модели на ваших записях мы не обучаем и не передаём их третьим лицам.
Что делать, если текст печатается неточно?
Говорите ровно и в обычном темпе, держите микрофон ближе, проговаривайте термины чётко и делайте паузы в местах точек — авто-пунктуация и распознавание сработают аккуратнее.