Опубликовано 25.06.2026

Перетащите запись звонка — или нажмите, чтобы выбратьMP3 · WAV · M4A · OGG · MP4 · до 30 минут

Пример результата – так выглядит готовая расшифровка

⏱ 01:04РусскийСпикеры: 2

00:00Спикер 1

Добрый день! Подскажите, у вас транскрибация звонков идёт в реальном времени или после завершения разговора?

00:06Спикер 2

Здравствуйте! Поддерживаем оба режима: потоковый — прямо во время звонка, и пакетный — когда загружаете записи после смены.

00:13Спикер 1

Нам важно деление на спикеров и тайм-коды, чтобы видеть, где говорит оператор, а где клиент.

00:20Спикер 2

Диаризация включена по умолчанию: каждая реплика помечена спикером и временем. Дальше это можно отдавать в amoCRM по API.

00:29Спикер 1

А какая точность на телефонном канале? У нас часто шумные линии и фоновые звуки.

00:35Спикер 2

На телефонии 8 килогерц держим WER около десяти процентов, на чистом аудио — порядка семи. Есть отдельная модель под шумные каналы.

00:46Спикер 1

Хорошо, давайте запустим пилот. Сколько займёт подключение?

00:51Спикер 2

Доступ к API дам сегодня, пилот рассчитан на две недели. Пришлю ключ, документацию и расчёт по вашим восьми тысячам минут в сутки.

AI-саммари

Клиент уточняет сроки внедрения речевой аналитики в колл-центре и интеграцию с amoCRM. Менеджер подтверждает пилот на 2 недели и обещает прислать доступ к API и расчёт по 8 000 минут в сутки.

Транскрибация звонков и речевая аналитика для бизнеса

Расшифровка и аналитика звонков колл-центра под ключ: каждый разговор оператора и клиента превращается в текст по спикерам с тайм-кодами, тональностью реплик и саммари. Это речевая аналитика для бизнеса, а не синхронный перевод звонков или диктофон. Точность на телефонии ~90%, данные остаются в России (152-ФЗ).

Диаризация оператор/клиент
Тональность реплик
Поиск по тексту звонков
Телефония 8 кГц ~90%
Данные в РФ (152-ФЗ)
Интеграция в CRM

Живое демо: говорите в микрофон — распознавание идёт в реальном времени

Нажмите поле, разрешите микрофон и говорите по-русски — текст появится здесь в реальном времени

живое демо · потоковая транскрибация в реальном времени

О транскрибации и аналитике звонков

Колл-центр за смену накапливает часы записей, и вручную их не разобрать. Транскрибация звонков переводит эти разговоры в структурированный текст по спикерам, с которым уже можно работать. Для нас это история про речевую аналитику для бизнеса: мы расшифровываем телефонный разговор в текст и сразу добавляем к нему тональность и саммари. Синхронный перевод звонков на другой язык или запись диктофоном – это уже другая область, и её мы не касаемся. На канале 8 кГц Palatine Speech распознаёт телефонную речь с точностью ~90% и сам разводит оператора и клиента по ролям. Одна расшифровка звонка в текст отнимает порядка 1–2% длительности записи, поэтому тысячи звонков мы прогоняем пакетно за минуты, без дней ручной работы.

Сам по себе перевод звонков в текст – только фундамент, а речевая аналитика надстраивается уже над ним. Диаризация разводит до пяти дикторов по тайм-кодам и держится даже там, где собеседники перебивают друг друга. У каждой реплики появляется эмоциональная окраска: позитив, нейтрал или негатив. Это работа анализа тональности. Весь массив звонков индексируется, по нему идёт поиск по тексту. На этой основе анализ звонков ИИ вытаскивает отклонение от скрипта, момент, где клиент перешёл в негатив, и частоту конкретного возражения. А по упоминаниям продукта, конкурента и стоп-слов вы пройдёте сразу по всем разговорам. Диаризацию, тональность и саммари мы держим в одном продукте – у обычных транскрибаторов такой связки обычно нет. Так каждый звонок отдела продаж превращается в текст по спикерам, разбор настроения и краткую выжимку с задачами.

Дальше расшифровки в дело вступает ИИ-разбор. По каждому звонку Palatine Speech собирает саммари, выделяет договорённости оператора («прислать расчёт сегодня») и фиксирует возражения клиента – вам это пригодится, чтобы усилить скрипт продаж. Те же модели формируют саммари и протоколы разговоров, и руководитель видит сводку по отделу без ручного прослушивания записей, поэтому контроль качества звонков идёт на потоке.

Записи звонков – это персональные данные, и хранить их за рубежом рискованно. Поэтому Palatine Speech держит инфраструктуру в четырёх ЦОД уровня Tier III в России, обработка записей звонков идёт по 152-ФЗ, передача защищена TLS, а на ваших разговорах модели не обучаются. Зарубежные сервисы держат записи за границей и требуют VPN, и для контакт-центров это прямой риск по 152-ФЗ. У нас платят картами МИР, через СБП или по счёту, без VPN и иностранных банков, поэтому главного юридического риска зарубежных платформ просто не возникает. На чистом аудио точность доходит до 92,9% (WER 7,10% по бенчмарку на семи датасетах), а на телефонии работает отдельная модель под канал 8 кГц.

Весь разбор мы встраиваем в ваш существующий контур. Через speech-to-text API платформа сама забирает записи из АТС или телефонии и возвращает текст, спикеров, тональность и саммари. Готовый разбор вы получаете опросом статуса по API и выгружаете прямо в карточку сделки CRM. Тарификация поминутная, от 0,29 ₽/мин по модели pay-as-you-go, баланс при этом не сгорает. Проще всего начать с пакетной заливки архива звонков за период – так вы сразу получите структурированный разбор по всем разговорам.

Шаги внедрения речевой аналитики в колл-центре

Подключите забор записей из АТС или телефонии – звонки уходят в обработку автоматически.
Запишите оператора и клиента раздельными дорожками, если телефония это позволяет: диаризация оператор/клиент будет точнее.
Задайте словарь продуктовых терминов и названий, чтобы они не искажались в расшифровке телефонного разговора.
Определите стоп-слова и обязательные пункты скрипта – по ним ИИ проверит каждый звонок и подсветит отклонение от скрипта.
Настройте выгрузку текста, спикеров, тональности и саммари в карточку сделки CRM по API.
Залейте архив звонков за период пакетно и получите разбор по всему массиву разговоров.

Комментарий CEO

Телефонный звонок — это узкий канал 8 кГц, поэтому мы распознаём его отдельной моделью под телефонию и держим точность около 90% там, где универсальные движки проседают. Но главное начинается после расшифровки: диаризация оператора и клиента раскладывает разговор по ролям и даёт основу для речевой аналитики — тональности, поиска по звонкам и возврата готового разбора прямо в карточку сделки CRM.

Валерий ГречинCEO Palatine Speech

Возможности речевой аналитики звонков

Диаризация оператора и клиента, тональность реплик, поиск по тексту и интеграция разбора в CRM.

Диаризация оператор/клиент

Модель размечает до 5 дикторов по тайм-кодам, разводит оператора и клиента по ролям даже при перебивках; точнее на раздельных дорожках.

Анализ тональности

Каждая реплика получает эмоциональную окраску (позитив/нейтрал/негатив) — видно момент, где разговор «поплыл».

Поиск по тексту звонков

Весь массив расшифровок индексируется: ищите упоминания продукта, конкурента, возражений и стоп-слов по всем разговорам сразу.

Интеграция в CRM

Через speech-to-text API возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM; готовый разбор забираете опросом статуса.

Palatine Speech против ручной расшифровки и зарубежных сервисов

Сравнение по скорости, диаризации, точности на русском 8 кГц, аналитике, хранению данных и оплате.

	Palatine Speech	Ручная расшифровка	Зарубежные сервисы
Скорость	~1–2% длительности, пакетно	часы на один звонок	быстро, но через VPN
Диаризация оператор/клиент	да, до 5 дикторов по тайм-кодам	вручную, с ошибками	частично, без RU-телефонии
Точность на русском 8 кГц	~90%	зависит от человека	ниже на русском
Тональность и саммари	встроены	нет	доплата/отдельный сервис
Хранение данных	в РФ, 152-ФЗ	у вас	за рубежом, риск 152-ФЗ
Оплата	МИР/СБП/счёт, без VPN	оклад транскрибатора	карта иностранного банка

Скорость

Palatine Speech: ~1–2% длительности, пакетно
Ручная расшифровка: часы на один звонок
Зарубежные сервисы: быстро, но через VPN

Диаризация оператор/клиент

Palatine Speech: да, до 5 дикторов по тайм-кодам
Ручная расшифровка: вручную, с ошибками
Зарубежные сервисы: частично, без RU-телефонии

Точность на русском 8 кГц

Palatine Speech: ~90%
Ручная расшифровка: зависит от человека
Зарубежные сервисы: ниже на русском

Тональность и саммари

Palatine Speech: встроены
Ручная расшифровка: нет
Зарубежные сервисы: доплата/отдельный сервис

Хранение данных

Palatine Speech: в РФ, 152-ФЗ
Ручная расшифровка: у вас
Зарубежные сервисы: за рубежом, риск 152-ФЗ

Оплата

Palatine Speech: МИР/СБП/счёт, без VPN
Ручная расшифровка: оклад транскрибатора
Зарубежные сервисы: карта иностранного банка

Интеграция разбора звонков в CRM и телефонию

Забираем записи из АТС/телефонии, возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM. Опрос статуса по API и пакетная заливка архива.

Интеграция в CRM и телефонию
Забираем записи из АТС/телефонии, возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM.
Опрос статуса по API
Готовность разбора вы проверяете опросом статуса по API и забираете результат в свой контур.
OpenAI-совместимый API
Диаризация, тайм-коды и тональность через speech-to-text API; документация на docs.speech.palatine.ru.
Пакетная обработка звонков
Заливаете архив звонков за период — получаете структурированный разбор по всем разговорам сразу.

Запросbash

curl https://api.palatine.ru/api/v1/transcribe/do_transcribe \
  -H "Authorization: Bearer $API_KEY" \
  -F "file=@meeting.mp3" \
  -F "language=ru" \
  -F "diarization=true"

Ответjson

{
  "task_id": "f3c1...",
  "data": {
    "language": "ru",
    "duration": 64.2,
    "text": "Добрый день! Подскажите...",
    "segments": [
      { "start": 0.4, "end": 5.8, "speaker": "speaker_0",
        "text": "Добрый день! Подскажите..." }
    ]
  }
}

Стоимость

Транскрибация: от 0,29 ₽/мин
Диаризация и тональность: включены
Доставка результата: опрос статуса по API

Документация

Ответы на вопросы

Не нашли ответ на свой вопрос? Напишите нам

Что такое транскрибация звонков и речевая аналитика?

Транскрибация переводит запись разговора в текст по спикерам с тайм-кодами. Речевая аналитика добавляет тональность реплик, поиск по тексту звонков, саммари и выделение возражений — так каждый звонок становится данными, а не просто аудио.

Какая точность расшифровки на телефонии?

На телефонном канале 8 кГц точность ~90% за счёт отдельной модели под телефонию; на чистом аудио — до 92,9% (WAcc), WER 7,10% по бенчмарку на семи датасетах.

Различает ли система оператора и клиента?

Да, диаризация размечает до пяти дикторов по тайм-кодам и разводит оператора и клиента по ролям, в том числе при перебивках. Качество выше, если стороны записаны раздельными дорожками.

Как устроен анализ тональности?

Каждая реплика получает эмоциональную окраску (позитив/нейтрал/негатив), поэтому видно, на какой минуте разговор «поплыл» и как клиент реагировал на предложение.

Можно ли интегрировать разбор в нашу CRM и телефонию?

Да. Через speech-to-text API платформа забирает записи из АТС/телефонии и возвращает текст, спикеров, тональность и саммари в карточку сделки CRM; готовность вы проверяете опросом статуса по API.

Где хранятся записи звонков — это законно по 152-ФЗ?

Записи обрабатываются в России (4 ЦОД Tier III), передаются по TLS, на них не обучаются модели и они не уходят за рубеж — это и есть требование 152-ФЗ к персональным данным.

Чем вы отличаетесь от ручной расшифровки и зарубежных сервисов?

Скоростью (~1–2% длительности против часов вручную), встроенной связкой диаризация + тональность + саммари и хранением данных в РФ. Зарубежные сервисы требуют VPN и держат записи за границей — это риск по 152-ФЗ.

Как искать по массиву звонков и контролировать скрипт?

Поиск по тексту индексирует все расшифровки: вы находите упоминания продукта, конкурента и стоп-слов по всем разговорам и видите, где операторы отклоняются от скрипта.

Сколько стоит и можно ли посчитать на нашем объёме?

Тарификация поминутная от 0,29 ₽/мин, pay-as-you-go, баланс не сгорает. Напишите ваш объём минут в поддержку — посчитаем стоимость и покажем демо на ваших записях.

Можно ли быстро проверить качество на одном звонке?

Да — пришлите запись разговора в поддержку, и мы разберём её. Для быстрой проверки на коротком файле можно прогнать один звонок через Telegram-бот @VoicePalatineBot (https://t.me/VoicePalatineBot).

Транскрибация звонков и речевая аналитика для бизнеса

О транскрибации и аналитике звонков

Шаги внедрения речевой аналитики в колл-центре

Диаризация оператор/клиент

Анализ тональности

Поиск по тексту звонков

Интеграция в CRM

Скорость

Диаризация оператор/клиент

Точность на русском 8 кГц

Тональность и саммари

Хранение данных

Оплата

Интеграция в CRM и телефонию

Опрос статуса по API

OpenAI-совместимый API

Пакетная обработка звонков