Перетащите запись звонка — или нажмите, чтобы выбратьMP3 · WAV · M4A · OGG · MP4 · до 30 минут
Пример результата – так выглядит готовая расшифровка
01:04РусскийСпикеры: 2
00:00Спикер 1

Добрый день! Подскажите, у вас транскрибация звонков идёт в реальном времени или после завершения разговора?

00:06Спикер 2

Здравствуйте! Поддерживаем оба режима: потоковый — прямо во время звонка, и пакетный — когда загружаете записи после смены.

00:13Спикер 1

Нам важно деление на спикеров и тайм-коды, чтобы видеть, где говорит оператор, а где клиент.

00:20Спикер 2

Диаризация включена по умолчанию: каждая реплика помечена спикером и временем. Дальше это можно отдавать в amoCRM по API.

00:29Спикер 1

А какая точность на телефонном канале? У нас часто шумные линии и фоновые звуки.

00:35Спикер 2

На телефонии 8 килогерц держим WER около десяти процентов, на чистом аудио — порядка семи. Есть отдельная модель под шумные каналы.

00:46Спикер 1

Хорошо, давайте запустим пилот. Сколько займёт подключение?

00:51Спикер 2

Доступ к API дам сегодня, пилот рассчитан на две недели. Пришлю ключ, документацию и расчёт по вашим восьми тысячам минут в сутки.

AI-саммари

Клиент уточняет сроки внедрения речевой аналитики в колл-центре и интеграцию с amoCRM. Менеджер подтверждает пилот на 2 недели и обещает прислать доступ к API и расчёт по 8 000 минут в сутки.

Транскрибация звонков и речевая аналитика для бизнеса

Расшифровка и аналитика звонков колл-центра под ключ: каждый разговор оператора и клиента превращается в текст по спикерам с тайм-кодами, тональностью реплик и саммари. Это речевая аналитика для бизнеса, а не синхронный перевод звонков или диктофон. Точность на телефонии ~90%, данные остаются в России (152-ФЗ).

  • Диаризация оператор/клиент
  • Тональность реплик
  • Поиск по тексту звонков
  • Телефония 8 кГц ~90%
  • Данные в РФ (152-ФЗ)
  • Интеграция в CRM
Живое демо: говорите в микрофон — распознавание идёт в реальном времени
Нажмите поле, разрешите микрофон и говорите по-русски — текст появится здесь в реальном времени
живое демо · потоковая транскрибация в реальном времени

О транскрибации и аналитике звонков

Колл-центр за смену накапливает часы записей, и вручную их не разобрать. Транскрибация звонков переводит эти разговоры в структурированный текст по спикерам, с которым уже можно работать. Для нас это история про речевую аналитику для бизнеса: мы расшифровываем телефонный разговор в текст и сразу добавляем к нему тональность и саммари. Синхронный перевод звонков на другой язык или запись диктофоном – это уже другая область, и её мы не касаемся. На канале 8 кГц Palatine Speech распознаёт телефонную речь с точностью ~90% и сам разводит оператора и клиента по ролям. Одна расшифровка звонка в текст отнимает порядка 1–2% длительности записи, поэтому тысячи звонков мы прогоняем пакетно за минуты, без дней ручной работы.

Сам по себе перевод звонков в текст – только фундамент, а речевая аналитика надстраивается уже над ним. Диаризация разводит до пяти дикторов по тайм-кодам и держится даже там, где собеседники перебивают друг друга. У каждой реплики появляется эмоциональная окраска: позитив, нейтрал или негатив. Это работа анализа тональности. Весь массив звонков индексируется, по нему идёт поиск по тексту. На этой основе анализ звонков ИИ вытаскивает отклонение от скрипта, момент, где клиент перешёл в негатив, и частоту конкретного возражения. А по упоминаниям продукта, конкурента и стоп-слов вы пройдёте сразу по всем разговорам. Диаризацию, тональность и саммари мы держим в одном продукте – у обычных транскрибаторов такой связки обычно нет. Так каждый звонок отдела продаж превращается в текст по спикерам, разбор настроения и краткую выжимку с задачами.

Дальше расшифровки в дело вступает ИИ-разбор. По каждому звонку Palatine Speech собирает саммари, выделяет договорённости оператора («прислать расчёт сегодня») и фиксирует возражения клиента – вам это пригодится, чтобы усилить скрипт продаж. Те же модели формируют саммари и протоколы разговоров, и руководитель видит сводку по отделу без ручного прослушивания записей, поэтому контроль качества звонков идёт на потоке.

Записи звонков – это персональные данные, и хранить их за рубежом рискованно. Поэтому Palatine Speech держит инфраструктуру в четырёх ЦОД уровня Tier III в России, обработка записей звонков идёт по 152-ФЗ, передача защищена TLS, а на ваших разговорах модели не обучаются. Зарубежные сервисы держат записи за границей и требуют VPN, и для контакт-центров это прямой риск по 152-ФЗ. У нас платят картами МИР, через СБП или по счёту, без VPN и иностранных банков, поэтому главного юридического риска зарубежных платформ просто не возникает. На чистом аудио точность доходит до 92,9% (WER 7,10% по бенчмарку на семи датасетах), а на телефонии работает отдельная модель под канал 8 кГц.

Весь разбор мы встраиваем в ваш существующий контур. Через speech-to-text API платформа сама забирает записи из АТС или телефонии и возвращает текст, спикеров, тональность и саммари. Готовый разбор вы получаете опросом статуса по API и выгружаете прямо в карточку сделки CRM. Тарификация поминутная, от 0,29 ₽/мин по модели pay-as-you-go, баланс при этом не сгорает. Проще всего начать с пакетной заливки архива звонков за период – так вы сразу получите структурированный разбор по всем разговорам.

Шаги внедрения речевой аналитики в колл-центре

  1. Подключите забор записей из АТС или телефонии – звонки уходят в обработку автоматически.
  2. Запишите оператора и клиента раздельными дорожками, если телефония это позволяет: диаризация оператор/клиент будет точнее.
  3. Задайте словарь продуктовых терминов и названий, чтобы они не искажались в расшифровке телефонного разговора.
  4. Определите стоп-слова и обязательные пункты скрипта – по ним ИИ проверит каждый звонок и подсветит отклонение от скрипта.
  5. Настройте выгрузку текста, спикеров, тональности и саммари в карточку сделки CRM по API.
  6. Залейте архив звонков за период пакетно и получите разбор по всему массиву разговоров.
Комментарий CEO
Телефонный звонок — это узкий канал 8 кГц, поэтому мы распознаём его отдельной моделью под телефонию и держим точность около 90% там, где универсальные движки проседают. Но главное начинается после расшифровки: диаризация оператора и клиента раскладывает разговор по ролям и даёт основу для речевой аналитики — тональности, поиска по звонкам и возврата готового разбора прямо в карточку сделки CRM.
Валерий ГречинCEO Palatine Speech

Возможности речевой аналитики звонков

Диаризация оператора и клиента, тональность реплик, поиск по тексту и интеграция разбора в CRM.

Диаризация оператор/клиент

Модель размечает до 5 дикторов по тайм-кодам, разводит оператора и клиента по ролям даже при перебивках; точнее на раздельных дорожках.

Анализ тональности

Каждая реплика получает эмоциональную окраску (позитив/нейтрал/негатив) — видно момент, где разговор «поплыл».

Поиск по тексту звонков

Весь массив расшифровок индексируется: ищите упоминания продукта, конкурента, возражений и стоп-слов по всем разговорам сразу.

Интеграция в CRM

Через speech-to-text API возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM; готовый разбор забираете опросом статуса.

Palatine Speech против ручной расшифровки и зарубежных сервисов

Сравнение по скорости, диаризации, точности на русском 8 кГц, аналитике, хранению данных и оплате.

Palatine SpeechРучная расшифровкаЗарубежные сервисы
Скорость~1–2% длительности, пакетночасы на один звонокбыстро, но через VPN
Диаризация оператор/клиентда, до 5 дикторов по тайм-кодамвручную, с ошибкамичастично, без RU-телефонии
Точность на русском 8 кГц~90%зависит от человеканиже на русском
Тональность и саммаривстроенынетдоплата/отдельный сервис
Хранение данныхв РФ, 152-ФЗу васза рубежом, риск 152-ФЗ
ОплатаМИР/СБП/счёт, без VPNоклад транскрибаторакарта иностранного банка

Скорость

Palatine Speech
~1–2% длительности, пакетно
Ручная расшифровка
часы на один звонок
Зарубежные сервисы
быстро, но через VPN

Диаризация оператор/клиент

Palatine Speech
да, до 5 дикторов по тайм-кодам
Ручная расшифровка
вручную, с ошибками
Зарубежные сервисы
частично, без RU-телефонии

Точность на русском 8 кГц

Palatine Speech
~90%
Ручная расшифровка
зависит от человека
Зарубежные сервисы
ниже на русском

Тональность и саммари

Palatine Speech
встроены
Ручная расшифровка
нет
Зарубежные сервисы
доплата/отдельный сервис

Хранение данных

Palatine Speech
в РФ, 152-ФЗ
Ручная расшифровка
у вас
Зарубежные сервисы
за рубежом, риск 152-ФЗ

Оплата

Palatine Speech
МИР/СБП/счёт, без VPN
Ручная расшифровка
оклад транскрибатора
Зарубежные сервисы
карта иностранного банка

Интеграция разбора звонков в CRM и телефонию

Забираем записи из АТС/телефонии, возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM. Опрос статуса по API и пакетная заливка архива.

  1. Интеграция в CRM и телефонию

    Забираем записи из АТС/телефонии, возвращаем текст, спикеров, тональность и саммари в карточку сделки CRM.

  2. Опрос статуса по API

    Готовность разбора вы проверяете опросом статуса по API и забираете результат в свой контур.

  3. OpenAI-совместимый API

    Диаризация, тайм-коды и тональность через speech-to-text API; документация на docs.speech.palatine.ru.

  4. Пакетная обработка звонков

    Заливаете архив звонков за период — получаете структурированный разбор по всем разговорам сразу.

Запросbash
curl https://api.palatine.ru/api/v1/transcribe/do_transcribe \
  -H "Authorization: Bearer $API_KEY" \
  -F "file=@meeting.mp3" \
  -F "language=ru" \
  -F "diarization=true"
Ответjson
{
  "task_id": "f3c1...",
  "data": {
    "language": "ru",
    "duration": 64.2,
    "text": "Добрый день! Подскажите...",
    "segments": [
      { "start": 0.4, "end": 5.8, "speaker": "speaker_0",
        "text": "Добрый день! Подскажите..." }
    ]
  }
}
Стоимость
Транскрибация
от 0,29 ₽/мин
Диаризация и тональность
включены
Доставка результата
опрос статуса по API
Документация

Ответы на вопросы

Не нашли ответ на свой вопрос? Напишите нам

Что такое транскрибация звонков и речевая аналитика?

Транскрибация переводит запись разговора в текст по спикерам с тайм-кодами. Речевая аналитика добавляет тональность реплик, поиск по тексту звонков, саммари и выделение возражений — так каждый звонок становится данными, а не просто аудио.

Какая точность расшифровки на телефонии?

На телефонном канале 8 кГц точность ~90% за счёт отдельной модели под телефонию; на чистом аудио — до 92,9% (WAcc), WER 7,10% по бенчмарку на семи датасетах.

Различает ли система оператора и клиента?

Да, диаризация размечает до пяти дикторов по тайм-кодам и разводит оператора и клиента по ролям, в том числе при перебивках. Качество выше, если стороны записаны раздельными дорожками.

Как устроен анализ тональности?

Каждая реплика получает эмоциональную окраску (позитив/нейтрал/негатив), поэтому видно, на какой минуте разговор «поплыл» и как клиент реагировал на предложение.

Можно ли интегрировать разбор в нашу CRM и телефонию?

Да. Через speech-to-text API платформа забирает записи из АТС/телефонии и возвращает текст, спикеров, тональность и саммари в карточку сделки CRM; готовность вы проверяете опросом статуса по API.

Где хранятся записи звонков — это законно по 152-ФЗ?

Записи обрабатываются в России (4 ЦОД Tier III), передаются по TLS, на них не обучаются модели и они не уходят за рубеж — это и есть требование 152-ФЗ к персональным данным.

Чем вы отличаетесь от ручной расшифровки и зарубежных сервисов?

Скоростью (~1–2% длительности против часов вручную), встроенной связкой диаризация + тональность + саммари и хранением данных в РФ. Зарубежные сервисы требуют VPN и держат записи за границей — это риск по 152-ФЗ.

Как искать по массиву звонков и контролировать скрипт?

Поиск по тексту индексирует все расшифровки: вы находите упоминания продукта, конкурента и стоп-слов по всем разговорам и видите, где операторы отклоняются от скрипта.

Сколько стоит и можно ли посчитать на нашем объёме?

Тарификация поминутная от 0,29 ₽/мин, pay-as-you-go, баланс не сгорает. Напишите ваш объём минут в поддержку — посчитаем стоимость и покажем демо на ваших записях.

Можно ли быстро проверить качество на одном звонке?

Да — пришлите запись разговора в поддержку, и мы разберём её. Для быстрой проверки на коротком файле можно прогнать один звонок через Telegram-бот @VoicePalatineBot (https://t.me/VoicePalatineBot).