Palatine
Speech

Palatine
Speech

API-провайдер моделей ИИ для комплексной
обработки речи в России

  • 0,3 ₽/мин. или дешевле за распознавание речи
  • Обрабатываем 10 млн минут аудио ежедневно
КРОК
МТС
ДОДО ПИЦЦА
Министерство промышленности и торговли
Softline
АВТОРИБОР
КРОК
МТС
ДОДО ПИЦЦА
Министерство промышленности и торговли
Softline
АВТОРИБОР
КРОК
МТС
ДОДО ПИЦЦА
Министерство промышленности и торговли
Softline
АВТОРИБОР

Распознавание речи (Speech-to-Text)

  • ЗвездочкаТаймкоды для каждого слова
  • ЗвездочкаПоддержка Х файловых форматов
  • ЗвездочкаПоддержка 57 языков
  • ЗвездочкаАвтоопределение языка
  • ЗвездочкаПоддержка 2-х форматов API, в том числе OpenAI
  • ЗвездочкаПолучение результата в потоковом режиме
  • ЗвездочкаПодключение VAD при необходимости

Диаризация (разделение спикеров)

  • ЗвездочкаТочность определения спикеров
  • ЗвездочкаАктивная голосовая сегментация
  • ЗвездочкаЗагрузка кастомных моделей
  • ЗвездочкаПоддержка многоканального аудио
  • ЗвездочкаМетки времени для каждого спикера
  • ЗвездочкаТаймкоды для каждого слова
  • ЗвездочкаПоддержка группового разговора
  • ЗвездочкаАналитика участников разговора

Наши преимущества

Точность

Высокая точность в сравнении с мировыми конкурентами. Достигнуто за счет обучения модели на 700 000 часах аудио, а расчеты метрик произведены на 7 датасетах

92.9%Average Word Accuracy (WAcc)
7.1%Average WER (Word Error Rate)
Elevenlabs / eleven-vl
6.88
Elevenlabs / eleven-vl
Assembly_best / AssemblyAI
7.03
Assembly_best / AssemblyAI
Palatine / palatine_speech
7.10
Palatine / palatine_speech
Openai / whisper-large-v3
7.44
Openai / whisper-large-v3
Distil-large / distil-large-v3
7.52
Distil-large / distil-large-v3
Facebook / wav2vec2-large-960h-lv60-self
21.27
Facebook / wav2vec2-large-960h-lv60-self

Скорость

За счет использования современных графических процессоров и методов оптимизации нейронных сетей: дистилляции, прунинга и квантизации

1–2%Время распознавания от общей длительности файла
25 сек.Средняя задержка в получении результатов для 30 минут аудиофайла
AssemblyAI
14c
AssemblyAI
Palatine Speech
25c
Palatine Speech
Yandex SpeechKit
Yandex SpeechKit
OpenAI
10м
OpenAI
Google Cloud
15м
Google Cloud
Длительность файла
30м
Длительность файла
shield
Надёжность

Надёжность

  • Наша инфраструктура серверов расположена в 4 географических ЦОД уровня Tier III с отказоустойчивостью 99.982%.
  • В случае любых инцидентов трафик автоматически переключается на резервные узлы
lock
Безопасность

Безопасность данных

  • Серверы обработки находятся в РФ, и все данные передаются по защищенным каналам в соответствии с 152-ФЗ РФ.
  • Мы не обучаем модели на ваших данных, не передаём, не храним и не анализируем их.
  • При работе с API используется TLS шифрование данных
heart
Комфорт

Удобство использования

  • Всегда актуальная документация и понятные Rate Limits.
  • Подробные описания ошибок и понятные списки.
  • Баланс без подписок, он не истощается с течением времени.
  • Секунды обработки округляются в меньшую сторону.
  • Оперативная поддержка в телеграм и на почте

Как это работает

Интеграция голосовых функций в платформы колл-центров, AI-агентов или других приложений часто сопряжена со сложностями

Но это не обязательно должно быть так. Вот как можно интегрировать голосовые технологии в ваш продукт

star
Шаг 1

Получите API-токен

Свяжитесь с нами любым удобным способом и получите API ключ для выполнения запросов к сервису

API Key Code
star
Шаг 2

Отправьте запрос

В OpenAI-совместимом интерфейсе, всего лишь заменив base_url при инициализации

OpenAI Integration Code
star
Шаг 3

Получите результаты

Выбрав подходящий вам формат ответа, вместе с тайм-кодами для каждого слова и другими данными

Results Code

Возможности бизнеса с речевым ИИ

Основателям и разработчикам

Приложения и стартапы

Легко интегрируйте наши решения в свои прототипы и продукты. Подойдёт и для тестирования гипотез, и для постоянного использования в стабильных сервисах

Тарифы

singleДля стартапов

Стандартный

Для старта и проверки работы

  • 1000 бесплатных минут
  • Доступ ко всем моделям ИИ
  • Поддержка по почте и telegram в течение 1-4 часов
  • Стриминговая и отложенная обработка
  • Возможность участия в референсной программе
multipleДля корпораций

On-Premise

Все, что включено в Корпоративный тариф

  • Локальное развертывание моделей, работа в офлайн режиме без доступа к сети Интернет
  • Возможность автомасштабирования в случае низкой нагрузки для экономии ресурсов
  • Кастомизация решения и разработка специальных интеграций с внутренними сервисами
  • Бесплатная корпоративная поддержка

Ответы на вопросы

Palatine Speech — это облачная платформа для работы с голосовыми и речевыми моделями искусственного интеллекта, предоставляющая API для: • транскрипации аудио и видео в текст • диаризации (разделения и распознавания отдельных говорящих) • синтеза речи из текста • и других задач обработки звуковых данных.