Саммари и конспект из видео и аудио нейросетью
Загрузите запись лекции, встречи, подкаста или видео – нейросеть Palatine расшифрует её и сделает готовое саммари: краткое содержание, тезисы, протокол с решениями и список задач. Не просто текст, а результат, который можно сразу использовать.
- Транскрибация + суммаризация
- Точность 92,9%
- Тезисы и action items
- Тайм-коды и спикеры
- AI-чат по записи
- 152-ФЗ · данные в РФ
Загрузите запись – нейросеть Palatine Speech сделает саммари и конспект из видео и аудио. На входе лекция, встреча, подкаст или видео. На выходе готовый результат поверх транскрипта: обработанный конспект, без голой расшифровки. Работаем мы именно с вашей загруженной записью – звук берём из вашего файла, не из готового текста или презентации. Внутри две модели в одной цепочке: ASR распознаёт речь, дальше модель суммаризации сворачивает транскрипт в структурированный конспект.
Что выдаёт нейросеть: саммари, тезисы, протокол, задачи
Сервис выдаёт краткое содержание, тезисы, протокол с решениями и action items – готовый результат, который вы сразу пускаете в дело.
Краткое содержание и тезисы
Краткое содержание – это запись, ужатая до 3–5 предложений: о чём вообще шла речь на лекции или встрече, без воды. Тут же, рядом, ключевые тезисы – списком, разбитые на подзаголовки по темам. А под капотом всё это собирает модель суммаризации: она сворачивает транскрипт в структурированный конспект на чистом тексте, и часовая запись превращается в понятный видео конспект вместо стены слов.
Протокол с решениями и action items
Для встреч у сервиса есть протокол с решениями – видно, кто что предложил и что в итоге приняли. Спикеров по тайм-кодам размечает диаризация, поэтому протокол помнит, кто именно что сказал. Рядом лежат action items: список конкретных дел с исполнителями, готовый to-do прямо из разговора. И вот так резюме встречи становится рабочим документом, который вы рассылаете участникам.
AI-чат по записи
AI-чат по записи отвечает на вопросы по содержимому и даёт ссылку на тайм-код в транскрипте. Спросите «что решили по бюджету?» или «перечисли возражения клиента» – ответ придёт с указанием места в записи, и пролистывать её целиком вам не нужно.
Как сделать конспект из видео или аудио
Чтобы сделать конспект, вам не нужно копировать текст между сервисами – всё происходит в одном окне.
Загрузка файла записи
Загрузите файл (MP4, MOV, MP3, WAV, M4A, OGG) – звук мы извлечём автоматически. Так вы получаете и пересказ видео, и краткое содержание видео с ютуба: загрузили запись, забрали тезисы. Это конспект из видео, собранный нейросетью без ручной расшифровки.
Три шага: запись → распознавание → саммари
Чтобы получить готовый конспект, пройдите три шага:
- Запись – загрузите файл лекции или встречи.
- Распознавание – ASR-движок расшифровывает речь и размечает спикеров по тайм-кодам.
- Саммари – модель сворачивает транскрипт в краткое содержание, тезисы, протокол и action items.
Транскрибация и суммаризация в одном сервисе
Цепочка объединяет транскрибацию и суммаризацию в одном сервисе: вы не переносите текст из одного инструмента в другой.
Две модели в одной цепочке
Сначала ASR-движок Palatine Speech распознаёт речь, затем модель суммаризации сворачивает транскрипт в конспект – это генератор конспектов на двух моделях. Из полуторачасовой лекции выходит конспект на одну страницу, и копировать между сервисами вам не приходится. Нужна только расшифровка? Тогда отдельно доступна транскрибация аудио или видео в текст.
Точность распознавания = качество саммари
Точность распознавания напрямую задаёт качество саммари. ASR-движок Palatine Speech распознаёт русскую речь с точностью WAcc 92,9% (WER 7,10%) по бенчмарку на семи датасетах – точнее Whisper-large-v3 с его 7,44%. На чистом транскрипте нейросеть строит конспект без ошибок распознавания, так что тезисы и решения не искажаются. Онлайн-суммаризаторы видео из выдачи берут готовые субтитры чужого ролика, а мы распознаём именно ваш файл – со своей диаризацией и протоколом.
Саммари у нас не пересказ «по мотивам», а выжимка поверх точной расшифровки: сначала ASR распознаёт вашу запись с точностью 92,9%, и только на чистом транскрипте собирается конспект. Поэтому каждый тезис и каждый action item привязаны к конкретному спикеру и тайм-коду — их можно проверить в записи, а не принимать на веру.
Кому подходит: лекции, встречи, подкасты, интервью
Саммари из видео и аудио закрывает разные сценарии – от учёбы до деловых созвонов.
Студенты и преподаватели (конспект лекции)
Студенты получают конспект лекции нейросетью вместо ручной писанины. Загрузили запись пары на 1,5 часа – забрали конспект на одну страницу с тезисами и тайм-кодами. Готовый конспект экономит вам время: переслушивать всю запись не нужно.
Команды (протокол встречи)
Команды загружают созвон в Zoom или Telemost и получают протокол встречи со спикерами, решениями и action items. Это саммари встречи, которое вы сразу рассылаете участникам. Для звонков с решениями у нас есть отдельная страница – протоколы звонков.
Контент и журналисты
Контент-мейкеры загружают ролик и получают пересказ ютуб видео с тезисами для постов и описаний. Журналисты собирают саммари длинных интервью и пресс-конференций: главные цитаты и факты, без прослушивания записи целиком.
Форматы, языки и длинные записи
Сервис принимает видео и аудио, работает с записями на несколько часов.
Видео/аудио на входе, выгрузка DOCX/TXT/MD
Сервис принимает MP4, MOV, MP3, WAV, M4A, OGG – звук извлекаем автоматически. Транскрипт и саммари вы выгружаете в DOCX, TXT и Markdown, для видео есть субтитры SRT/VTT. Любой результат копируется в один клик.
~100 языков и записи на 1,5–3 часа
Суммаризация работает на ~100 языках, включая русский и языки СНГ. Язык записи мы определяем автоматически, и конспект формируется на языке записи. Лекцию или встречу на 1,5–3 часа сервис обрабатывает за минуты – скорость около ~1–2% длительности файла.
Безопасность: данные в России
Записи лекций и встреч мы обрабатываем в России – без передачи третьим лицам.
152-ФЗ и 4 ЦОД Tier III
Записи мы обрабатываем по 152-ФЗ в 4 ЦОД уровня Tier III в РФ. Передача идёт по TLS, а оплата проходит картами МИР и через СБП, без VPN.
Не обучаем модели на ваших записях
Мы не обучаем модели на ваших записях. Загруженные файлы идут только на то, чтобы сделать вам саммари и конспект, и третьим лицам мы их не отдаём. Короткую запись или войс быстрее расшифровать в Telegram-боте – а длинные лекции и встречи с саммари вы обрабатываете через аплоадер на странице.
Ответы на вопросы
Не нашли ответ на свой вопрос? Напишите нам
Чем саммари отличается от обычной расшифровки?
Расшифровка — это полный текст записи слово в слово. Саммари — готовый результат поверх него: краткое содержание, тезисы, протокол с решениями и список задач. Palatine делает и то, и другое в одном сервисе.
Как сделать конспект лекции из видео или аудио?
Загрузите файл лекции, нейросеть распознает речь и соберёт конспект с тезисами и тайм-кодами. Полуторачасовая лекция превращается в конспект на одну страницу за минуты.
Делает ли нейросеть протокол встречи с решениями?
Да. Для совещаний формируется протокол со спикерами, принятыми решениями и action items — кто что предложил и что решили. Удобно рассылать участникам после созвона.
Что такое AI-чат по записи?
Это функция, в которой вы задаёте вопросы содержимому записи («что решили по срокам?», «перечисли возражения») и получаете ответ со ссылкой на тайм-код в транскрипте.
Какие форматы видео и аудио поддерживаются?
MP4, MOV, MP3, WAV, M4A, OGG — звук извлекается автоматически. Транскрипт и саммари выгружаются в DOCX, TXT и Markdown, для видео есть субтитры SRT/VTT.
Насколько точны конспект и тезисы?
Качество саммари зависит от распознавания: точность на русском — 92,9% (WER 7,10%). Нейросеть строит конспект на чистом транскрипте, поэтому ошибки распознавания не попадают в тезисы и решения.
Сколько стоит саммари из записи и есть ли бесплатно?
Новым пользователям 1000 минут выделяем по запросу. Дальше — от 0,29 ₽ за минуту по pay-as-you-go: транскрибация и суммаризация в одном процессе, баланс не сгорает.
Можно ли сделать конспект из видео с YouTube или по ссылке?
Скачайте ролик с YouTube и загрузите файл — сервис извлечёт звук, распознает речь и сделает пересказ с тезисами и тайм-кодами. Напрямую по ссылке мы пока не забираем видео, поэтому сначала сохраните его себе.
На каких языках работает суммаризация?
Поддерживается ~100 языков, включая русский и языки СНГ; язык записи определяется автоматически, конспект формируется на языке записи.
Безопасно ли загружать записи лекций и встреч?
Данные обрабатываются в РФ по 152-ФЗ в 4 ЦОД Tier III, передаются по TLS, на них не обучаются модели. Записи не передаются третьим лицам.