Close
compare
К сравнению
Palatine Speech
Год основания: 2024
Страна происхождения: Россия
Направление: Речевые технологии
Отрасль: None

Palatine Speech

API-провайдер распознавания и анализа речи для бизнеса и продуктов, которым требуется точная и быстрая транскрибация, диаризация, синтез и обработка аудио в облаке или on-premise.
Palatine Speech — платформа распознавания речи (cloud и on-premise) для обработки аудио/видео: транскрибация с таймкодами, диаризация, суммаризация, анализ тональности, синтез речи и другие решения для обработки аудио и речи. Интеграция через API (в том числе OpenAI-совместимый интерфейс), поддержка polling/streaming, SRT/VTT и доменных словарей. Обработка в РФ и внутри периметра при on-premise.
Описание компании
Год основания: 2024
Страна происхождения: Россия
Направление: Речевые технологии
Отрасль: None
Преимущества
  • Интеграция за пару строчек кода и подробная документация
  • Обработка файлов за 1% времени от длительности файла
  • Поддержка большинства форматов аудио и файлов от 10+ часов
  • Поддержка 100+ языков и мультиязычная диаризация
  • Стабильность и SLA: предсказуемость, мониторинг и поддержка.
  • Самая низкая стоимость на рынке
Дополнительная информация

Ссылка на API-документацию: https://docs.speech.palatine.ru

Контур решения: Cloud / On-Premise / Hybrid

Клиенты: КРОК, МТС, Додо Пицца, Минпромторг, Softline, Fusara, Renairo, AiDiagnostic, Блоксели, Okko, K50, Билайн, Ренессанс страхование, Совкомбанк

Условия оплаты: None
Стоимость: Платно
Кейсы

Переход на российское облако распознавания речи, ReNairo

Решение:

ReNairo приняли решение перейти с ElevenLabs на Palatine Speech, чтобы снизить себестоимость минут распознавания при сохранении качества и без изменений в продуктовой логике. Было подключено SaaS решение Palatine Speech для распознавания речи и диаризации. Интеграция прошла через API без изменений аналитики на стороне клиента.

Результаты:

Качество распознавания и диаризации сохранилось на прежнем уровне. Диаризация стала надежнее в диалогах с перебиваниями и паузами. Себестоимость минуты снизилась на 40% по сравнению с предыдущим поставщиком. Весь переход занял около одного часа – от первых тестов до запуска в рабочем контуре.


Голосовая диктовка и структурированные заключения радиолога, AIDiagnostic

Решение:

Для платформы AIDiagnostic было развернуто on-premise решение Palatine Speech в десятках клиник. Врачи диктуют описание исследований голосом, система выполняет распознавание речи, автоматически расставляет пунктуацию, подставляет данные в шаблоны и формирует черновик заключения. Дополнительно был реализован LLM-агент, который собирает структурированное заключение из диктовки.

Результаты:

Сократилось время рутинной работы с текстом. В сумме освобождается порядка 40–70 минут на смену. В результате уменьшая рутину и правки, давая возможность уделять больше внимания сложным случаям и пациентам.

Где и как применять

Анализ и обработка аудио и видео: транскрибация звонков, встреч, интервью и медицинских диктовок, разделение по спикерам, формирование текстовых протоколов и отчетов.


Рабочие сценарии: автоматическая обработка записей колл-центров и продаж, контроль качества коммуникаций, суммаризация разговоров для руководителей, голосовая диктовка заключений и протоколов, подготовка черновиков документов и отчетов.


Интеграция: подключение через REST API (в том числе OpenAI-совместимый интерфейс), polling-механизм для длинных записей и streaming для онлайн-сценариев; интеграция с CRM, аналитическими платформами. Возможны облачное (SaaS) и on-premise развертывания.

Кому подойдет:

1. Разработчикам и продуктовым командам, когда надо за пару дней добавить в продукт транскрибацию, диаризацию по спикерам, таймкоды, саммари и аналитику.

2. Стартапам и SaaS-сервисам, чтобы быстро проверить гипотезу, сделать MVP и масштабироваться по мере роста: от десятков часов в неделю до больших потоков без смены поставщика.

3. Контакт-центрам и отделам продаж/поддержки для контроля качества разговоров, поиска ключевых фраз, оценки тональности.

4. Компаниям с требованиями к безопасности и контуру. Для этого есть вариант on-premise развертывания, когда аудио и результаты должны оставаться внутри инфраструктуры: для закрытых сетей, комплаенса и внутренних регламентов.

FAQ
Что такое Palatine Speech и чем он полезен бизнесу?
Palatine Speech – API для распознавания и анализа речи: транскрибация, диаризация, саммари, тональность и синтез речи. Подходит для звонков, совещании, медиа и любых продуктов, где нужен быстрыи текст и инсайты из аудио.
Поддерживаете ли вы потоковое распознавание речи в реальном времени и что еще доступно в результатах вывода?
Да, есть потоковое распознавание для звонков и live-сценариев. Вы получаете текст по мере речи, с таймкодами и возможностью собирать итоговое саммари после завершения диалога. Помимо текста доступны таймкоды, разбиение по спикерам, сегменты, уверенность, а также саммари и извлеченные пункты: решения, задачи, вопросы, важные моменты, это удобно для CRM и отчетов.
Как обеспечивается безопасность данных?
Все данные хранятся и обрабатываются на серверах в Российской Федерации в соответствии с 152-ФЗ. Мы не передаем данные третьим лицам и не используем их для обучения моделей без вашего явного согласия.
Как устроена оплата и как посчитать стоимость распознавания?
Стоимость обычно считается по минутам/часам аудио или по потоку для real-time. Для enterprise возможны индивидуальные условия, SLA и on-premise лицензирование – под вашу нагрузку и требования к контуру.
6
Подберем решение!
Chat icon