Распознавание речи на 37 языках

ПРОГРАММНЫЙ КОМПЛЕКС ОБРАБОТКИ МУЛЬТИМЕДИЙНЫХ ДАННЫХ

ASM_STT.

Версия 1

включен в Единый реестр российских программ для ЭВМ и БД

ВОЗМОЖНОСТИ

Транскрибирование (распознавание) речи на 50 языках

Синтез речи

Голосовая биометрия

Идентификация языков

Диаризация (разделение дикторов в моно-канале)

Детектор голосовой активности (VAD)

Адаптация моделей распознавания речи конечным пользователем

разделение на фиксированное или произвольное количество дикторов

поддержка SSML

пунктуационная паузация

изменение тембра произнесения

чтение сокращений, дат, валют и другое

изменение скорости воспроизведения без изменения тембра

расстановка ударений исходя из контекста (снятие омографов)

поддержка различных аудиоканалов (телефон, ближний микрофон)

Определение технических характеристик

просмотр и модификация списка слов и транскрипций

ручное добавление новых слов

модификация языковых вероятностей отдельных слов

автоматизированное расширение словаря и перестроение лингвистической модели по текстам

расстановка знаков препинания

время начала и конца произнесения каждого слова
несколько возможных гипотез распознавания фраз

уровень уверенности распознавания каждого слова

уровень уверенности распознавания фразы

постобработка результатов распознавания (преобразование слов в цифры, капитализация)

более 100 языков
от 3 секунд речи

наличие в сигнале специфических шумов (гудки, автоинформатор, шум и другие)

качество речевого сигнала

точность идентификации в телефонном канале выше 98%

возрастная категория (взрослый, ребенок)

пол диктора

длительность речи в сигнале

от 3 секунд речи

создание моделей по нескольким образцам речи

anti-spoofing (определение подделки голоса)

50 ЯЗЫКОВ РАСПОЗНАВАНИЯ РЕЧИ

1. Азербайджанский язык
2. Английский язык
3. Арабский язык, левантийский диалект
4. Арабский язык, диалект регионов Палестины и Туниса
5. Арабский язык, иракский диалект
6. Арабский язык, современный стандартный арабский (msa)
7. Арабский язык, египетский диалект
8. Арабский язык, марокканский диалект
9. Арабский язык, алжирский диалект
10. Арабский язык, ливийский диалект
11. Арабский язык, суданский диалект
12. Армянский язык
13. Африкаанс
14. Болгарский язык
15. Вьетнамский язык
16. Грузинский язык
17. Дари
18. Иврит
19. Испанский язык
20. Итальянский язык
21. Казахский язык
22. Киргизский язык
23. Китайский язык
24. Корейский язык
25. Курдский язык (диалект Курманджи)

26. Курдский язык (диалект Сорани)
27. Латышский язык
28. Литовский язык
29. Монгольский язык
30. Немецкий язык
31. Польский язык
32. Португальский язык
33. Пушту
34. Румынский язык
35. Русский язык
36. Таджикский язык
37. Турецкий язык
38. Туркменский язык
39. Узбекский язык
40. Украинский язык
41. Украинский язык, суржик
42. Урду
43. Чешский язык
44. Персидский язык (Фарси)
45. Финский язык
46. Французский язык
47. Хинди
48. Хорватский язык
49. Эстонский язык
50. Японский язык

1. Азербайджанский язык
2. Английский язык
3. Арабский язык, левантийский диалект
4. Арабский язык, диалект регионов Палестины и Туниса
5. Арабский язык, иракский диалект
6. Арабский язык, современный стандартный арабский (msa)
7. Арабский язык, египетский диалект
8. Арабский язык, марокканский диалект
9. Арабский язык, алжирский диалект
10. Арабский язык, ливийский диалект
11. Арабский язык, суданский диалект
12. Армянский язык
13. Африкаанс
14. Болгарский язык
15. Вьетнамский язык
16. Грузинский язык
17. Дари
18. Иврит
19. Испанский язык
20. Итальянский язык
21. Казахский язык
22. Киргизский язык
23. Китайский язык
24. Корейский язык
25. Курдский язык (диалект Курманджи)
26. Курдский язык (диалект Сорани)
27. Латышский язык
28. Литовский язык
29. Монгольский язык
30. Немецкий язык
31. Польский язык
32. Португальский язык
33. Пушту
34. Румынский язык
35. Русский язык
36. Таджикский язык
37. Турецкий язык
38. Туркменский язык
39. Узбекский язык
40. Украинский язык
41. Украинский язык, суржик
42. Урду
43. Чешский язык
44. Персидский язык (Фарси)
45. Финский язык
46. Французский язык
47. Хинди
48. Хорватский язык
49. Эстонский язык
50. Японский язык
ОТЛИЧИТЕЛЬНЫЕ ОСОБЕННОСТИ

Облако и on-premise (работает в периметре заказчика и в облаке)

Кроссплатформенность (Ubuntu, Centos, RHEL, Astra Linux, Windows и другие)

Горизонтальное и вертикальное масштабирование

Высокоскоростной декодер для CPU и GPU

Обработка больших объемов речевой информации

Поддержка протоколов REST API, MRCP, GRPC, XML RPC

Вся функциональность доступна через API

Большой объем и разнообразие обучающих выборок (тысячи часов речи)

Обработка звуковых- и видеофайлов различных форматов, любого объема и качества

Быстрая интеграция API

Качественное выполнение работ в сжатые сроки

Прямая связь с разработчиками

Поддержка на всех уровнях от интеграции до использования

Адаптируем модели распознавания под конкретные тематики

ПОЧЕМУ МЫ?
СРЕДА ПРИМЕНЕНИЯ

Единая Биометрическая Система

Контакт-центры различного масштаба: банки и сотовые операторы, автодилеры и салоны красоты

Ритейл - распознавание записей с диктофонов-бейджей и микрофонов, переговоры диспетчеров и производственных сотрудников, монтажников по рации

Системы мониторинга и анализа СМИ и социальных сетей

ТВ каналы, блогеры, авторы видео-курсов

РЕШАЕМЫЕ ЗАДАЧИ
- 2 -
Заполнение электронных форм и документов
Автоматизация IVR
- 9 -
- 10 -
Аутентификация по голосу в контакт-центрах и в мобильных приложениях
- 9 -

Речевая аналитика

- 3 -
- 8 -
Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

Голосовой канал для чат-ботов

- 4 -
Стенографирование телефонных переговоров
Стенографирование телефонных переговоров
- 1 -

Отекстовка сюжетов новостей, интернет-вещания СМИ, аудио и видео сюжетов различных тематик

Диктовка текстов любого размера различных тематик (сообщения в мессенджерах, смс, письма, комментарии, диссертации)

- 8 -
- 3 -

Стенографирование телефонных переговоров

- 4 -
Речевая аналитика
- 5 -

Протоколирование аудио/ видео мероприятий

- 7 -

Антифрод системы в банках

Антифрод системы в банках
- 5 -

Автоматизация IVR

- 6 -
Протоколирование аудио/ видео мероприятий
- 7 -

Аутентификация по голосу в контакт-центрах и в мобильных приложениях

- 10 -
Для предварительного определения стоимости клиент заполняет опросный лист и направляет его для уточнения исходных данных и составления проекта договора или коммерческого предложения на поставку.
Стоимость ASM_STT определяется функциональными возможностями, необходимостью использования различных языков распознавания речи в текст, количества обрабатываемых каналов, а также объемом работ по возможной доработке, установке и пусконаладке.
СТОИМОСТЬ
Стоимость в облаке не более 16 коп. за минуту
ДОКУМЕНТАЦИЯ
ХОТИТЕ УЗНАТЬ ПОДРОБНЕЕ?
Заполните заявку и мы подберем для вас оптимальное решение
КОНТАКТЫ
E-mail: sales@asmsolutions.ru
г. Москва, Новая площадь,
д. 10, этаж 5, офис 52
ООО «АСМ Решения»