Технология голосового интерфейса Kardome Voice
Kardome предлагает универсальное решение на базе ИИ для производителей и OEM-производителей, чтобы повысить распознавание речи на устройствах с голосовой поддержкой. Развертывая обработку на основе нейронной сети на устройстве, Kardome повышает точность в реальных шумных средах и обеспечивает безопасную настройку в режиме реального времени, не полагаясь на облако.
Обзор
- Предоставляет набор технологий, предназначенных для четкого восприятия сложных звуковых ландшафтов и обеспечения надежного голосового интерфейса на интеллектуальных устройствах.
- Основное внимание уделяется обработке на устройстве для конфиденциальности, низкой задержки и автономной возможности.
- Целями являются автомобилестроение, здравоохранение, бытовая электроника и другие отрасли, требующие надежного голосового взаимодействия.
Как это работает
- Продвинутые модели нейронных сетей усиливают и изолируют речь, уменьшая фоновый шум.
- Многоязычные сценарии поддерживаются разделением в реальном времени и точной обработкой динамиков.
- Реализация Edge/on-device обеспечивает конфиденциальность и меньшую задержку без зависимости от облачных сервисов.
Ключевые технологии и особенности
- Audio Front End: Clear Voice Inputs за счет удаления фонового шума для улучшения разборчивости.
- Пространственное слушание: изоляция целевой речи от нескольких динамиков в режиме реального времени для высокоточного распознавания.
- Kardome Mobility: разговоры без рук в автомобилях с поддержкой нескольких сидений и нескольких динамиков.
- MyWord: персонализированные слова пробуждения, которые адаптируются к различным контекстам и устройствам при работе в автономном режиме.
- Голосовой идентификатор: Безопасная голосовая биометрия с высокой точностью в сложных средах, подходит для встроенных систем.
- Многоязычный VUI: Способен распознавать и обрабатывать речь от нескольких динамиков с идентификацией динамиков.
- Offline/Edge Deployment: Полностью автономное функционирование для сохранения конфиденциальности и снижения задержки и энергопотребления.
Как использовать технологию Kardome
- Интегрируйте модули Kardome на устройстве в голосовое устройство.
- Настройте слова пробуждения (MyWord) и биометрию голоса (Voice ID) по мере необходимости.
- Включите Audio Front End и Spatial Listening для улучшения захвата речи в шумных средах.
- Разверните многоязычный VUI для обработки разговоров в автомобилях или общих пространствах с точной изоляцией динамика.
Случаи использования
- Автомобильные голосовые помощники с надежным распознаванием в автомобиле у нескольких пассажиров.
- Потребительские устройства, требующие частных, автономных слов пробуждения и голосового управления.
- Промышленные или медицинские устройства, где точное понимание речи имеет решающее значение в шумных условиях.
Вопросы безопасности и конфиденциальности
- Обработка на устройстве минимизирует передачу данных и сохраняет конфиденциальность пользователей.
- Биометрические голосовые данные должны обрабатываться в соответствии с применимыми правилами и передовыми методами обеспечения безопасности.
Основные характеристики
- Обработка речи на основе нейронной сети на устройстве для распознавания в реальном времени
- Audio Front End для снижения шума и более четкого голосового ввода
- Пространственное прослушивание для многоязычной изоляции речи
- Мобильные решения для голосового взаимодействия в автомобиле
- Персонализированные слова пробуждения (MyWord) с автономной работой
- Безопасная голосовая биометрия (Voice ID) с высокой точностью на встроенном оборудовании
- Многоязычный VUI с точной идентификацией динамика
- Полностью автономное / переднее развертывание для снижения задержки и защиты конфиденциальности