Казахстанский стартап Cybernet AI разработал и представил масштабную модель автоматического распознавания речи (ASR), специально адаптированную под тюркские языки. Презентация решения состоялась на площадке Astana Hub.
Новая ASR-система:
- распознает казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки;
- поддерживает смешанную тюркско-русскую речь и свободное переключение языков внутри одного высказывания;
- обучена с нуля на массиве живой разговорной речи;
- устойчива к фоновому шуму, диалектам и акцентам.
До настоящего времени в странах Центральной Азии преимущественно использовались международные ASR-модели, ориентированные в первую очередь на английский язык. Это снижало точность распознавания тюркских языков из-за их фонетических, морфологических и интонационных особенностей.
Разработка собственной региональной модели позволяет значительно повысить качество работы голосовых технологий и снизить зависимость от универсальных зарубежных решений.
По оценке разработчиков, внедрение локальных ASR-моделей откроет новые возможности для бизнеса и государственного сектора. Технология может быть использована в колл-центрах, системах электронного правительства, сервисах голосовых помощников, а также в цифровых услугах для населения, где критически важна точность распознавания речи на родных языках пользователей.