В Казахстане создали ИИ для распознавания тюркских языков

Стартап Cybernet AI представил крупнейшую региональную модель автоматического распознавания речи, ориентированную на языки тюркской группы

Казахстанский стартап Cybernet AI разработал и представил масштабную модель автоматического распознавания речи (ASR), специально адаптированную под тюркские языки. Презентация решения состоялась на площадке Astana Hub.

Новая ASR-система:

  • распознает казахский, турецкий, узбекский, кыргызский, азербайджанский и татарский языки;
  • поддерживает смешанную тюркско-русскую речь и свободное переключение языков внутри одного высказывания;
  • обучена с нуля на массиве живой разговорной речи;
  • устойчива к фоновому шуму, диалектам и акцентам.

До настоящего времени в странах Центральной Азии преимущественно использовались международные ASR-модели, ориентированные в первую очередь на английский язык. Это снижало точность распознавания тюркских языков из-за их фонетических, морфологических и интонационных особенностей.

Разработка собственной региональной модели позволяет значительно повысить качество работы голосовых технологий и снизить зависимость от универсальных зарубежных решений.

По оценке разработчиков, внедрение локальных ASR-моделей откроет новые возможности для бизнеса и государственного сектора. Технология может быть использована в колл-центрах, системах электронного правительства, сервисах голосовых помощников, а также в цифровых услугах для населения, где критически важна точность распознавания речи на родных языках пользователей.