Автор Елена Кузнецова
Чтобы сделать информацию более доступной по всему миру, Google разработает модель искусственного интеллекта, которая будет поддерживать 1000 языков.
Google сообщила о намерении увеличить свое и без того обширное языковое портфолио в десять раз. Представив инициативу под названием «1000 языков», Google взяла на себя обязательство создать модель искусственного интеллекта, поддерживающую наиболее распространенные в мире языки.
«Язык имеет основополагающее значение в общении и в том, как люди осмысляют мир», — сказал Джефф Дин (Jeff Dean), старший научный сотрудник Google. — Но в мире говорят на более чем 7000 языков, и лишь немногие из них хорошо представлены в Интернете».
Поскольку проект чрезвычайно амбициозный, на его реализацию, скорее всего, уйдет много лет. Однако Google уже работает над достижением своей цели.
Согласно сообщению в блоге, уже разработана универсальная речевая модель (USM), которая обучается более чем на 400 языках, обеспечивая наибольший охват на сегодняшний день. Google также сотрудничает с сообществами по всему миру для получения речевых данных.
Google недавно добавила еще 24 языка к платформе Google Translate и сделала возможным голосовой ввод еще для девяти африканских языков на Gboard.
Google также сотрудничает с местными органами власти, НПО и образовательными учреждениями в Южной Азии для сбора аудио-образцов различных диалектов этого региона.
Другие ведущие технологические компании тоже создают крупные языковые модели. В июле Meta* анонсировала модель искусственного интеллекта под названием «Ни один язык не оставлен позади» (No Language Left Behind), которая может делать переводы между 200 языками. В том числе она позволяет делать переводы на 55 африканских языков — значительный прогресс, поскольку широко используемые инструменты перевода поддерживают менее 25 африканских языков.
* Meta — признана экстремистской организацией и запрещена в России.