Google expande el impulso de idiomas en India para atender a personas que no hablan inglés


Hay más de 600 millones de usuarios de Internet en la India, pero solo una fracción de esta población habla inglés con fluidez. Sin embargo, la mayoría de los servicios en línea y gran parte del contenido de la web actualmente están disponibles exclusivamente en inglés.

Esta barrera del idioma continúa contribuyendo a una brecha digital en el segundo mercado de Internet más grande del mundo que ha limitado la interpretación de la World Wide Web de cientos de millones de usuarios a unos pocos sitios web y servicios.

Por lo tanto, no sorprende que los gigantes tecnológicos estadounidenses, que cuentan con mercados emergentes como India, continúen creciendo. intentan cada vez más hacer que la web y sus servicios sean accesibles a más personas.

Caso en cuestión: una función que Google proporciona para traducir rápidamente el contenido de una página web del inglés a los idiomas indios y ha sido utilizado más de 17 mil millones de veces por usuarios en la India durante el último año.

Google, que hasta ahora ha liderado este esfuerzo, reveló el jueves algunos de sus nuevos esfuerzos. La compañía, que considera a India como su mayor mercado por usuarios y este año se comprometió a invertir más de $ 10 mil millones en el país durante los próximos años. dijo que planea invertir más en el aprendizaje automático y los esfuerzos de IA en el centro de investigación de Google en India y hacer que sus modelos de IA sean accesibles para todos en todo el ecosistema. La compañia también planea asociarse con nuevas empresas locales que atienden a los usuarios en los idiomas locales y mejorar «drásticamente» la experiencia de los productos y servicios de Google para los usuarios del idioma indio.

En esa última parte, la compañía anunció hoy una serie de cambios que está implementando en algunos de sus servicios para que hablen más idiomas locales y presentó un enfoque completamente nuevo que está adoptando para traducir idiomas.

Cambios de producto

Los usuarios ahora podrán ver los resultados de sus consultas en tamil, telugu, bengalí y marathi, además del inglés y el hindi que están disponibles actualmente. La adición se produce cuatro años después de que Google agregó la pestaña Hindi a la página de búsqueda en India. La compañía dijo que el volumen de consultas de búsqueda en hindi creció más de 10 veces después de la introducción de esta pestaña. Si alguien prefiere ver su consulta en tamil, por ejemplo, ahora podrá configurar la pestaña tamil junto a inglés y alternar rápidamente entre las dos.

Obtener resultados de búsqueda en un idioma local es útil, pero a menudo las personas también desean realizar sus consultas en esos idiomas. Google dice que ha descubierto que escribir en un idioma que no sea el inglés es otro desafío que enfrentan los usuarios en la actualidad. “Como resultado, muchos usuarios buscan en inglés incluso si realmente prefieren ver los resultados en un idioma local que entienden”, dijo la compañía.

Para abordar este desafío, la Búsqueda comenzará a mostrar contenido relevante en los idiomas indios admitidos cuando corresponda, incluso si la consulta del idioma local está escrita en inglés. La función, que la compañía planea implementar durante el próximo mes, es compatible con cinco idiomas indios: hindi, bengalí, marathi, tamil y telugu.

Google también facilita a los usuarios cambiar rápidamente el idioma preferido en el que ven los resultados en una aplicación sin alterar la configuración de idioma del dispositivo. La función, que actualmente está disponible en Discover y Google Assistant, ahora se implementará en Maps. Maps admite 9 idiomas indios.

De manera similar, la función Tarea de Google Lens, que permite a los usuarios tomar una fotografía de un problema de matemáticas o ciencias y luego entrega su respuesta y guía a los estudiantes a través de los pasos para llegar allí, ahora es compatible con el idioma hindi. India es el mercado más grande para Google Lens, dijo Nidhi Gupta, gerente senior de productos de Google India, en el evento.

Jayanth Kolla, analista jefe de la consultora Convergence Catalyst, dijo que la nueva función de Google Lens podría representar una amenaza para algunas startups indias como Doubtnut, respaldada por Sequoia Capital, que opera en un espacio similar.

MuRIL

Los ejecutivos de Google también detallaron un nuevo modelo de inteligencia artificial lingüística, al que denominan Representaciones multilingües para idiomas indios (MuRIL), que ofrece más eficiencia y precisión en el manejo de transliteración, variaciones ortográficas, idiomas mixtos y otros matices de idiomas. MuRIL brinda soporte para texto transliterado al escribir hindi usando escritura romana, algo que faltaba en modelos anteriores de este tipo, dijo Partha Talukdar, científica investigadora de Google Research India, en un evento virtual el jueves.

La compañía dijo que entrenó el nuevo modelo con artículos en Wikipedia y textos de un conjunto de datos llamado Common Crawl. También lo entrenó en texto transliterado de, entre otras fuentes, Wikipedia (alimentado a través de los modelos de traducción automática neuronal existentes de Google). El resultado es que MuRIL maneja los idiomas indios mejor que los modelos de idioma más generales anteriores y puede lidiar con letras y palabras que se han transcrito, es decir, Google está utilizando las letras correspondientes más cercanas de un alfabeto o escritura diferente.

Talukdar señaló que el modelo anterior en el que se basaba Google resultó no escalable, ya que la empresa tuvo que construir un modelo para cada idioma por separado. «La creación de un modelo de lenguaje específico para todas y cada una de las tareas no es eficiente en términos de recursos, ya que a menudo no tenemos datos de entrenamiento para tareas como esta», dijo. MuRIL supera significativamente al modelo anterior, en un 10% en texto nativo y un 27% en texto transliterado. MuRIL, que fue desarrollado por ejecutivos de Google en India y está en uso durante aproximadamente un año, ahora es de código abierto.

MuRIL admite 16 idiomas indios e inglés.

Una de las muchas tareas en las que MuRIL es bueno es determinar el sentimiento de la oración. Por ejemplo, «Achha hua cuenta bandh nahi hua» se interpretaría anteriormente como con un significado negativo, pero MuRIL identifica correctamente esto como una declaración positiva, dijo Talukdar. O tome la capacidad de clasificar a una persona frente a un lugar: «Shirdi ke sai baba» anteriormente se interpretaría como un lugar, lo cual está mal, pero MuRIL lo interpreta correctamente como una persona.



Fuente: TechCrunch

Compartir:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para fines de afiliación y para mostrarte publicidad relacionada con tus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad