Primera herramienta de inteligencia artificial en gallego ya disponible en la red
El Proyecto Nós ha publicado el primer el primer traductor neuronal entre gallego, castellano e inglés, en fase de pruebas. Esta iniciativa publica -en la que colaboran universidades y Xunta- insiste en que todas las herramientas serán gratis y abiertas para su reutilización.
Por ahora, el traductor neuronal está en fase de pruebas y su capacidad es limitada, solo admite unos 1.000 caracteres. Además, sus propios promotores indican que el prototipo de traductor neuronal gallego-castellano-inglés de Nós puede dar resultados erróneos. Por eso, solicitan a los usuarios que ayuden proporcionando valoraciones de la eficacia de la traducción.
Hay que recordar que los sistemas de Inteligencia Artificial aprenden en parte así, utilizando el feedback que reciben para mejorar sus respuestas.
En apariencia, en una primera valoración global, el traductor del Proxecto Nós es claramente inferior a otros ya disponibles en la red, como el propio Gaio de la web de la Xunta o el motor galego-castellano de Google Translate. Con todo, hay que tener en cuenta que es un prototipo. Su importancia es otra, su publicación supone todo un hito, pues la primera vez en la historia que una herramienta de IA desarrollada con redes neuronales a las que se les ha proporcionado datos en gallego es abierta al público. Visto el rápido desarrollo de la industria, el potencial de nuevas herramientas construídas sobre estas bases es enorme.
Durante el evento de presentación el lunes, el rector de la USC ahondó en esta argumentación. Así, Antonio López destacó que este proyecto es un primer paso visible para hacer accesibles algunos de los resultados del proyecto, el más ambicioso para la lengua gallega de cara al futuro. Su objetivo situar al gallego en las mismas condiciones que otras lenguas con mayor cantidad de hablantes, mediante herramientas que promuevan el aprendizaje constante y soluciones exitosas.
UN ARMA DE DOBLE FILO PARA EL GALLEGO
Hay que recordar que la IA supone una enorme oportunidad para idiomas no normalizados, como el gallego, pues permite multiplicar la capacidad de generar contenido. Ahora bien, también existe el riesgo que, debido precisamente a la poca cantidad relativa de contenido y usuarios que tienen las lenguas minoritarias, las herramientas de IA en estas lenguas tarden más en desarrollarse, alimentando un círculo vicioso que puede contribuir a que estos idiomas se queden al margen de la gran revolución en marcha, contribuyendo a su desaparición.
GRATIS Y PARA REUSAR
Además del traductor neuronal, Nós presentó el primer reconocedor de voz que comprende el gallego oral y lo convierte a texto, y una aplicación de síntesis de voz capaz de leer en gallego a partir de un texto. Con todo, estas herramientas todavía no están publicadas en Internet.
Lo que ya está publicado en la web del traductor es el material usado para su desarrollo: modelos neuronales, corpus de entrenamiento y textos de referencia. La publicación de este material de manera gratuita para su reutilización por otros desarrolladores es clave en la eficacia de este proyecto, que está financiado al 100% por dinero público, parte procedente de los fondos Next Generation de la UE.
El director del Centro Singular de Investigación en Tecnologías Inteligentes (CiTIUS) de la USC, Senén Barro, comparó los datos con los que se alimentan los sistemas de IA con la infraestructura vial de un país, siendo los materiales básicos de construcción que deben prepararse adecuadamente. El CiTIUS lidera precisamente, la recopilación y estructuración de esta infraestructura con la que 'enseñar' a las IA en gallego.
En este sentido, en la presentación se anunció que la USC y la Xunta seguirán trabajando en la recopilación de voces que reflejen la gran variedad fonética y dialectal de Galicia, con el objetivo de mejorar los modelos de las herramientas actuales y desarrollar nuevos modelos multilingües en colaboración con proyectos equivalentes para otras lenguas del Estado.
VENTAJAS PARA LENGUAS MINORIZADAS
La IA puede contribuir a la preservación y promoción de las lenguas minorizadas al proporcionar herramientas de traducción automática, reconocimiento de voz y síntesis de voz en esos idiomas. Esto facilita la comunicación, la documentación y la accesibilidad lingüística, permitiendo que estas lenguas sean utilizadas en una variedad de contextos, incluyendo el ámbito digital.
La utilización de la IA para fortalecer las lenguas minorizadas contribuye al empoderamiento cultural de las comunidades que las hablan. Al preservar y utilizar activamente su idioma en el ámbito digital, las comunidades minorizadas pueden fortalecer su identidad cultural y promover su patrimonio lingüístico.
RIESGOS PARA LENGUAS MINORIZADAS
Los sistemas de IA se entrenan utilizando grandes conjuntos de datos, y si esos conjuntos de datos están sesgados hacia las lenguas mayoritarias, existe el riesgo de que las lenguas minorizadas sean subrepresentadas o excluidas. Esto puede resultar en una falta de precisión y calidad en las aplicaciones de IA para las lenguas minorizadas, lo que dificulta su desarrollo y adopción.
Además, las comunidades que dependen en gran medida de las soluciones de IA pueden volverse vulnerables a la falta de control sobre su tecnología y recursos lingüísticos. Si las herramientas y los servicios son proporcionados por actores externos o empresas privadas, las comunidades minorizadas pueden perder la autonomía y la capacidad de tomar decisiones relacionadas con el desarrollo y el uso de su propia lengua. De ahí la importancia de pasos como el dado ayer por el Proxecto Nós.
Escribe tu comentario