Desde el lanzamiento de ChatGPT de Openai en 2022, la inteligencia artificial (IA) se ha arraigado significativamente en nuestras vidas. Pero los productos de IA populares están configurados para servir principalmente intereses estadounidenses y europeos, a pesar de ser promocionado como herramientas globales democratizando el acceso a la tecnología, desde los casos de uso que se aplican a los idiomas que hablan.
Varios investigadores africanos fuera del núcleo estadounidense de Tech están tratando de desafiar ese status quo y, con él, la mayor dinámica de poder en juego en la industria de la IA.
Un desequilibrio de poder global de IA
El Distributed AI Research Institute (DAIR) es un grupo internacional de investigadores y tecnólogos centrados en lo que llama «investigación de IA independiente y arraigada por la comunidad libre de la influencia generalizada de Big Tech». Hablé con los miembros de Dair que crean soluciones de IA centradas en África que satisfacen necesidades sociales particulares. En última instancia, demuestran casos de uso para la IA que priorizan a las corporaciones multinacionales históricamente desechadas en lugar de las corporaciones multinacionales o únicamente usuarios occidentales.
Nyalleng Mooresi es un investigador principal en Dair con sede en Lesotho y miembro fundador de Deep Learning Indaba, una organización que tiene como objetivo fortalecer la IA y el aprendizaje automático en África. Su experiencia en aprendizaje automático y enseñanza en las escuelas públicas sudafricanas informó a sus filosofías sobre la equidad en el espacio tecnológico.
Como educador de la Universidad de Forte, una de las pocas universidades del país que aceptó a los sudafricanos negros durante el apartheid, Mooresi fue testigo de que muchos estudiantes luchan con la pobreza mientras estaban en la escuela. «Era alucinante imaginar hacer las cosas que hice a través de (fuera) estudiante de pregrado y post-crad (cargado por) tanta inseguridad», señaló.
Después de la enseñanza, Google fue reclutada por Google, donde fue una de las primeras empleadas en el Laboratorio de Investigación de AI de Google África en Ghana. Como ingeniero de software, Mooresi desarrolló metodologías y tecnologías para ayudar a garantizar que los sistemas de IA se construyan de manera responsable.
«Me uní a Google porque (estaban) construyendo una oficina en África, y quería (estar en) África», dijo Mooresi. «No quería ir a Google. Quería ir a Google África».
Pero después de que un amigo y colega, Timnit Gebru, el fundador de Dair y ex co-líder en el equipo ético de IA de Google, la contactó a ella preguntándola sobre la falta de representación africana dentro de Google África, Mooresi comenzó a cuestionar si Google era el tipo de trabajo de equidad que quería hacer en el aprendizaje automático.
Las grandes compañías tecnológicas han parecido censurar a aquellos que buscan descubrir daños sociales inducidos por tecnología y desafiar las prácticas de IA en las principales prácticas de IA. Es por eso que Mooresi y Gebru querían centralizar el poder dentro de las comunidades que la industria tecnológica ha excluido históricamente al mantener y financiar a los expertos locales en el terreno.
Estudio de IA de Dair
En 2018, Mooresi, Gebru y el compañero de Dair Raesetje Sefala comenzaron a recolectar imágenes satelitales para rastrear los cambios en el entorno construido de los municipios de Sudáfrica, vecindarios de clase trabajadora históricamente poblados por residentes negros. Interesado en cómo los barrios urbanos históricamente negros de Sudáfrica habían cambiado desde que terminó el apartheid, Dair comenzó a compilar un conjunto de datos para determinar si la vida de los ocupantes había mejorado con el tiempo.
Los municipios sudafricanos son vecindarios urbanos subdesarrollados ubicados en las afueras de las ciudades. Los habitantes del municipio tienden a tener una calidad de vida más pobre que los de los suburbios más ricos. Sin embargo, debido a que el censo emitido por el gobierno se utilizó para asignar gastos públicos a grupos con áreas más ricas, los datos del municipio se volvieron invisibles. Este enfoque da como resultado el apartheid espacial, que excluye desproporcionadamente a las personas negras que viven en municipios para acceder a recursos públicos cruciales, como servicios de salud adecuados, educación y espacios verdes.
Este problema de datos afectó el estudio de Dair porque los investigadores se basaron en conjuntos de datos preexistentes, principalmente de modelos de IA sudafricanos que lucharon por capturar las complejidades de los paisajes urbanos del país y los municipios diferenciados de los suburbios. Entonces, en cambio, los investigadores utilizaron los millones de imágenes satelitales de provincias sudafricanas y los datos geoespaciales que recolectaron para entrenar modelos de aprendizaje automático y construir un sistema de IA que etiquetara áreas específicas como racimos ricos, no ricos y no residenciales, como áreas terrestres o industriales vacantes.
Sin embargo, cuando Dair intentó publicar estos hallazgos, recibieron comentarios de instituciones académicas occidentales predominantemente blancas de que el estudio fue geográfico, no de investigación de aprendizaje automático. Según Moorsoi, se les dijo esencialmente que el estudio no era IA.
Como explicó Mooresi, a pesar del uso de métodos de visión por computadora, las instituciones académicas no aceptaron su proyecto de apartheid espacial como parte del campo del aprendizaje automático: «Usamos las mismas métricas, algoritmos y métodos de comunicación, (incluyendo) las parcelas y todo. Es tan loco porque se usaban muchos conjuntos de datos de juguetes, (pero) tuvimos esta base de datos sobre las cosas reales, y era demasiado nicho.». »
Pero no un nicho para los africanos, agregó: «Este seguimiento de cómo la segregación histórica afecta la forma en que vivimos está presente en muchas colonias ex británicas. Está en Nairobi. Está en Lagos», explicó. «En las colonias, era estándar que los blancos vivían allí y los negros vivían allí. Y la distribución de recursos era diferente entre allí y allí.
«Entonces, se siente nicho porque estas personas no son africanos, y no experimentan cómo la colonización en África dio forma (al) mundo (en el que) vivimos», dijo. Mooresi señaló cómo el contenido, no la calidad, del estudio de IA de Dair parecía socavar su visibilidad en una industria dominada por el oeste.
Proporcionando comunidades desatendidas
Asmelash Teka Hadgu, cofundadora y CTO de Lesan Ai y investigador en Dair, enfatizó aún más este punto. Describió la intención detrás de Lesan, una herramienta de traducción y transcripción de idiomas principalmente para idiomas africanos indígenas.
Hagdu dijo que su enfoque para la IA difiere de los gigantes tecnológicos con sede en los Estados Unidos porque Lesan AI se centra en idiomas de baja recursos como Amárico, Tigrinya y otros dialectos. Debido a que Hagdu habla tanto amárico como Tigrinya, construyó un sólido conjunto de datos al enfocarse en las partes más descriptivas de su idioma, utilizando el periódico «reutilizado» y el contenido de radio disponible en las comunidades locales etíopes, como explicó en nuestra entrevista.
En el contexto africano, los modelos de idiomas populares de gigantes tecnológicos como OpenAi y Anthrope no representan adecuadamente a cientos de millones de personas. Por ejemplo, el desempeño de ChatGPT de Openai en un conjunto de datos de 670 idiomas muestra que los idiomas africanos son los menos apoyados, según el artículo de Wei Rui Chen, tocando en Babel: una investigación sobre la capacidad de identificación de idiomas de ChatGPT.
«El chatgpt de OpenAI está completamente roto, no un poco equivocado, sino creando galimatías en idiomas como Amárico y Tigrini», dijo Hagdu. «Sin embargo, todavía están duplicando esa vieja forma de pensar que se centra primero en encontrar soluciones para el inglés. Y (suponiendo) otros idiomas se pondrán al día».
Al construir conjuntos de datos de alta calidad para idiomas de baja recursos, Lesan apunta a «servir a millones de traducciones precisas para miles de personas y abrir el contenido de la web (a) estas comunidades» debido al contenido limitado en línea que actualmente está disponible en estos idiomas, explicó Hagdu.
«No son complementos», dijo. «No gastamos el 95% de nuestros recursos en un puñado de idiomas y luego trabajamos en lo que llaman como lenguas de cola larga». Aquí, los idiomas de cola larga se refieren a idiomas que son menos conocidos, nicho o localizados con menos frecuencia, independientemente de cuántas personas hablen esos idiomas.
Cuando las compañías de IA occidentales intentan representar idiomas de baja recursos dentro de sus sistemas de IA, sus procesos están mal equipados para abordar el desafío de la traducción adecuada. Este problema se debe en gran parte a que los idiomas de baja recursos no están disponibles digitalmente para el raspado de datos de la misma manera que lo están los idiomas occidentales como el inglés, especialmente teniendo en cuenta el hecho de que Internet todavía se basa abrumadoramente en el inglés.
Además, los datos utilizados a menudo para entrenar modelos AI están muy sesgados para el mundo occidental. En un estudio realizado por la iniciativa de procedencia de datos, más de 50 investigadores investigaron de dónde provienen los datos que construye modelos de IA. Los investigadores analizaron más de 4,000 conjuntos de datos públicos que abarcan más de 600 idiomas, 67 países y tres décadas. Alrededor del 90% de los datos en modelos vinieron de Europa y América del Norte, con solo el 4% proveniente de África.
Hagdu dijo que el proyecto de No Left Behinding de Facebook «trabajó en cientos de idiomas, (sin embargo) los idiomas africanos incluidos se basan en lo que yo llamo ‘conveniencia’. (Ellos) raspan la web para cualquier recurso que puedan encontrar para estos idiomas y luego usan métodos automatizados para filtrar, alinear y crear los sistemas «.
Las empresas ofrecen básicamente cero recursos para idiomas africanos, dijo: «Te sorprendería (o no) descubrir que las personas preferirían financiar millones de dólares en la próxima startup para un inglés LLM. Mientras que, mientras que los idiomas de bajo contenido de recursos, como los idiomas amáricos y Tigrinya, los idiomas de millones de personas», raramente considerados para fondos de AI a gran escala.
Bloomberg informó en noviembre que la firma de telecomunicaciones francesas Orange SA se había asociado con Operai y Meta Platforms Inc. para comenzar a capacitar programas de IA en idiomas africanos, como Woolof, Pulaar y Bambara, para «abordar una escasez de modelos para los miles de dialectos del continente».
Sin embargo, muchos idiomas del África Occidental y Subsahariana dependen de distintos sistemas tonales para enunciar el significado de palabras y tradiciones orales que se remontan a la era precolonial. Muchos idiomas orales africanos están desapareciendo lentamente porque la población de hablantes nativos está disminuyendo, mientras que los idiomas coloniales como el francés e inglés se están volviendo cada vez más ampliamente hablados. Este cambio dificulta que las LLM desarrolladas por las empresas tecnológicas occidentales representaran completamente los idiomas africanos porque no entienden sus especificidades culturales.
Para Hagdu, los ancianos y los miembros de la comunidad fueron críticos para sus sistemas de aprendizaje automático, asegurando que representara correctamente el contexto local de las comunidades.
Mientras tanto, incluso cuando las grandes empresas tecnológicas reclutan tecnólogos y nuevas empresas de IA más pequeños para desarrollar conjuntos de datos para capacitar a modelos específicos del lenguaje, las empresas aprovechan el trabajo de código abierto para capturar ideas, datos y recursos de equipos más pequeños. Georg Zoeller del Centro para el Liderazgo de AI en Singapur explicó recientemente: «Al emitir abierto las herramientas básicas para la IA, los hiperscalers han permitido a las nuevas empresas construir productos en el campo y haberlo utilizado para reemplazar a los equipos internos como la fuente principal de la I + D de productos».
El Dr. Paul Azunre, cofundador de Ghana NLP (procesamiento del lenguaje natural), me contó con qué facilidad las grandes empresas se escapan a las empresas de las nuevas empresas en el sur global sin compensarlas por su trabajo.
«Una vez que Facebook llegó a nosotros después de que sacaron un modelo, que era de código abierto y se construyó sobre nuestros datos. Luego, estaban haciendo una llamada abierta para la (s) propuesta (s). Vinieron a nosotros y me dijeron: ‘¿Por qué no pones (a) propuesta de financiación?’ Y dijimos: «Bueno, ya estás usando nuestro trabajo», explicó Azunre. «‘Entonces, ¿qué más necesitamos demostrarte? Solo pagándonos'».
Ghana NLP se fundó en respuesta a que los idiomas ghaneses se excluyen de los productos de software como Google Translate y las herramientas de reconocimiento de voz. En busca de llenar ese vacío, la startup se centra en el reconocimiento de voz de voz, el texto a la voz y la traducción del habla a texto en los idiomas locales de Twi, Ewe, Yoruba, Fante y GA, y se está expandiendo para incluir idiomas de países vecinos, incluidas Nigeria, Burkina Faso, Kenya y Tanzania.
«Como desarrollador que intenta hacer productos autosuficientes, simpatizo con por qué ciertos productos o proyectos se priorizan de cierta manera», dijo Azunre. «Vamos a publicar TWI primero porque en Ghana tenemos 30 millones de altavoces TWI … pero la diferencia entre lo que estamos haciendo y (gigantes tecnológicos) es para nosotros, el principio rector es que los lugareños son lo más importante».
Continuó: «No hay otra opción. No hay construcción de la cosa y luego llevarlo a Silicon Valley, y luego se sienta allí, generando trabajos allí, pero está traduciendo nuestra cultura y (extrayendo nuestros datos)». Además, «los trabajos deben estar en las comunidades de donde está extrayendo el conocimiento».
Si bien Azunre es un proponente de código abierto, advirtió contra la captura de conjuntos de datos de Big Tech para construir soluciones sin permitir que las comunidades locales retengan el control sobre sus datos, también conocido como soberanía de datos comunitarios. Además, argumentó que crear fuentes de datos locales y capacitar a los ghaneses crean un ecosistema de IA robusto que empodera a las comunidades que enfrentan la desigualdad digital y asegura que las especificidades lingüísticas y culturales de África no falten en las soluciones de IA.
¿Qué sigue para la IA en África?
Como explicó la investigadora de gobernanza tecnológica, Chinasa T. Okolo, muchos gobiernos africanos están considerando establecer marcos para el gobierno de IA que combaten la influencia de las corporaciones multinacionales sobre el panorama de la IA en el continente africano. Siete países africanos (Benin, Egipto, Ghana, Mauricio, Ruanda, Senegal y Túnez) han redactado estrategias nacionales de IA, pero ninguna ha implementado una estrategia formal de regulación de IA.
El gobierno sudafricano lanzó recientemente un marco de política nacional de IA para garantizar un acceso equitativo a las tecnologías de IA, especialmente en las comunidades desatendidas y rurales. Además, 36 países africanos han establecido regulaciones formales de protección de datos, abriendo espacio para más marcos de IA regulatorios, según Okolo.
Últimamente, las compañías de IA con sede en Occidente han estado buscando LLM similares específicas regionales para los países de habla árabe en toda la región MENA, como el nuevo modelo de IA de Mistral que se especializa en árabe y se adapta a comprender los matices culturales a veces pasados por alto en modelos más grandes y de uso más general. Meta también reveló que se está expandiendo Meta AI en toda la región MENA para proporcionar soporte lingüístico a los usuarios de habla árabe en sus aplicaciones.
Pero un número creciente de tecnólogos e investigadores de IA está amplificando los paralelos entre los legados de la extracción colonial y las tendencias del desarrollo de IA a nivel mundial, así como la exageración detrás de los sistemas de IA generativos hoy en día. Como explicó Karen Hao de MIT Tech Review: «Si bien disminuiría la profundidad de los traumas pasados para decir que la industria de la IA está repitiendo (las modalidades exactas de la violencia colonial) hoy en día, ahora está usando otros medios más insidiosos para enriquecer a los ricos y poderosos a gastos de los pobres».
¿Quieres más historias sobre AI? Regístrese para la innovaciónnuestro boletín semanal.