OneNine : rendre l’IA universelle grâce à la valorisation des langues africaines
Heure de publication 14:55 - Temps de lecture : 3 min 58 s
Doudou Ba, fondateur de OneNine et d’OctOpus, engagé dans la construction d’une intelligence artificielle réellement multilingue et inclusive. – © Doudou Ba.
Texte par : Thalf Sall
En donnant une place aux langues africaines dans les bases de données qui alimentent l’intelligence artificielle mondiale, la startup OneNine s’attaque à l’un des angles morts les plus persistants de la révolution numérique. Fondée par l’entrepreneur sénégalais Doudou Ba, l’entreprise développe une infrastructure linguistique destinée à rendre l’IA plus inclusive, plus représentative et plus utile pour des millions d’Africains. Une réponse concrète à un problème mondial encore largement sous-estimé : l’exclusion linguistique dans les technologies de demain.
L’intelligence artificielle est souvent présentée comme une révolution universelle. Pourtant, derrière cette promesse d’universalité se cache une réalité beaucoup moins inclusive. Les grands modèles de langage qui alimentent aujourd’hui les assistants conversationnels, les outils de traduction, les services vocaux ou les systèmes d’aide à la décision sont principalement entraînés à partir de données issues d’un nombre limité de langues dominantes, notamment l’anglais, le chinois, l’espagnol ou le français.
Pour les centaines de millions d’Africains qui utilisent quotidiennement des langues telles que le wolof, le pulaar, le swahili, le luganda, le fon, le yoruba, le bambara ou encore le lingala, cette situation crée une fracture numérique silencieuse. Les systèmes d’IA comprennent mal les accents, interprètent difficilement les expressions locales et produisent souvent des résultats peu pertinents dans les contextes culturels africains.
Cette sous-représentation n’est pas seulement un problème technique. Elle constitue également un enjeu d’équité, d’accès à l’information et de participation économique. Lorsqu’une langue n’existe pas dans les données utilisées pour entraîner les modèles, ses locuteurs deviennent pratiquement invisibles dans l’écosystème numérique mondial.
Les causes de cette situation sont multiples : absence historique d’investissements dans les ressources linguistiques africaines, manque de corpus numériques structurés, coûts élevés de collecte et d’annotation des données, faiblesse des infrastructures de recherche locales et rareté des mécanismes de gouvernance dédiés à la souveraineté des données linguistiques.
C’est précisément à cet endroit que OneNine, entreprise spécialisée dans les infrastructures de données alimentées par l’intelligence artificielle et dédiée à la création de jeux de données de haute qualité pour les langues à faibles et moyennes ressources, a choisi d’intervenir.
Construire l’infrastructure qui manque à l’intelligence artificielle
Créée par Doudou Ba, entrepreneur sénégalais basé en Suède, et son associé Duc Anh Tran, ingénieur tchéco-vietnamien, OneNine ne se limite pas au développement d’un simple outil d’intelligence artificielle. L’entreprise porte une ambition plus fondamentale : bâtir l’infrastructure de données indispensable à l’émergence d’une IA véritablement multilingue, capable de refléter la diversité linguistique et culturelle africaine.
« Beaucoup de gens ne savent pas lire ou écrire, mais ils savent parler, parfois pas en anglais, mais dans leur langue maternelle. Nous voulons que l’IA les entende. Notre mission est de créer l’infrastructure de données qui manque aujourd’hui à l’IA mondiale », explique Doudou Ba. Fondateur d’OctOpus – une entreprise qui développe un Data Scientist IA autonome capable de transformer des ensembles de données et des objectifs métier en modèles de machine learning opérationnels – il est également Operations Research Scientist chez Maersk et doctorant en machine learning à l’Université Charles de Prague. Selon lui, une fracture invisible structure aujourd’hui l’écosystème de l’intelligence artificielle : les langues africaines représenteraient moins de 0,5 % des datasets utilisés pour l’entraînement des modèles. Cette sous-représentation alimente une inégalité technologique profonde. « Les modèles comprennent mal les accents, les expressions et les réalités locales », déplore-t-il.
Basée en Suède, avec des opérations à Dakar et Kampala, OneNine agit comme un fournisseur spécialisé de données linguistiques à destination des développeurs, laboratoires de recherche et entreprises technologiques.
Son approche repose sur un principe simple mais exigeant : pour qu’une intelligence artificielle comprenne réellement une langue, elle doit être exposée à des volumes massifs de données fiables, authentiques et rigoureusement annotées.
C’est dans cette logique que OneNine structure une véritable chaîne industrielle de la donnée linguistique. Des locuteurs natifs collectent des contenus vocaux et textuels dans leur langue maternelle. Ces données sont ensuite nettoyées, transcrites, vérifiées, classifiées et annotées selon des protocoles stricts, avant d’être intégrées dans des jeux de données exploitables par les modèles d’apprentissage automatique.
Contrairement aux approches reposant sur des traductions automatiques ou des corpus synthétiques, la startup privilégie la collecte de données authentiques, issues des usages réels des populations. Cette méthode permet de préserver les nuances culturelles, les expressions idiomatiques et les subtilités contextuelles souvent absentes des bases de données traditionnelles.
Aujourd’hui, plus de 200 contributeurs participent à cet effort collectif à travers plusieurs pays africains. Plus d’une vingtaine de langues sont déjà couvertes, et la startup affiche une ambition claire : étendre son réseau à 50 langues et mobiliser 3 000 contributeurs d’ici la fin de l’année.
Dans cette dynamique de croissance, OneNine a engagé une levée de fonds pre-seed d’un million de dollars, structurée via un modèle SAFE, afin d’accélérer le déploiement de ses infrastructures et l’extension de ses capacités de collecte et de traitement des données linguistiques.
Une méthodologie reproductible à grande échelle
L’une des forces de OneNine réside dans la reproductibilité de son modèle. Plutôt que de centraliser l’ensemble du processus dans un seul pays, l’entreprise a développé une méthodologie décentralisée reposant sur des communautés locales de contributeurs. Chaque langue est documentée par des locuteurs natifs formés aux procédures de collecte et de validation.
Cette approche présente plusieurs avantages. Elle améliore la qualité des données, réduit les biais culturels et favorise la création d’emplois numériques locaux. Elle permet aussi de déployer rapidement de nouveaux projets linguistiques dans différents territoires.
La startup combine ensuite expertise humaine et outils automatisés. Les algorithmes interviennent pour détecter les anomalies, organiser les données et optimiser les processus de traitement, tandis que les validations critiques restent assurées par des spécialistes humains.
Plusieurs projets pilotes ont permis de tester cette méthodologie dans des environnements réels. OneNine a notamment collaboré avec des acteurs spécialisés dans les études de marché et la collecte de données afin d’évaluer la qualité et l’efficacité de ses corpus linguistiques. Des partenariats ont été développés avec des institutions académiques et des organisations technologiques africaines.
À terme, OneNine ambitionne de constituer l’une des plus vastes infrastructures linguistiques africaines dédiées à l’intelligence artificielle. L’entreprise a déjà lancé un projet pilote de 500 heures de données en partenariat avec GeoPoll, avec une perspective d’extension pouvant atteindre 500 000 heures. Elle collabore avec des acteurs clés de l’écosystème technologique et académique africain, notamment LAfricaMobile, l’Université Cheikh Anta Diop et AI Hub Senegal. En consolidant progressivement cette masse critique de données de haute qualité, la startup pose les fondations d’une nouvelle génération de modèles d’IA capables de comprendre, interpréter et valoriser les langues africaines à une échelle inédite. Une avancée susceptible de transformer durablement la place du continent dans l’économie mondiale de l’intelligence artificielle.
Des résultats encourageants, mais des défis encore importants
Les premiers impacts observés sont significatifs. Les expérimentations montrent que les utilisateurs interagissent plus naturellement avec les systèmes numériques lorsqu’ils peuvent utiliser leur langue maternelle. La compréhension est meilleure, l’engagement plus fort et les erreurs d’interprétation diminuent sensiblement.
Au-delà de la performance technologique, OneNine contribue à la préservation d’un patrimoine culturel souvent menacé par la domination croissante des langues internationales dans l’espace numérique.
Cette dynamique a valu à la startup plusieurs distinctions au sein de l’écosystème africain de l’innovation, notamment dans le domaine de l’intelligence artificielle. En 2025, OneNine a remporté le prix de l’Intelligence Artificielle lors du Big Angels Day Africa, organisé par Dakar Network Angels, avec le soutien de Partech Africa, Sawari Ventures et Google for Startups. Cette reconnaissance a renforcé la visibilité de la startup et attiré l’attention d’investisseurs et d’acteurs internationaux, de plus en plus conscients que l’avenir de l’IA dépendra inévitablement d’une plus grande diversité linguistique et d’une meilleure représentation des langues du monde.
Pour autant, le projet n’échappe pas aux défis structurels qui caractérisent encore le secteur. La collecte de données reste coûteuse. Les standards de gouvernance des données linguistiques demeurent inégaux selon les pays. Les infrastructures de calcul nécessaires au développement de modèles avancés restent largement concentrées hors du continent africain.
Par ailleurs, l’inclusion linguistique ne garantit pas automatiquement l’inclusion numérique. L’accès à Internet, aux équipements numériques et à la formation constitue toujours un frein pour de nombreuses populations.
Ces limites n’enlèvent cependant rien à la pertinence de l’approche. Elles rappellent simplement que la démocratisation de l’intelligence artificielle nécessite une vision systémique associant technologie, éducation, investissement et souveraineté numérique.
Redonner une voix aux oubliés de l’intelligence artificielle
Dans une industrie mondiale encore dominée par un nombre limité de langues et de centres technologiques, OneNine trace une trajectoire alternative : celle d’une intelligence artificielle qui s’adapte aux populations, plutôt que d’exiger des populations qu’elles s’adaptent à elle.
En construisant les fondations linguistiques dont l’Afrique a longtemps été privée, la startup dépasse la seule amélioration des performances algorithmiques. Elle participe à une redéfinition plus profonde de l’innovation technologique, fondée sur une idée centrale : la diversité humaine n’est pas une contrainte, mais une ressource structurante.
Si cette ambition se concrétise à grande échelle, OneNine contribuera à l’émergence d’une nouvelle génération d’intelligences artificielles capables de comprendre le monde dans toute sa pluralité linguistique et culturelle. Une évolution majeure, non seulement pour l’Afrique, mais pour l’avenir global de l’intelligence artificielle.
Dans cette dynamique, Doudou Ba interviendra le samedi 13 juin prochain à l’Africa Deep Tech Community pour présenter la manière dont les agents d’IA peuvent transformer les données brutes en tableaux de bord, prévisions et systèmes d’aide à la décision à travers OctOpus.
