L’IA a-t-elle un biais linguistique ? Ce nouveau modèle promet de libérer le français des tokens anglais

Introduction : C’est un secret de polichinelle dans le monde de l’IA : les modèles de langage actuels, de ChatGPT à Gemini, parlent une langue de tokens étrange. Ces « sous-mots » (comme ▁inter, national, ou ization) sont censés optimiser le calcul, mais ils introduisent un biais structurel majeur contre les langues moins représentées, notamment le français. La solution s’appelle Bolmo et elle est open source.

https://goodtech.info/bolmo-ia-open-source-francophonie-fin-tokenisation/