Les intelligences artificielles ont fait ds progrès considérables ces dernières années, d’autant plus avec les modèles génératifs capables de rédiger des textes d’une qualité quasi irréprochable. Je suis néanmoins moins persuadé que les progrès des machines ne leur permettent pas de rivaliser avec la subtilité et la sensibilité des rédacteurs humains. Puisque l’objectif initial des blogs était d’offrir un moyen aux individus de s’exprimer, je perpétue la “tradition” et m’engage dans un contrat moral avec vous, mes lecteurs, en adhérant à la Charte des contenus 100% humains.

Voilà presque 9 mois que ChatGPT est accessible au grand public. Après une incroyable période d’euphorie, nous commençons à observer la fin de la lune de miel, notamment chez les grands éditeurs qui voient d’un mauvais oeil l’utilisation de leurs contenus pour entrainer des modèles de langage qui fournissent des informations et réponses à leur place sans les citer ou les rétribuer : New York Times, CNN and Australia’s ABC block OpenAI’s GPTBot web crawler from accessing content.
La défiance va même plus loin puisque ces éditeurs bloquent maintenant l’accès aux robots d’indexation d’OpenAI (GPTBot) ou de ceux des corpus “libres de droits” comme celui proposé par Common Crawl, une organisation “non-profit”, mais néanmoins utilisée sans aucun état d’âme par des éditeurs “for profit” (OpenAI Passes $1 Billion Revenue Pace as Big Companies Boost AI Spending).

Le NYTimes, pionnier de ce mouvement vient d’ailleurs de mettre à jour ses CGU où il est désormais précisé que :
Non-commercial use does not include the use of Content without prior written consent from The New York Times Company in connection with the development of any software program, including, but not limited to, training a machine learning or artificial intelligence system without consent.
Tout ceci me fait dire qu’il est temps pour moi de passer à l’action.
20 ans de blog et 4.000 articles rédigés à la main
Croyez-le ou non, mais j’ai ouvert ce blog en juillet 2003. Cela fait plus de 20 ans que je rédige moi-même chaque article publié. Vous pouvez vérifier, il y en a près de 4.000.

Ma motivation pour rédiger tous ces articles a toujours été de partager mes idées et points de vue dans le but d’échanger avec la communauté et de pouvoir enrichir mon savoir. À partir du moment où mes articles sont aspirés et digérés pour être recrachés sous forme d’une succession de mots générés sur la base de calculs statistiques sans aucune compréhension du sujet, je ne vois pas l’intérêt de continuer.
De façon plus générale, je n’ai jamais cherché à optimiser mes articles pour les robots d’indexation, car l’important est de toucher et d’interagir avec des lecteurs humains, pas de les alpaguer avec des contenus insipides, mais bien référencés.
Voilà pourquoi je fais le choix aujourd’hui d’interdire l’accès à mes articles pour les robots d’indexation d’OpenAI et de Common Crawl (d’autres suivront à mesure qu’ils seront identifiés), tout simplement parce qu’ils ne sont pas dans ma cible.
En toute honnêteté, je doute que le fait de bloquer les robots d’indexation change quoi que ce soit, mais c’est une question de principe : je refuse d’être l’idiot utile d’une startup californienne qui ne respecte aucune règle et n’a d’ambition que d’enrichir ses actionnaires.
Remettre les hommes et les machines à leur place
Pour aller plus loin dans cette décision, j’affiche également clairement et fièrement la couleur en adhérant à la Charte des contenus 100% humains publiée par un collectif de blogueurs (David Fayon, Thomas Gerbaud, Yann Gourvennec, Hervé Kabla, Xavier de Mazenod, Louis Naugès, Pierre-Nicolas Schwab, Michaël Tartar…).

Lancée lors de la dernière édition de Vivatech, cette charte n’est pas un réquisitoire à charge contre les IA génératives, mais un guide de bonne conduite dont l’objectif est de garantir la qualité et la fiabilité des publications.
Manifeste du collectif du contenu 100 % humain
Ce qui a motivé la création du collectif et la rédaction de la charte est que d’une part, les IA génératives ont des limites :
- Ce ne sont que des programmes (Les IA ne sont pas des personnes, on ne peut dire “lui” ou “elle” en parlant de ces outils) ;
- Les corpus d’entrainement reposent sur de multiples données (textes, images…) récupérées par des robots d’indexation sans aucune considération pour les auteurs (ex : GPTBot, CCBot…) ;
- Les modèles fonctionnent en associant les mots selon des règles probabilistes (il n’y a aucun raisonnement logique, que des calculs statistiques) ;
- Les contenus générés sont amputés de toute sensibilité et émotions propres aux humains ;
- Les éditeurs de ces modèles génératifs font appel à de la main-d’oeuvre sous-payée dans des pays du tiers monde, sans aucune considération pour l’éthique (Behind the AI boom, an army of overseas workers in ‘digital sweatshops’).
D’autre part, les membres de ce collectif engagent leur responsabilité dans leurs choix éditoriaux, réflexions et écrits, ce qui n’est pas du tout le cas des modèles génératifs.
À ce sujet, voici les engagements des membres du collectif “contenus 100% humain” :
- Des contenus textuels créés par et pour des humains, non pour des machines ;
- Des articles écrits par des auteurs clairement identifiés (nominativement) ;
- De la transparence pour les images générées par des IA (ex : le logo ci-dessus) ;
- Des informations vérifiées, contrôlées et sourcées.
Il y a pour le moment une douzaine de volontaires dans ce collectif, n’hésitez pas à vous renseigner et à vous inscrire si vous adhérez à ces constats et principes.
Tous les contenus publiés en ligne ne sont pas libres et gratuits
J’en profite pour vous rappeler que les articles et schémas publiés de ce blog sont publiés sous licence CC BY-NC-SA 4.0. Vous êtes autorisé à partager et adapter les contenus de ce blog selon les conditions suivantes :
- Attribution. Vous devez créditer l’auteur ou les articles, intégrer un lien vers la licence et indiquer si des modifications ont été effectuées.
- Pas d’utilisation commerciale. Vous n’êtes pas autorisé à faire un usage commercial de ces articles ou schémas, tout ou partie du matériel les composant.
- Partage dans les mêmes conditions. Dans le cas où vous effectuez un remixage, que vous transformez, ou créez à partir des articles ou schémas originaux, vous devez diffuser les contenus modifiés dans les mêmes conditions.

Maintenant que ces précisions sont faites, je peux continuer à rédiger et publier avec la conscience tranquille.
Published