Bilan de mes prédictions 2024 – FredCavazza.net


2024 a été l’année de tous les records pour l’IA générative. Je ne sais pas ce que nous réserve l’année prochaine (quoique j’aborderai la question dans mes prédictions pour 2025), mais j’ai vraiment eu l’impression de ne parler que d’IA générative au cours des 12 derniers mois. Voilà pourquoi l’essentiel du bilan de mes prédictions précédentes tourne autour des modèles génératifs et de leurs différentes applications.

Comme tous les ans en fin d’année, je vous propose une rétrospective de mes prédictions formulées en fin d’année dernière. Un bilan plutôt positif pour l’année 2024, grâce à un marché très clairement dominé par l’IA, donc une certaine lisibilité.

Les deep fakes s’invitent dans les élections = 😁

C’était à prévoir : l’IA s’est bien évidemment invitée dans les élections de l’année 2024 dans le but de manipuler l’opinion publique, notamment en Inde (Indian election was awash in deepfakes), et aux États-Unis, mais plus à des fins parodiques.

Si toute l’industrie est d’accord pour dire que le filigranage numérique est la solution (Watermarking the future), je doute fortement que les utilisateurs de canaux d’information alternatifs y seront sensibles. Qu’importe, différentes études démontrent que l’impact est négligeable : The influence of Deep Fakes on Elections et No evidence that AI disinformation or deepfakes impacted UK, French or European elections results.

De toute façon, les agents d’influence n’ont pas besoin de deep fakes pour manipuler l’opinion des indécis, il leur suffit juste de payer les bons influenceurs, mais ça commence à se savoir (Romania’s cancelled presidential election and why it matters).

Le retour en force du Owned Media = 😕

Je pensais que le blocage des identifiants publicitaires serait une raison suffisante pour motiver les annonceurs à ré-orienter leurs investissements et privilégier leurs actifs numériques internes (autrement appelé « Owned media »), mais finalement Google a fini par céder à la pression du marché et abandonne le projet de bloquer les cookies tiers dans son navigateur : After years of uncertainty, Google says it won’t be ‘deprecating third-party cookies’ in Chrome.

Pourtant, le consentement imposé par le RGPD fait perdre beaucoup de temps aux utilisateurs (Europeans Spend 575 Million Hours Clicking Cookie Banners Every Year), et même le W3C veut leur blocage : Third-party cookies have got to go. Quelque chose me dit que nous n’avons pas fini d’en entendre parler…

La montée en puissance des meta-chatbots = 😔

Tenez-vous-le pour dit : l’IA est une affaire de gros sous. Il faut en effet un budget conséquent pour développer des modèles génératifs, et il en faut encore plus pour attirer et convaincre les utilisateurs. Une solution possible est d’exploiter les modèles des autres et de proposer des fonctionnalités à valeur ajoutée que les autres chatbots ne proposent pas. C’est le pari de Perplexity qui s’est imposé cette année comme LE meta-chatbot de référence avec de nouvelles fonctionnalités ajoutées tous les mois : Perplexity brings ads to its platform, Perplexity introduces a shopping feature for Pro users in the US, Perplexity launches an elections tracker

Cette stratégie de conquête du marché a visiblement plutôt bien fonctionné (Perplexity says it’s now serving 100M search queries a week), jusque là… car les efforts nécessaires pour conquérir les prochains utilisateurs sont exponentiels à mesure que vous élargissez votre audience. Mais dans la mesure où l’IA générative n’est pas rentable (les coûts d’exploitation sont faramineux), je ne vois pas bien où tout ça va les mener… probablement à un rachat. Dans tous les cas de figure, ce créneau semble être une impasse, car les grandes sociétés technologiques (Microsoft et Google) ne comptent pas se laisser raboter des parts de marché par des nouveaux entrants (OpenAI, Anthropic), ni par des concurrents indirects (Meta et ses modèles open source).

L’arrivée à maturité des Prompt Management Systems = 😖

À l’époque où j’ai fait cette prédiction, le prompt engineering était une pratique en plein essor, nous nourrissions l’espoir d’une adoption rapide et généralisée. 12 mois après, force est de constater que le modèle d’interaction avec les IA via des prompts n’est pas du tout adapté aux utilisateurs lambda qui se contentent de prompter comme ils font des recherches dans Google : ils saisissent un ou deux mots-clés et se plaignent de la qualité des résultats (« C’est pas au point leur truc »). J’ai passé une bonne partie de l’année à donner des conférences sur l’AI générative et à former des professionnels aux techniques de prompt, et je peux vous certifier que non, le grand public ne s’habituera jamais aux prompts.

Éventuellement, nous pouvons placer tous nos espoirs dans les lycéens et étudiants qui ont l’obligation de savoir prompter pour faire leurs dossiers. Idem pour certains professionnels de l’information et des contenus qui ont l’obligation de se mettre à niveau pour pouvoir préserver leur employabilité. Mais pour les autres, l’IA générative est et restera une boite noire, au même titre que le cloud : on sait que ça existe, on a une très vague idée de comment ça fonctionne ou combien ça coûte, mais comme ça peut rendre des services de temps en temps, on l’utilise de façon occasionnelle sans faire l’effort de s’outiller ou d’apprendre à s’en servir correctement.

Dommage, car il existe des services plutôt bien conçus pour optimiser et gérer ses prompts, de même que pour les partager avec ses collègues. J’utilise personnellement PromptDrive et PromptPerfect, mais il en existe d’autres. Là encore, nous sommes sur un marché de niche.

Après les app stores, les agents stores = 😕

À une époque pas si lointaine, OpenAI annonçait l’ouverture de sa place de marché de chatbots personnalisés (les GPTs). Cette place de marché propose les chatbots personnalisés de l’éditeur, ceux de la communauté, et une interface simple pour créer les siens. Toutes les conditions sont donc réunies pour en faire un succès… mais là encore, c’est sans compter la tendance des utilisateurs à systématiquement choisir le chemin de moindre résistance et à picorer des fonctionnalités sans y investir trop de temps. Il en résulte une place de marché à l’abandon qui n’a pas su trouver son public.

Vous pourriez me dire que ce ne sont « que » des chatbots personnalisés et non des agents intelligents (lire à ce sujet : Les agents intelligents en 5 questions), mais pour le moment nous n’avons pas de place de marché pour des agents destinés au grand public. En revanche…

Pas de super apps pour les occidentaux, mais des super assistants numériques = 😀

J’ai beaucoup parlé des super apps et du fait qu’elles avaient du mal à s’implanter en occident, car les mobinautes ont à disposition d’innombrables applications dans les app stores officielles, ce qui n’est pas le cas en Asie. Mais ça n’empêche certains éditeurs d’y croire encore, à l’image de Uber qui envisage différentes options (Uber explored takeover bid for Expedia), ou de l’application de messageire Telegram qui se positionne comme l’alternative aux big techs (Now Telegram’s mini-apps can run in full screen on your phone).

WhatsApp aurait potentiellement pu prendre tous les éditeurs de vitesse, mais Meta préfère visiblement restreindre son application à la communication (en ajoutant néanmoins de nouvelles fonctionnalités régulièrement : WhatsApp will soon transcribe your voice messages) pour éviter de phagocyter son assistant (Meta.ai) qu’ils intègrent petit à petit à l’ensemble des applications (Meta AI has more than 500 million users).

Tout ceci laisse de l’espace aux autres grandes sociétés technologiques comme Microsoft, Google et Apple pour imposer de leur côté leur assistant respectif (Copilot, Gemini et Siri). Si les deux derniers ne proposent pas encore grand chose pour conquérir le grand public, il faut bien reconnaitre que les équipes de Microsoft ont fait de gros efforts pour démocratiser Copilot et en faire un service grand public.

L’ambition de Microsoft est de faire de Copilot votre page de démarrage et de vous accompagner au quotidien, à commencer par les premiers instants de la journée avec une revue de presse visuelle personnalisée (Copilot Daily) qui fonctionne très bien, surtout sur smartphone, notamment grâce à leur synthèse vocale très réaliste.

La résurrection des services vocaux = 😀

Puisque l’on parle de synthèse vocale, je vous confirme que les assistants vocaux ne sont pas morts, du moins si (Alexa, Siri, Cortana…), mais que les modèles génératifs relancent l’intérêt pour les interfaces vocales (Hi, AI: Our Thesis on AI Voice Agents). Les éditeurs d’IA générative proposent maintenant une interface vocale très convaincante en ayant réduit au maximum la latence entre les questions et les réponses : OpenAI brings ChatGPT’s Advanced Voice Mode to the web et Google is now rolling out Gemini Live to free users on Android.

Ce regain d’intérêt est principalement dû aux capacités accrues des modèles génératifs à comprendre les requêtes vocales et à générer des réponses avec une intonation et une fluidité bluffante. Des progrès d’autant plus intéressants qu’ils sont accessibles au plus grand nombre (Mozilla is now offering free AI voice training data in 180 languages). Des progrès d’autant plus intéressants (bis) que nous ne faisons qu’explorer la partie visible de l’iceberg, avec de nombreuses possibilités et fonctionnalités à venir autour des interfaces vocales : You Can Now Ask Questions During Google’s AI Podcasts.

Et n’oubliez pas que nous avons une pépite locale (Moshi) dont nous sommes toujours en attente du lancement de son produit (Kyutai lève un peu plus le voile sur son IA conversationnelle Moshi).

La revanche de Clippy = 😁

Seul(e)s les ancien(ne)s se souviennent de Clippy, le trombone qui apparaissait de façon inopinée dans Windows. Si l’aide apportée par Clippy était très limitée, le principe d’aide contextuelle est en revanche tout à fait légitime. Voilà pourquoi Microsoft a mis les bouchées doubles en 2024 pour intégrer toujours plus profondément Copilot à tous ses produits : Microsoft is bundling its AI-powered Office features into Microsoft 365 subscriptions, Microsoft is giving Copilot a new taskbar UI and keyboard shortcut on Windows et Microsoft introduces 10 AI agents for sales, finance, supply chain in Dynamics 365. Toute cette gamme de services pourrait d’ailleurs changer de nom pour se différencier de l’assistant : Microsoft could be about to rebrand its AI into Windows Intelligence rather than Copilot.

Ce qui est certain, c’est que Microsoft a l’intention ferme de forcer l’adoption de son offre d’IA, tout comme Google qui propose des fonctionnalités toujours plus riches : Gemini AI can now summarize what’s in your Google Drive folders et Google unveils AI coding assistant ‘Jules,’ promising autonomous bug fixes and faster development cycles.

De la génération à la structuration de contenus = 😞

Tout au long de l’année 2023, je n’ai eu de cesse de vous expliquer que le principal intérêt de l’IA générative n’est pas de pouvoir faire plus avec moins (plus de contenus), mais de faire mieux avec moins (des contenus de meilleure qualité). Je pensais ainsi que les modèles génératifs allaient certes nous aider à créer des contenus, mais également à reformater des contenus existants (les fichiers bureautiques) dans le but de les rendre plus lisibles pour les humains, mais également pour les différentes applications informatiques (L’IA pour restructurer les informations et données).

L’idée est là, mais nous en sommes encore loin, car les éditeurs de modèles génératifs tentent surtout d’enrichir leur offre pour devenir la nouvelle destination des utilisateurs, donc d’aggraver encore plus la dispersion de l’information (ChatGPT Projects are fancy folders for your AI chats). Je ne vois que Microsoft pour mettre un terme à tout ceci et intégrer des agents intelligents d’indexation des fichiers bureautiques dans OneDrive ou dans Sharepoint. Mais ils ont visiblement d’autres projets…

Après les app stores internes, les agents stores internes = 😁

Comme expliqué récemment, nous sommes arrivés aux limites de ce que les chatbots ont à nous offrir. Le marché s’est donc naturellement réorienté vers une nouvelle solution miracle pour continuer à faire rêver les clients potentiels : Web agentisé, quand l’industrie de l’IA cherche sa nouvelle ‘Next Big Thing’.

Le web « agentique » est donc la nouvelle marotte des experts en IA, tous les grands éditeurs ne jurent plus que par lui et tentent de nous convaincre que leurs agents sont plus intelligents que ceux des autres : Salesforce’s Agentforce Is Here: Trusted, Autonomous AI Agents to Scale Your Workforce, Box continues to expand beyond just data sharing, with agent-driven enterprise AI studio and no-code apps, HubSpot Introduces Agent.AI: The “Only” Network of AI Agents, Amazon’s Q Business AI agents get smarter, Introducing Google Agentspace: Bringing AI agents and AI-powered search to enterprises, Microsoft’s new Copilot Actions use AI to automate repetitive tasks

Tous ces agents sont proposés dans des environnements clos, il n’y a que Hubspot pour les exposer dans une place de marché librement accessible sur Agent.ai. Les agents intelligents sont-ils les nouveaux navigateurs web ? Certainement, mais ça ne va pas se faire tout seul.

Enfin des considérations environnementales pour l’IA générative = 😁

Vous n’êtes pas censé ignorer que les services reposant sur les modèles génératifs consomment bien plus d’énergie que les services numériques traditionnels. Si vous ne le saviez pas, je vous recommande cet article très didactique du Washington Post (A bottle of water per email: the hidden environmental costs of using AI chatbots) ou cette étude publiée sur HuggingFace (The Environmental Impacts of AI).

Oui, la facture environnementale du boom de l’IA générative va être très élevée, voilà pourquoi les éditeurs se tournent maintenant vers des modèles offrant le meilleur compromis entre puissance et consommation d’énergie (Meta’s new Llama 3.3 aims for efficiency with lower computing needs et Un Ministral, des Ministraux), ainsi que des solutions matérielles (Microsoft Unveils Zero-Water Data Centers to Reduce AI Climate Impact).

La question environnementale de l’IA n’est donc plus taboue, d’autant plus qu’elle prend des dimensions politiques, avec notamment le dernier rapport de l’ADEME (La sobriété numérique : clé de voute pour une transition écologique réussie) et l’orientation donnée à la futur giga-conférence sur l’IA qui sera organisée à Paris (French AI summit to focus on environmental impact of energy-hungry tech). Ce qui est certain, c’est que nous ne sommes pas les seuls à nous pencher sur la question : AI boom thrusts Europe between power-hungry data centers and environmental goals. Le tout étant de trouver le bon équilibre…


Ceci conclut le bilan de mes prédictions 2024. Je vous retrouve dans les prochains jours pour la publication de mes prédictions 2025.



Source link