L’IA est un concept, pas un produit – FredCavazza.net

Depuis son lancement, ChatGPT nous est présenté comme la solution miracle à tous nos problèmes, le nouvel étalon référence des services numériques. Une assertion des plus étrange pour ce qui n’est, jusqu’à preuve du contraire, qu’un démonstrateur technique. Malgré tout le mal que se donnent les nouveaux techno-prophètes, il semble évident que nous ne parviendrons jamais à apprendre à prompter à l’ensemble des collaborateurs ou des utilisateurs. La dure réalité est qu’il est quasiment impossible de vendre l’IA en tant que produit, car c’est un concept technologique trop abstrait pour le grand public, et même pour les professionnels. Partant de ce constat, Apple a choisi une approche en rupture pour intégrer l’IA à son offre en proposant des fonctionnalités minimalistes, mais mieux maitrisées que la concurrence.

#IA #GenAI

En synthèse :

Il n’y a pas réellement de « marché » de l’IA générative, uniquement des briques technologiques plus ou moins bien maitrisées ;
Les éditeurs de grandes et petites tailles s’affrontent à coup de milliards de $ pour mettre au point le modèle génératif le plus puissant, sans se soucier des frais de fonctionnement ou de l’impact environnemental ;
Les prédictions mirobolantes sur la croissance des usages de l’IA ne semblent pas tenir compte de la difficulté d’adoption que vont rencontrer les utilisateurs qui ne sont pas familiers avec les techniques de prompting ;
Apple propose une approche minimaliste pour intégrer l’IA à ses terminaux et services, une façon très efficace de se démarquer de la concurrence et de garantir une meilleure expérience ;
Les fonctionnalités bridées proposées par Apple ne concernent que les terminaux existants, ce qui laisse l’opportunité à d’autres fabricants comme Meta de se positionner sur la « Next Big Thing », les lunettes connectées équipées d’un assistant numérique.

Il ne vous a sans doute pas échappé que l’IA générative est actuellement un marché très déstructuré avec de nombreux modèles proposés en plusieurs versions et une encore plus grande quantité d’applications et services en ligne (ex : Claude, Perplexity…). Un gros fourre-tout que l’on peut difficilement qualifier de « marché » tant les offres disponibles et technologies utilisées sont différentes…

Que cet ensemble hétérogène de technologies et offres soit qualifiable de marché ou non, force est de constater que tous ces services en ligne offrent beaucoup de possibilités, surtout pour ceux qui savent s’en servir, mais aussi beaucoup de dérives potentielles. Ceci explique l’approche très prudente adoptée par Google, Microsoft ou Meta qui semblent en retard, mais sont juste contraints par leurs obligations d’entreprises cotées en bourse (et accessoirement surveillées de très près par l’UE).

Je pense ne pas me tromper en écrivant que le « marché » de l’IA générative est en réalité composé de services en ligne reposant sur des briques technologiques payantes ou gratuites, mais qu’il n’y a pas encore réellement de produits grand public capables de séduire des centaines de millions d’utilisateurs et de les inciter à changer d’habitudes (Chatbots et agents intelligents ne sont qu’une étape intermédiaire vers les assistants numériques). Il y a bien des services qui font de gros efforts pour proposer une interface susceptible d’être facilement comprise par le plus grand nombre comme Firefly d’Adobe, mais ça reste un outil dédié aux professionnels ou aux passionnés.

De plus, il n’y a pas réellement de consensus sur ce qu’est l’IA. Plutôt qu’une technologie, je préfère décrire l’IA comme un concept, l’idée que l’on puisse déléguer aux machines le soin de réfléchir à notre place (cf. L’intelligence artificielle est-elle une révolution ?).

Donc pour le moment, le « marché » de l’IA générative se résume à une infinité de startups qui proposent toutes plus ou moins la même chose (des outils de génération de contenus) reposant sur des modèles payants édités par des sociétés privées de petites et grandes tailles (OpenAI, Anthropic, Mistral, Google, Microsoft, Amazon…). Les concurrents étant nombreux et le nombre de clients étant encore limités, les grands éditeurs se sont lancés dans une course à l’armement pour mettre au point le modèle le plus puissant pour pouvoir se différencier et justifier le prix des abonnements. Ce qu’ils ont du mal à faire, car les outils d’évaluation ne permettent pas d’identifier de leader, et surtout parce que les modèles open source (Llama de Meta, Falcon de TII, Qwen d’Alibaba…) offrent des performances très proches des modèles commerciaux.

Qu’importe, les perspectives de croissance (et de revenus) sont tellement mirifiques, que tout ce petit monde s’affronte à coup de milliards de $. Vous vous doutez bien que dans ce contexte ultra-concurrentiel les nouveaux entrants n’ont quasiment aucune chance. Il fallait donc une approche alternative pour que’Apple puisse s’y faire une place.

Apple Intelligence est l’iPod de l’IA générative

Après des semaines de spéculations, l’offre d’Apple en matière d’intelligence artificielle nous a enfin été révélée lors de la WWDC de la semaine dernière : Apple Intelligence: every new AI feature coming to the iPhone and Mac. Apple a toujours eu une approche très maline de l’innovation, attendant que les pionniers défrichent le marché avant de s’imposer avec une offre simple et sexy comme cela été le cas pour l’iPod, l’iPhone, l’iPad, l’Apple Watch… Ce n’est pas tant la maitrise technique qui a fait le succès de ces produits, mais la capacité d’Apple de mettre sur le marché une offre fiable, facile à prendre en main et parfaitement intégrée aux autres produits. La stratégie d’Apple pour intégrer l’intelligence artificielle à ses terminaux et services ne déroge pas à la règle, car ils proposent, ou plutôt vont proposer une approche minimaliste, mais parfaitement maitrisée pour pouvoir garantir une expérience sans faille : Apple Intelligence.

Ce qui surprend le plus, au premier abord, est qu’il ne sera pas possible de formuler des demandes ouvertes (des prompts), mais que toutes les interactions se feront à travers des commandes simplifiées pré-définies (ex : « Rewrite this mail to be more friendly« ). Une décision radicale qui va faire tiquer les puristes, mais qui je pense conviendra tout à fait aux milliards d’utilisateurs des outils numériques qui ne savent pas prompter, ou qui n’ont pas l’intention d’apprendre, ce qui est potentiellement un énorme frein à l’adoption des offres actuelles.

Tout le travail de création / manipulation des contenus reposera sur des modèles génératifs ultra-optimisés tournant en local (sur iPhone, iPad ou Mac). Cette stratégie de mise sur le marché de l’IA générative est parfaitement résumée dans le slogan annoncé en début de présentation : » AI for the rest of us« .

Pour ce qui est du détail des fonctionnalités exactes, en voici un résumé :

Manipulation de contenus (réécriture, reformulation et résumé de textes dans diverses applications comme Mail, Notes ou Pages) ;
Notifications prioritaires (les notifications les plus importantes seront mises en avant) ;
Transcription audio (retranscription et résumé des contenus audio des applications Notes et Téléphone) ;
Image playground (génération d’images et d’emojis selon trois styles prédéfinis : animation, illustration et sketch) ;
Recherche avancée dans Photos (utilisation de descriptions verbales pour trouver des photos) ;
Nouveau Siri (refonte de l’assistant numérique pour pouvoir l’utiliser de façon contextuelle, le laisser comprendre le contexte d’usage) ;
Intégration de GPT dans Siri (utilisation de ChatGPT ou d’autres services externes pour générer des réponses plus précises).

Est-ce que Siri sera capable de commander des billets de train à votre place ? Oui, comme c’est déjà le cas depuis 10 ans avec Alexa ou l’Assistant Google par l’intermédiaire des services vocaux (respectivement les skills et les actions). L’ambition d’Apple est donc de rattraper son retard et de proposer une nouvelle version de Siri capable de réaliser bien plus de choses qu’avant, et surtout plus de choses que ChatGPT (lire à ce sujet : Les assistants numériques en 5 questions).

Nous pourrions faire le parallèle de cette stratégie de lancement avec le Macintosh ou l’iPhone, mais l’exemple le plus représentatif est, je pense, celui de l’iPod qui était un lecteur multimédia beaucoup plus limité que les lecteurs MP3 de l’époque, mais bien plus simple à utiliser (synchronisation) et surtout bien mieux intégré à l’écosystème Apple (notamment iTunes).

Est-ce que la messe est dite : Est-ce qu’Apple a plié le marché de l’IA générative ? Non, absolument pas, et ce pour plusieurs raisons. Premièrement, car Apple Intelligence ne sera disponible que partiellement en fin d’année, et probablement que pour les utilisateurs américains : Apple’s Slow Rollout of Intelligence Features Will Stretch Into 2025.

Deuxièmement, car toutes ces fonctionnalités ne seront accessibles qu’aux derniers modèles de chaque gamme, notamment l’iPhone 15 Pro (qui représente moins de 5% des appareils en circulation : iPhone 15 adoption rate worldwide) et des Macs équipés de puces de la série M.

Je ne suis pas statisticien, mais au vu des prix de vente, Apple Intelligence ne devrait être disponible que pour moins de 10% des utilisateurs d’iPhone, iPad ou Mac. Nous parlons ici de 100 à 150 M d’utilisateurs d’ici à la fin de l’année, donc bien loin des 2 milliards annoncés triomphalement par les adorateurs du culte de la Pomme.

Pourquoi une si faible part des utilisateurs de produits Apple ? Car faire tourner en local un modèle génératif dans de bonnes conditions requiert de la puissance et de la mémoire, donc des composants de dernière génération. Une réalité informatique à laquelle même Microsoft est soumise, puisque la version locale de Copilot ne pourra tourner que sur un nombre très limité d’ordinateurs : Une nouvelle ère de l’informatique s’ouvre avec les AI PC.

Il va donc falloir attendre un certain nombre d’années avant qu’Apple Intelligence soit utilisé par la majorité des clients d’Apple. Un contre-temps qui ne semble pas les gêner, car leur ambition n’est pas d’être l’acteur le plus innovant, mais le plus rentable. Sous cet angle, il est important de rappeler que le « marché » de l’IA générative représente pour le moment un C.A. cumulé encore inférieur à celui du segment des AirPods (cf. cette très juste analyse de Scott Galloway : Second Mouse.AI).

Troisième précision importante : toutes les fonctionnalités offertes par Apple Intelligence seront gratuites. L’objectif poursuivit par Apple n’est pas de gagner de nouveaux clients, mais de fidéliser les clients existants, de les inciter à accélérer le renouvellement de leurs terminaux (iPhone, iPad, Mac). Ils ne veulent pas dominer le marché comme OpenAI, mais faire d’Apple Intelligence un levier de différenciation comparable à celui utilisé par Google avec sa gamme de smartphones Pixel (Google bringing Gemini Nano to Pixel 8).

Mais la stratégie d’Apple ne se résume pas à ça, car ils ont réellement pensé à tout…

Une architecture hybride intégrée pour optimiser le fonctionnement et garantir la viabilité

Ceux qui suivent le sujet de près savent que Microsoft et Google proposent déjà des fonctionnalités équivalentes si ce n’est supérieures à celle du futur Apple Intelligence sur PC et Android. Mais ils ne le font pas de façon aussi bien maîtrisée et sécurisée. La WWDC a ainsi été l’occasion pour Apple de détailler l’architecture logicielle et matérielle mise en place pour ces futures fonctionnalités, et le moins que l’on puisse dire est qu’ils proposent quelques chose de parfaitement cohérent.

Ainsi, les fonctionnalités offertes par Apple Intelligence reposeront sur des modèles génératifs développés en interne (dont nous avions déjà pu avoir un aperçu : Apple releases OpenELM: small, open source AI models designed to run on-device) qui revendiquent des performances supérieures aux modèles existants, mais uniquement sur les quelques fonctionnalités proposées. Nous sommes ici tout à fait en présence de SLMs, de Small Language Models (3 milliards de paramètres).

Ensuite, toutes les interactions entre les modèles et les applications reposeront sur la « App Intents Toolbox », donc une gestion des demandes et réponses faite par le système d’exploitation pour une meilleure maitrise et surtout pour éviter tout débordement. Les applications pouvant être exploitées à travers Apple Intelligence seront réparties dans 12 types d’actions avec des connecteurs pour simplifier leur utilisation via Siri.

Apple Intelligence utilisera également un index sémantique capable de référencer toutes les informations et applications présentes sur le terminal. C’est grâce à cet index que Siri sera en mesure de comprendre quand vous lui direz : « Retrouve l’email de ma mère qui parle de l’anniversaire de Gérard » ou encore « Résume le PDF mentionné par Francis dans son dernier message ».

Enfin, un cloud privé sera utilisé pour traiter les demandes les plus complexes (avec des modèles plus puissants tournant sur des serveurs équipés de puces Apple, pas Nvidia). Il y aura également la possibilité de solliciter des LLMs externes (ex : GPT, Gemini…), mais sans transfert de données.

Cette keynote d’Apple était censée être la consécration pour OpenAI avec les rumeurs d’un partenariat juteux. Au final, ils n’occupent ni le siège passager, ni le siège arrière de la stratégie de productisation de l’IA par Apple : ChatGPT sera la roue de secours d’Apple Intelligence sur iPhone ! (cf. The complicated partnership between Apple and OpenAI).

Le principal enseignement de cette WWDC est qu’Apple mise sur une architecture hybride conçue pour maximiser la sécurité et la confidentialité. Rien à redire, c’est très bien conçu et présenté, une véritable masterclass en matière de différenciation par rapport aux offres proposées par Google, Microsoft ou Amazon qui reposent sur la puissance de calcul et la modularité.

Cela ne veut pas non plus dire que l’approche d’Apple est fermée, car ils partagent avec la communauté leur vision, leurs modèles et leurs jeux de données de façon très transparente : Apple embraces open-source AI with 20 Core ML models on Hugging Face platform.

Limiter les possibilités offertes par les modèles génératifs à quelques fonctionnalités va-t-il brider la créativité des utilisateurs ? Ou certainement, dommage pour le « Think Different », mais ça se fera au profit de la maitrise et de la sécurité (Apple’s AI will erode human creativity one prompt at a time).

Maintenant que toutes ces précisions sur la stratégie d’implémentation de l’IA par Apple ont été apportées, la question que tout le monde se pose est la suivante : Pourquoi Apple réussirait là où Google et Microsoft ont autant de mal ?

Une stratégie simple pour Apple qui ne concerne que le grand public

Écrire que les lancements des versions grands publics de de Gemini et Copilot par Google et Microsoft ont été laborieux serait un euphémisme. L’erreur qu’ils ont faite est d’avoir cherché à proposer le service le plus puissant, alors que la technologie sous-jacente n’est pas (encore) maitrisée, d’où les ratés dont les médias se délectent : Google AI Overviews under fire for giving dangerous and wrong answers.

Apple opte donc pour une stratégie de mise sur le marché à contre-courant des autres big techs qui cherchent avant tout à faire-valoir leurs capacités techniques. Apple Intelligence est ainsi ce que l’on peut considérer comme le premier produit d’IA générative grand public pour un marché encore balbutiant.

La grande différence est que Microsoft et Google sont des sociétés technologiques qui ont des offres technologiques à vendre aux entreprises (principalement dans le cloud), tandis qu’Apple est une société d’électronique grand public qui cherche avant tout à fidéliser ses clients avec des nouvelles fonctionnalités utiles ou amusantes.

Ce ne sont donc ni les mêmes cibles, ni les mêmes cultures d’entreprise :

Microsoft est un éditeur de logiciels, la culture interne pousse les équipes à utiliser l’IA générative pour enrichir les logiciels existants (Windows, Office…) ;
Google est un fournisseur de services, la culture interne pousse les équipes à utiliser l’IA générative pour enrichir les services existants (Search, Ads…) ;
Apple est un fabricant de terminaux, la culture interne pousse les équipes à utiliser l’IA générative pour enrichir les terminaux existants (iPhone, iPad, Mac…).

Chacun boxe dans sa catégorie, ce qui est parfaitement logique, sauf que Microsoft et Google lorgnent sur d’autres activités et commercialisent depuis quelques années leurs propres gammes de terminaux (les PC hybrides Surface pour Microsoft et les smartphones Pixel pour Google). Dans la mesure où l’offre Apple Intelligence ne sera pas disponible avant la fin de l’année, il y a fort à parier que les équipes de Microsoft et Google vont redoubler d’efforts pour aligner leur offre sur celle d’Apple et proposer des niveaux équivalents de simplicité, de sécurité et de confidentialité. Je ne suis pas devin, mais je suis persuadé que nous verrons les premiers signaux de changement de stratégie marketing pour Microsoft et Google dans les prochaines semaines.

Je conclus cette partie de mon analyse avec une dernière différence entre les trois géants numériques, et pas des moindres : les fonctionnalités proposées dans le cadre d’Apple Intelligence sont destinées au grand public, donc seront gratuite. Le but de la manoeuvre pour Apple n’est pas créer de nouvelles sources de revenus, mais de motiver ses clients à renouveler leurs terminaux. Ceci explique l’approche minimaliste de l’IA générative, le but est de limiter les frais d’exploitation tout en proposant la meilleure expérience possible (les fonctionnalités les mieux maitrisées). La situation est très différente pour Microsoft et Google dont les versions gratuites de Copilot et Gemini sont des produits d’appel pour les versions payantes proposées aux professionnels. Il y a pour eux l’obligation de proposer des fonctionnalités beaucoup plus puissantes, donc plus coûteuses (d’où l’abonnement à 30$ / mois).

Je pense ne pas me tromper en écrivant que la stratégie d’Apple est de stimuler les revenus à court terme (accélérer le rythme de renouvellement des appareils), tandis que Microsoft et Google misent sur des revenus à moyen ou long terme (augmenter le prix des licences BtoB en y intégrant la promesse d’une IA générative sur-puissante).

La question que vous êtes en droit de vous poser est de savoir quelle pourrait être la meilleure stratégie de monétisation de l’IA générative à moyen ou long terme pour les clients BtoC, donc pour les fabricants de terminaux numériques.

Apple vient de tuer dans l’oeuf le créneau des « AI smartphones », quid des « AI wearables » ?

Intégrer des fonctionnalités reposant sur l’IA dans un smartphone n’est pas une idée originale. Google le fait depuis de nombreuses années avec sa gamme Pixel, mais les choses se sont accélérées ces derniers mois avec la vague d’enthousiasme autour des modèles génératifs. Plusieurs fabricants ont ainsi tenté de prendre de vitesse le marché en s’imposant sur le créneau des « AI smartphones » : With the New Galaxy S24, Samsung Is Going All-in on AI.

Maintenant qu’Apple a dévoilé ses cartes, nous pouvons partir du principe que le créneau des « AI smartphones » est mort-né, car d’ici à l’année prochaine, quasiment tous les smartphones proposeront des fonctionnalités plus ou moins avancées reposant sur des modèles génératifs exécutés en local (ex : retouche photo, traduction et retranscription audio, synthèse…).

À court terme, la stratégie d’Apple est donc claire : capitaliser sur sa gamme de terminaux (iPhone, iPad, Mac…) en augmentant leur valeur perçue grâce à l’IA générative. Sont-ils en mesure d’élargir leur gamme avec de nouveaux types de terminaux ? Je ne suis pas certain, car ils viennent de se lancer dans un gros paris sur l’informatique spatiale avec le Vision Pro. Dans la mesure où les actionnaires d’Apple n’apprécient pas trop la prise de risque, il y a assez peu de chance pour que les équipes se lancent dans une nouvelle diversification. D’autant plus que la commercialisation de leur tout nouveau masque de réalité mixte ne se passe pas comme prévue : Apple suspends work on next Vision Pro, focused on releasing cheaper model in late 2025.

Ceci laisse le champ libre à d’autres constructeurs pour sortir un terminal alternatif reposant sur l’IA, à l’image de ce que proposent Humane ou Rabbit (lire à ce sujet : Les IA génératives (re)lancent le segment des accessoires connectés). Ceci étant dit, nous constatons que les premiers terminaux connectés dopés à l’IA viennent à peine de sortir que la fenêtre de tir semble déjà se refermer : How Humane’s Pin A.I. Device Flopped.

Est-ce à dire que le marché n’est pas viable ? Non, simplement que le timing n’est pas le bon, et surtout que ce marché en devenir va nécessité énormément de moyens et beaucoup de patience. Nous sommes très clairement dans une configuration où il va falloir créer un marché à l’aide d’une proposition de valeur suffisamment forte pour inciter les utilisateurs de smartphones à changer leurs habitudes. Et depuis le temps que l’on nous promet la « Next Big Thing », je ne vois que les lunettes connectées équipées d’un assistant numérique pour supplanter les smartphones.

Autant l’écrire tout de suite : c’est un chantier titanesque qui va exiger des moyens colossaux (nous parlons de plusieurs dizaines, voir centaines de milliards de dollars pour mettre au point une technologie de rupture et l’imposer sur le marché). De nombreuses conditions vont être nécessaires pour réussir ce tour de force : les prétendants vont devoir cumuler la vision, l’ambition, le savoir-faire et les ressources pour y parvenir.

Selon cette optique, un certain nombre de candidats potentiels vous viennent potentiellement à l’esprit :

OpenAI dispose de la vision et de l’ambition, mais ils ne possèdent pas le savoir-faire matériel ou les ressources financières nécessaires (du moins pas encore : Jony Ive and Sam Altman’s AI device startup in funding talks) ;
Microsoft et Google disposent du savoir-faire matériel et des ressources, mais leur vision est émoussée suite aux précédents échecs (Hololens, Glass, Daydream…) ;
Amazon dispose des ressources financières et du savoir-faire matériel lié à la gamme Echo, mais ils manquent d’ambition pour se positionner sur des appareils connectés plus sophistiqués (plus que les lunettes Frame) et souffre d’un retard apparent avec leur assistant numérique (Amazon is reportedly way behind on its new Alexa) ;
Samsung dispose également des ressources financières et du savoir-faire matériel, mais il leur manque la vision et les compétences en IA.

Par élimination, on se rend vite compte que la liste des candidats potentiels à la « Next big thing » se réduit très rapidement à un seul prétendant : Meta (cf. Réalité mixte : Meta contre-attaque).

Au final, Meta est le seul acteur capable de mettre rapidement sur le marché des lunettes connectées avec une proposition de valeur suffisamment forte pour détrôner les smartphones. Quand on y réfléchit bien, ils sont les seules à avoir la vision, l’ambition, les compétences, les capacités, la liberté d’action… et en plus, leur approche incrémentale avec leurs lunettes connectées semble porter ses fruits : Ray-Ban Meta smart glasses just got a ton of upgrades, including new AI features and video calling et The Meta Ray-Ban Wayfarers Are the Best Face Computer.

Ils sont de plus en train de procéder à une réorganisation pour faire converger les efforts et les talents (Meta forms new Wearables group), l’idée étant d’aborder la réalité mixte, le métavers et l’IA sous un seul angle, ou du moins d’éviter un éparpillement des ressources trop apparent.

Les équipes de Meta vont-elles réussir à prendre de vitesse celle d’Apple pour mettre sur le marché la fameuse « Next Big Thing » ? Je n’en ai aucune idée, car il y a beaucoup trop d’inconnues dans cette équation complexe. Pour le moment, tous les regards sont braqués sur OpenAI, la locomotive de l’IA générative, mais Apple vient d’exposer une stratégie très différente pour monétiser les modèles génératifs. C’est assurément une très bonne chose, car nous avions besoin d’un point de vue plus pragmatique, plus réaliste et surtout beaucoup plus économe de l’IA.

Est-ce la fin de la course au gigantisme et à l’IA généraliste ? Non pas réellement, mais au moins, nous avons maintenant une approche alternative qui est cautionnée par un acteur de référence.

Source link