Décembre 2023: Les 4 guerres de l'intelligence artificielle
11 mois ago · Updated 11 mois ago
Alors que nous tournons la page de l'année 2023, les principaux théâtres de conflit parmi les startups en IA et les parties prenantes sont devenus évidents. Nous avons traduits pour vous cette excellente newsletter du 8 janvier 2024, signée par NOAH HEIN AND SWYX & ALESSIO
Pour vous abonner à leur newsletter, cliquez ici
La Guerre des Données
- OpenAI a annoncé un partenariat avec Axel Springer, rappelant son accord avec l'AP et son programme de partenariats de données.
- Le New York Times a intenté une action en justice contre OpenAI, exigeant la cessation de toutes les activités des GPTs. OpenAI considère cette plainte comme sans fondement, soutenant que l'utilisation de données publiques disponibles sur le web pour entraîner des IA est un usage équitable.
- Apple propose désormais des contrats de données de 50 millions de dollars aux éditeurs.
- L'intérêt pour les données synthétiques augmente, notamment à NeurIPS et chez Deepmind.
La Guerre GPU/Inférence
- Le prix par million de tokens générés par Mixtral a rapidement chuté de ~2$ à 0,27$ en une semaine.
- Des controverses autour des benchmarks entre Anyscale et d'autres fournisseurs d'inférence.
- De nouvelles recherches sur les architectures de modèles (Mamba, RWKV) et le déplacement des calculs hors Nvidia (Modular, tinycorp, Apple MLX) optimisent l'utilisation des ressources GPU existantes.
La Guerre de la Multimodalité
- Midjourney a lancé en douceur sa version 6 avec une interface web, générant plus de 200 millions de dollars par an.
- Assembly AI a levé 50 millions de dollars pour la série C, visant à « construire le Stripe pour les modèles d'IA ».
- Replicate, centré sur Stable Diffusion, lève 40 millions de dollars en série B pour servir les ingénieurs en IA.
- Suno AI sort de l'ombre et revient à une approche "monkey", tout en visant des améliorations ponctuelles, tandis qu'OpenAI et Google continuent de travailler sur des "God Models" qui rivalisent avec tous en même temps.
La Guerre RAG/Ops
- Débat sur la nécessité d'une base de données vectorielle, avec des utilisateurs avancés adoptant de nouvelles bases de données vectorielles comme turbopuffer.
- Débat entre LangChain (maintenant en v0.1, avec TED talk et enquête sur l'état de l'IA) et LlamaIndex (avec l'exécution d'agent par étapes).
- Développement continu des LLMOps (nouveau fichier .prompt de HumanLoop, Openlayer) versus des outils basés sur des frameworks comme LangSmith et de nouvelles approches comme Martian (qui a annoncé sa levée de fonds de 9 millions de dollars).
Ces "guerres" sont sélectionnées comme des composants essentiels de la « pile IA » où des sommes importantes d'argent sont investies et déployées. Le combat final se joue toujours pour l'utilisateur final, et l'industrie a également marqué de nombreux jalons ici, avec Glean levant des fonds à une valorisation de 2 milliards de dollars pour la recherche en entreprise, Perplexity (levée de fonds de Jeff Bezos) à une valorisation de 520 millions de dollars pour la recherche grand public, et Harvey à 715 millions de dollars pour l'assistance juridique. Le marché du financement pour chacune de ces startups verticales d'IA semble se situer autour de 70x l'ARR, un net premium par rapport aux tours de financement SaaS « fous » à 20x la valorisation. À mesure que l'industrie mûrit, la compression des multiples sera brutale, mais pas autant que le marché des infrastructures en ce moment…
- Comment est-ce que Facebook est rentable ? - 11 juillet 2024
- Révolution médicale : l'IA au service des victimes de brûlures - 11 juillet 2024
- Estée Lauder crée un laboratoire dédié à l'IA - 10 juillet 2024