GPT-4 enfin détrôné ?
GPT-4 détrôné, Elon Musk fait des siennes, et la première IA développeur voit le jour, ces derniers jours ne nous ont pas laissé le temps de nous ennuyer ! Tout ce que vous devez savoir, résumé ici.
Au programme cette semaine:
GPT-4 n’est plus à la tête du classement des meilleurs LLMs
Frictions entre Elon Musk et OpenAI
Devin AI: la première IA développeur
Grok Open Source, et Grok-1.5 en préparation
Mamba, la nouvelle architecture prometteuse
Ideogram, une nouvelle IA pour créer des images
Quelques astuces IA particulièrement utiles
Et bien plus encore dans cette édition de L’IA en Action !
Si vous souhaitez être tenu au courant en avant-première des nouveautés du monde de l’IA, n’hésitez pas à me suivre sur les différents réseaux accessibles ici :
Bonne lecture !
Les Actualités du Monde de l’IA
Les grands titres
Anthropic sort Claude 3, sa nouvelle génération de modèles, et détrône GPT-4. Le 4 mars 2024, Anthropic, l’une des grosses startups américaines spécialisées dans l’IA, et dans la création de modèles de langage, annonce sa toute nouvelle famille de modèles : Claude 3. L’annonce est accompagnée d’une comparaison des performances entre ces nouveaux modèles, GPT et Gemini.
Dans cette dernière, Claude 3 Opus, modèle le plus performant de cette nouvelle famille parait meilleur que tous les autres, mais qu’en est-il réellement ? L’organisation The Large Model Mystems Organization s’est attelée à effectuer une comparaison plus poussée (plus de détails ici), et quelques jours plus tard, le résultat tombe : Claude 3 Opus a bel et bien pris la tête du classement des modèles de langage !
Depuis sa sortie, c’est la première fois que GPT-4 est détrôné, une grande première dans le domaine qui annonce peut-être le début d’une compétition de plus en plus serrée entre les géants du domaine.
OpenAI annonce son modèle de création de voix ! Après avoir récemment fait beaucoup de bruit sur les réseaux avec Sora, son modèle de création de vidéos, le géant américain leader de l’IA a annoncé son IA pour la création de voix. A partir d’un enregistrement de 15 secondes, ce dernier est capable de créer des audios réalistes en répliquant très fidèlement la voix de l’orateur original. Le développement de ce modèle aurait commencé fin 2022, soit près d’un an et demi avant l’annonce. Le modèle n’est pas encore disponible publiquement et aucune date de sortie n’a été communiquée pour le moment.
Devin : la première IA développeur. Une nouvelle qui a fait beaucoup de bruit sur les réseaux ces derniers temps est l’annonce de Devin. Développée par Cognition, cette IA a pour objectif d’être en mesure de coder un projet complet de manière autonome à partir d’une simple description. Le principe est simple: l’utilisateur donne une description du projet qu’il souhaite réaliser, l’IA analyse cette dernière, définit une liste de tâches à accomplir, et les effectue une par une. Pendant ce temps, l’utilisateur peut toujours interagir avec l’IA pour par exemple lui communiquer des modifications à effectuer. L’IA peut apprendre à utiliser de nouvelles technologies de manière autonome, et a passé avec succès de nombreux tests techniques d’embauche pour développeurs. L’équipe derrière ce projet est composée de certains des meilleurs développeurs mondiaux, ce qui laisse présager du bon quant à la qualité des résultats. Si vous souhaitez en savoir plus n’hésitez pas à visionner la vidéo ci-dessous ou à consulter leur site.
Les actualités diverses
Inflection, l’une des grandes startups américaines travaillant sur le développement de modèles de langages, a annoncé une grosse mise à jour pour Pi, son agent conversationnel, qui utilise maintenant Inflection-2.5, leur tout dernier modèle, aux performances comparables à celles de GPT-4. Source
Querelles entre Elon Musk et OpenAI : Elon Musk a porté plainte contre OpenAI en leur reprochant de ne pas respecter leur engagement initial : créer de l’IA ouverte. Il a annoncé qu’il abandonnerait le procès si l’entreprise se renommait “ClosedAI”, soit littéralement “IA fermée”. Cette dernière a répliqué en expliquant que le terme “Open” désignait uniquement le fait de rendre les technologies utilisables par tous, mais pas forcément gratuitement, ni en partageant les connaissances. Des mails ont par ailleurs été dévoilés, montrant qu’Elon souhaitait initialement s’approprier l’entreprise pour la fusionner avec Tesla. Source
Elon Musk n’a pas manqué d’idées pour faire parler de lui ces derniers temps puisqu’outre l’actualité précédente, il a également annoncé rendre Open Source (libre de droits) Grok, le modèle de langage développé par son entreprise xAI spécialisée dans l’IA. Il a tenu sa parole et rendu public le code quelques jours plus tard, vous pouvez y accéder ici. xAI a par ailleurs annoncé une nouvelle version de l’IA: Grok-1.5. Source
Un tout nouveau modèle prend la tête du marché des LLMs Open Source : DBRX ! Développé par l’entreprise Databricks, ce modèle sorti fin mars présente de très bonnes performances, meilleures que celles des modèles ouverts disponibles jusqu’alors, ce qui lui a permis de très rapidement gagner en popularité. Source ; Annonce de la sortie
OpenAI + Figure : Des robots qui utilisent ChatGPT pour comprendre leur environnement. L’entreprise Figure a récemment annoncé un partenariat avec OpenAI pour repousser les limites de la robotique. Ils ont publié leurs premiers résultats qui montrent un robot capable d’utiliser ChatGPT pour comprendre son environnement, et qui utilise L’IA de figure pour effectuer les actions souhaitées. Source
Recherche et Innovation
Le papier de recherche de Stable Diffusion 3 est disponible ! Tous les secrets du meilleur modèle Open Source de création d’images vous y sont dévoilés. Ils y expliquent notamment la structure utilisée pour le modèle, ainsi que la manière dont ils ont amélioré une technique appelée "flux rectifié" qui permet de créer une image claire et détaillée à partir d'un ensemble de données initialement aléatoires, en suivant précisément les instructions du texte. Toutes les informations sont disponibles ici.
L’université du Texas à Austin et le FAIR présentent VoiceCraft, un modèle complètement Open Source pour l'édition d’audio et la conversion de texte en audio (TTS) ! Grâce à une architecture de décodeur Transformer et une technique de réarrangement des tokens, VoiceCraft génère des discours modifiés presque indiscernables des enregistrements originaux en termes de naturalité. Il excelle également en TTS sans exemple préalable (0 shot), montrant une performance impressionnante comparée à d'autres modèles. L'approche unique de VOICECRAFT promet beaucoup d’applications pratiques et rend la synthèse vocale plus accessible et naturelle. Pour en savoir plus, rendez-vous ici !
Mamba, l’avenir des architectures de modèles de deep learning ? Les architectures de type Transormer règnent sans partage dans le monde du deep learning depuis la sortie du papier Attention is all you need, cependant, depuis quelques temps, et notamment depuis la sortie du papier de Mamba, qui propose une nouvelle architecture prometteuse, les choses commencent à bouger. Aujourd’hui, AI21 labs présente Jamba un nouveau modèle de langage basé sur une architecture hybride, combinant des couches de type Transformer et Mamba avec un système de mélange d'experts (MoE). Cette combinaison permet à Jamba de bénéficier des avantages de ces deux types de modèles, tout en maintenant une utilisation efficace des paramètres. Jamba présente de très bons résultats sur des benchmarks standards de modèles de langage et peut gérer des contextes longs jusqu'à 256K tokens, offrant à la fois une haute capacité de traitement et une empreinte mémoire réduite par rapport aux modèles Transformer traditionnels. Cerise sur le gâteau, Jamba est Open Source. Vous pouvez retrouvez toutes les ressources associées ici.
Le Top des Outils et fonctionnalités
Vous connaissez forcément Midjourney, qui est actuellement la meilleure IA du marché pour la création d’images à partir de descriptions textuelles. L’entreprise a récemment ajouté une nouvelle fonctionnalité très prometteuse: les personnages de référence ! Un problème fréquemment rencontré lors de la création d’images par IA est la création de plusieurs images différentes contenant un même personnage. Souvent, l’IA a du mal à rester constante dans la création du personnage et fais donc quelques modifications indésirables sur ce dernier. Pour palier à ce problème, il est maintenant possible sur Midjourney d’utiliser l’option “—cref [lien vers une image de référence]” pour donner le personnage de référence à l’IA et obtenir une bien meilleure constance ! Pour en savoir plus, voici un très bon thread sur le sujet.
Source de l’image: @HalimAlrasihi sur X
Dans la même veine, une nouvelle IA pour la création d’images à partir de texte a fait son apparition récemment sur le marché : Ideogram !
Les gros avantages : cette IA est utilisables gratuitement (25 prompts par jour), donne de bons résultats, (parmi les meilleurs pour une IA utilisable gratuitement), et respecte très bien le texte dans les images qu’elle crée ! Si vous voulez tester par vous même pour vous faire un avis, ça se passe juste ici.
La traduction de vidéos automatique par IA se développe de plus en plus, et aujourd’hui c’est Pipio qui lance sa version, qui parait très prometteuse ! Le principe est simple : l’utilisateur envoie sa vidéo à l’IA et choisit une langue, et cette dernière va automatiquement cloner la voix et traduire le script pour créer un nouvel audio avec la même voix dans la langue ciblée, tout en modifiant les images pour obtenir une bonne synchronisation labiale. Pour tester, vous pouvez accéder à leur site ici.
L’IA en Action !
Il est désormais possible d’utiliser Copilot dans les versions en ligne gratuites de Word, Excel et PowerPoint ! Pour cela vous avez besoin d’un abonnement à Copilot Pro (plus d’informations ici).
Voici comment faire :
Rendez-vous sur le site de OneDrive.
Connectez-vous avec votre compte Microsoft sur lequel vous avez Copilot Pro.
Sélectionnez l'icône "+" dans le coin supérieur gauche.
À partir de là, vous pouvez créer un nouveau document Word, Excel ou PowerPoint.
Une fois votre fichier ouvert, recherchez l'icône Copilot dans le coin supérieur droit (elle peut se trouver dans le menu “…”). Dans Word, elle apparaît également dans la marge de la page
Cliquez sur l'icône Copilot pour commencer à l'utiliser.
Vous pouvez directement poser vos questions ou vos instructions dans la boîte de dialogue Copilot qui apparaît.
Astuce tirée du thread de @itsPaulAi sur X. Pour en savoir plus sur l’utilisation de Copilot dans les applications Microsoft, vous avez aussi ce thread.
Claude est capable de créer des animations automatiquement à partir d’une simple description ! Dans un post sur X, Alvaro Cintas explique qu’il a pu réaliser cette animation :
Simplement à partir de ce prompt: “Write manim code to animate an explanation of the Pythagorean Theorem. Think step by step before coding it and provide me with the full code”. Si vous voulez tester par vous même, Claude n’est pas disponible en Europe pour le moment mais vous pouvez utiliser un VPN et vous rendre sur leur site ici.
Si vous souhaitez vous améliorer dans la création prompt, ou simplement enrichir la collection de prompts que vous utilisez, les équipes en chargent du développement de Claude ont créé une bibliothèque complète de prompt accessible totalement gratuitement ! Pour y accéder, cliquez ici, et vous n’avez ensuite plus qu’a sélectionner vos préférés, comme par exemple l’expert en formules Excel, qui pourra vous aider à faire exactement ce que vous voulez sur Excel si vous ne maîtrisez pas parfaitement le logiciel.
Je suis depuis peu officiellement partenaire Holy ! Si vous appréciez mon travail et que vous souhaitez me soutenir, n’hésitez pas à consulter leur site et, si vous souhaitez acheter leurs produits, à utiliser mon code LEODESP5 pour une première commande, ou LEODESP pour n’importe quelle commande !
C’est déjà la fin de cette édition ! J’espère qu’elle vous aura plu, si vous voulez être tenu au courant de toutes les nouveautés en temps réel, n’hésitez pas à me suivre sur X en cliquant ici :
Toutes mes ressources sont à votre disposition ici :
Si ce n’est pas déjà fait, pour ne manquer aucun numéro de cette newsletter, n’hésitez pas à vous abonner ici :
Si vous souhaitez solliciter mes services pour de la formation d’entreprise sur des thématiques liées à l’IA, des projets en lien avec l’IA, ou pour sponsoriser cette newsletter ou l’une de mes vidéos, vous pouvez me contacter à cette adresse : contact.leodesp@gmail.com
Merci de m’avoir lu, et je vous souhaite de passer une bonne journée ! 😃