Une version mini pour un grand potentiel
La domination de Chat GPT-4 pourrait toucher à sa fin avec l’arrivée d’un nouveau projet open-source appelé MiniGPT-4. Développé par un groupe d’étudiants, cette intelligence artificielle gratuite offre une performance presque similaire à celle de son prédécesseur. Il attire l’attention pour sa capacité à gérer efficacement des processus complexes de reconnaissance d’images.
Chat GPT-4 et son héritage
Chat GPT-4 est extrêmement populaire et reste la technologie d’intelligence artificielle la plus utilisée dans le monde. Les spécialistes l’utilisent de diverses manières, de la création d’applications et de sites Web à la résolution de problèmes divers ou à la programmation de jeux vidéo. MiniGPT-4 souhaite être une option plus efficace à “petite” échelle, en étant gratuit et en ne se limitant pas à des processus simples tels que la génération de visages factices avec l’IA.
Étudiants à l’origine de MiniGPT-4
Le projet MiniGPT-4 est le fruit du travail personnel d’une équipe d’étudiants de l’Université des Sciences et Technologies du Roi Abdullah, en Arabie Saoudite. Ils voulaient offrir une technologie similaire à Chat GPT-4 sans se contenter de copier son fonctionnement. Ils souhaitaient avant tout que ce soit un projet open-source et gratuit pour tous.
Les technologies utilisées
Le projet utilise le décodeur de langage Vicuna basé sur LlaMA et le composant avancé BLIP-2 spécialisé dans la reconnaissance d’images. Bien qu’il s’agisse d’un GPT-4 “mini”, les analyses montrent qu’il atteint une efficacité de 90%. Même si la performance de l’IA d’OpenAI est supérieure, celle des étudiants n’est pas loin derrière.
Les compétences de MiniGPT-4
MiniGPT-4 peut gérer presque tous les travaux de reconnaissance d’images comme Chat-GPT4, bien qu’avec un taux de réussite inférieur de 10%. Les responsables du projet ont partagé plusieurs exemples montrant les capacités d’analyse visuelle de leur IA.
Exemples de réussites et défis à relever
Parmi les exemples, l’IA a pu analyser la photo d’une plante malade avec précision. Cependant, MiniGPT-4 a encore du chemin à parcourir, comme en témoigne sa dépendance excessive à certaines expressions et phrases. Les développeurs estiment qu’une formation solide de l’IA pourrait résoudre ce problème. Actuellement, MiniGPT-4 peut analyser des photos, écrire des descriptions marketing, créer des chansons ou commenter des images de nourriture.
Le processus d’apprentissage
La version actuelle a été formée pendant 10 heures à l’aide de quatre GPU A100 et de 5 millions de paires de texte et d’image. Les passionnés d’IA pensent que MiniGPT-4 pourrait encore surprendre avec un peu plus de travail. Pour l’instant, vous pouvez essayer et découvrir les capacités de MiniGPT-4 en visitant leur site web sur Github.
Comment utiliser MiniGPT-4
MiniGPT-4 est une démonstration et en est actuellement à sa première version. Pour l’instant, il est accessible gratuitement sur le site officiel du groupe. Pour l’utiliser, il suffit de glisser une image ou de cliquer sur “Déposer l’image ici”. Une fois l’image téléchargée, saisissez votre requête dans la barre de recherche.
Quel type d’expériences pouvez-vous tenter ?
Demandez à MiniGPT-4 de décrire une image est une tâche assez simple. Mais peut-être avez-vous besoin d’un texte pour un post Instagram de votre entreprise. Ou peut-être voulez-vous connaître les ingrédients nécessaires pour un plat particulier, voire une recette pour le préparer. MiniGPT-4 peut gérer ces tâches de manière surprenante.
Les aspects de la programmation
Ces aspects sont un peu plus compliqués. Transformer un simple dessin sur une serviette en un site web fonctionnel était une démonstration présentée par OpenAI lors de l’annonce de GPT-4. Mais MiniGPT-4 ne semble pas être capable de gérer cela aussi bien pour l’instant. ChatGPT fournira un code plus précis – en fait, exécuter le code de MiniGPT-4 à travers ChatGPT ou GPT-4 vous donnera de meilleurs résultats.
Une chose à noter
Il est important de noter que MiniGPT-4 utilise le GPU de votre système local. Ainsi, à moins que vous n’ayez un GPU discret assez puissant, vous pouvez trouver l’expérience assez lente. Pour vous donner une idée, j’ai testé sur un MacBook Pro M2 Max, et il a fallu environ 30 secondes pour générer du texte basé sur une image que j’ai téléchargée.
Limites de MiniGPT-4
La vitesse de MiniGPT-4 est certainement une limitation. Si vous tentez d’y accéder sans un bon équipement graphique, il est trop lent pour offrir une expérience réactive. Si vous êtes habitué à la rapidité de ChatGPT basé sur le cloud, ou même de Bing Image Creator, MiniGPT-4 va vous sembler douloureusement lent.
Autres Limitations
Au-delà de cela, MiniGPT-4 a toutes les mêmes limitations que ChatGPT, Google Bard ou tout autre chatbot AI en ce sens qu’il peut “halluciner” ou inventer des informations.
Je suis Samuel Le Goff, à la tête de Menow.fr et père de deux enfants. À 38 ans, je navigue dans l’univers de l’informatique depuis plus de 14 ans, me spécialisant récemment dans le contenu high-tech et le gaming. Ma mission ? Partager des conseils pratiques et des insights en technologie, avec une touche d’honnêteté et d’authenticité, comme si je m’adressais à des amis.