ActualitéInformatique

Une nouvelle technologie permet à des ordinateurs avec seulement 16 Go de RAM d’exécuter des modèles avancés d’IA

Une innovation présentée par Phison avec Intel permet à des PC équipés de seulement 16 Go de RAM de faire tourner localement des modèles d’IA allant jusqu’à 26 milliards de paramètres. Présentée au Computex 2026 à Taïpei, elle vise à réduire le recours au cloud pour certaines tâches complexes. Les joueurs PC pourraient aussi devoir surveiller leur quantité de mémoire vive.

aiDAPTIV utilise le stockage pour dépasser les limites de la RAM

La technologie, baptisée aiDAPTIV, associe des processeurs Intel Core Ultra Series 3 à une plateforme d’extension de mémoire basée sur le stockage, développée par Phison.

Elle s’appuie sur Pascari aiDAPTIV Cache Memory pour augmenter la mémoire disponible lors des traitements d’IA, en utilisant du stockage NAND flash haute performance comme ressource supplémentaire.

Avec ce système, un ordinateur doté de 16 Go de DRAM peut exécuter un modèle de langage de 26 milliards de paramètres. Dans les mêmes conditions de test, cette tâche demanderait normalement au moins 32 Go de RAM.

Des modèles plus lourds deviennent accessibles sur PC

aiDAPTIV étend la mémoire de travail vers le stockage NAND flash et contourne la limite imposée par la DRAM classique.

La solution utilise un cache optimisé pour accélérer l’accès aux données nécessaires aux modèles d’IA. Elle prend aussi en charge le KV cache reuse, qui réutilise des informations issues d’interactions précédentes afin d’éviter de retraiter des données déjà gérées.

Cette optimisation améliore l’efficacité et la rapidité d’exécution de modèles avancés sur des machines grand public.

Intel et Phison préparent l’intégration avec OpenVINO

Intel et Phison travaillent à intégrer aiDAPTIV aux plateformes AI PC équipées de processeurs Core Ultra.

Les deux entreprises préparent aussi la compatibilité avec la boîte à outils OpenVINO d’Intel et évaluent des charges de travail optimisées pour de futures démonstrations de performance.

KS Pua, directeur général et fondateur de Phison Electronics, explique que l’objectif est d’aider les OEM, les développeurs et les utilisateurs finaux à exécuter localement des applications d’IA plus sophistiquées, à préserver la confidentialité et à réduire la dépendance au cloud.

Selon lui, les AI PC évoluent vers des plateformes capables de gérer des charges locales plus complexes, dont des applications agentiques et des modèles mixtes demandant plus de mémoire et de réactivité.

L’IA locale promet plus de confidentialité et moins de cloud

Jim Johnson, vice-président senior et directeur général du client computing chez Intel, souligne que la mémoire reste l’un des principaux obstacles à l’exécution de modèles avancés sur les appareils des utilisateurs.

Selon lui, davantage d’utilisateurs et d’entreprises veulent utiliser l’IA localement, plus rapidement, avec plus de confidentialité et sans les coûts du traitement cloud.

Cette collaboration doit permettre aux clients de transformer leurs propres données en applications utiles et en valeur métier, avec des configurations mémoire plus simples et un coût total plus faible.

Une démonstration avec un modèle mixture-of-experts

Pendant le Computex, les entreprises ont présenté une interface de chat locale capable d’exécuter un modèle mixture-of-experts qui dépasserait normalement la mémoire du système.

La démonstration incluait aussi un système hybride de routage de grands modèles de langage basé sur OpenClaw, un framework open source.

Le système peut traiter localement des modèles de grande taille et utiliser le cloud seulement lorsqu’une capacité supplémentaire est nécessaire pour des requêtes particulièrement complexes. Cela renforce l’autonomie des appareils personnels, la confidentialité et la vitesse des applications intelligentes.

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.

Samuel

Je m’appelle Samuel Le Goff. À 38 ans, je suis l’actualité du numérique depuis plus de 14 ans. Aujourd’hui, je m’intéresse particulièrement aux smartphones et aux usages concrets de l’intelligence artificielle, que je traite à travers des contenus clairs et accessibles sur Menow.fr.

Voir tous les articles

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *