Gemini intègre enfin l’audio : Google répond à la demande des utilisateurs

Google vient d’ajouter une fonction attendue depuis longtemps à sa plateforme Gemini : la possibilité de télécharger et d’analyser des fichiers audio. Après les images, vidéos et documents, l’intelligence artificielle de Mountain View s’attaque désormais au son, ouvrant la voie à de nouveaux usages pour les étudiants, les professionnels et les créateurs de contenu.

Une prise en charge complète des fichiers audio

La nouvelle option est déjà disponible sur Android, iOS et via le navigateur web. L’utilisateur n’a qu’à cliquer sur l’icône “+” puis sélectionner un fichier audio de son smartphone ou de son ordinateur. Les formats pris en charge incluent MP3, M4A, WAV et d’autres standards largement utilisés.

Une fois importé, Gemini peut :

  • Analyser et comprendre le contenu sonore
  • Effectuer une transcription automatique en texte
  • Proposer un résumé condensé
  • Extraire les idées essentielles d’une conversation, d’un cours ou d’une réunion

Des limites selon le type d’abonnement

Comme pour les autres fichiers, Google a fixé des plafonds d’utilisation. Les utilisateurs de l’offre gratuite peuvent importer jusqu’à 10 minutes par fichier, tandis que les abonnés Pro et Ultra bénéficient d’un accès élargi allant jusqu’à 3 heures d’audio par fichier.

Cette annonce s’accompagne aussi d’un rappel des restrictions générales : vidéos limitées à 5 minutes pour la formule gratuite et 1 heure pour les abonnés (taille maximale de 2 Go), dossiers de code acceptant jusqu’à 5 000 fichiers, ou encore fichiers ZIP contenant 10 éléments maximum.

Vers une plateforme universelle d’analyse de contenu

L’ajout du son représente une étape clé dans l’évolution de Gemini. L’outil ne se limite plus à un simple chatbot : il devient un véritable espace de gestion et d’analyse de données multimédias. Les étudiants peuvent transformer des enregistrements de cours en résumés exploitables, les entreprises analyser rapidement des réunions, et les journalistes extraire des citations précises à partir d’interviews.

Cette fonctionnalité répond directement aux attentes de la communauté, Google confirmant qu’il s’agissait de l’une des demandes les plus récurrentes des derniers mois.

Avec ce nouvel atout, Gemini se rapproche encore davantage de l’image d’une plateforme complète, capable de traiter texte, image, vidéo et désormais audio, renforçant ainsi sa place face à ses concurrents.