J’ai utilisé Bing avec ChatGPT et deux autres services d’intelligence artificielle pour obtenir un briefing de réunion pour moi. c’est incroyable
L’événement Samsung Unpacked 2023 a eu lieu le 1er février et je n’avais pas envie de passer une heure à le regarder. Qu’est-ce que j’ai fait? Profitez du nouveau lot de services et d’outils d’intelligence artificielle pour « assister » à l’événement et devenir mes participants.
L’essai a été un succès. Utiliser Bing avec ChatGPT et quelques services supplémentaires a obtenu un aperçu détaillé et très claire de tout ce qui a été dit dans cet événement. Cela m’a montré que cette technologie a une utilisation pratique remarquable, et que ce n’est que le début.
L’intelligence artificielle comme arme pour battre le temps
Nous sommes à l’ère de la hâte. Nous n’avons pas le temps pour presque rien. Et comme nous ne l’avons pas, nous le volons à tous ceux que nous pouvons. On regarde des séries et on écoute des podcasts 1,5x, on paie pour qu’on nous envoie tout pour pouvoir continuer à faire des choses à la maison, et TikTok et ses courtes vidéos ont révolutionné ce segment.
L’obsession de gagner du temps et de le gagner pour d’autres choses – même s’il s’agit, ironiquement, de regarder des vidéos TikTok plus courtes – est claire à cette époque où il existe une technologie très orientée vers cela.
L’intelligence artificielle promet de nous aider dans cette bataille, et depuis Simseo, nous avons voulu vérifier l’une de ses promesses : celle de ne pas avoir à « avaler » de longues réunions et discussions car elle est capable de reconnaître, retranscrire et synthétiser le contenu pour nous le présenter plus tard.
C’est pourquoi nous avons voulu faire cette expérience avec des talks comme celui proposé par Samsung il y a quelques jours. Je dois dire ici que j’ai en fait dit un petit mensonge : j’ai vu l’événement.
Après tout, cela fait partie de mon travail et de celui de toute l’équipe de Simseo, qui a été très attentive à cette couverture pour parler de ce qui y était présenté, ce qui était très pertinent. Cependant, c’était en fait un avantage pour cette expérience, car cela m’a permis de voir si ce que ces applications m’offraient dans le résumé final était vraiment fidèle à ce que Samsung avait commenté lors de leur événement.
Comment l’IA résume pour vous une conversation d’une heure en dix paragraphes
La première étape consistait à transcrire l’événement et à le convertir en texte. Il existe divers outils qui aident à le faire, mais je voulais essayer l’un de ceux que j’ai récemment découverts qui prétendent utiliser des systèmes d’intelligence artificielle modernes.
Cet outil n’est autre que gladiaqui est en fait une API qui effectue précisément diverses conversions de contenu, parmi lesquelles, bien sûr, celle de convertir l’audio en texte. Après une brève inscription précédente, j’avais déjà accès aux soi-disant « tâches » qui permettent d’exécuter ces conversions avec certaines variantes.
Pour la conversion, j’avais d’abord besoin d’avoir le fichier audio de l’événement. Il est facile à extraire vidéo YouTube originale avec des services en ligne ou avec des applications installées localement. Ce faisant, j’avais déjà devant moi ce fichier MP3 d’un peu moins de 57 Mo et d’une durée de près d’une heure. Parfait.
Après l’avoir importé dans Gladia, le service a commencé à le transcrire. Normalement, d’autres solutions sont soit plus lourdes, soit imposent des limites sur la durée de l’audio à transcrire. loutre.ail’un de mes favoris, autorise par exemple les fichiers de 30 minutes dans sa version gratuite, ce qui l’a exclu pour ce test rapide.
Le problème avec Gladia est qu’il ne transcrit pas directement la génération d’un texte, mais génère à la place le texte plein de métadonnées. Cette information est très utile pour certains scénarios tels que le sous-titrage de l’événement – elle inclut des horodatages avec le début et la fin de chaque élément de la transcription – mais je voulais l’audio brut, sans métadonnées. Comment y parvenir ?
Demander, bien sûr. En tant qu’ancien utilisateur de Linux, il était clair pour moi qu’ici des outils comme ‘sed’ ou ‘awk’ pourraient m’aider pour obtenir ce que je cherchais, mais le problème est que pour les utiliser, il faut avoir une certaine (ou beaucoup) maîtrise des expressions régulières et de la gestion des modèles.
Ce n’était pas mon cas —je ne les utilise presque jamais— et la chose normale jusqu’à présent aurait été de chercher la solution sur Google ou d’aller sur des forums comme Superutilisateur soit Reddit demander l’aide d’un expert. Mais ici, il s’agissait de rechercher des solutions d’intelligence artificielle, et c’est exactement ce dont j’ai profité avec Bing avec ChatGPT comme protagoniste.
Le nouveau moteur conversationnel s’est montré spectaculaire ici. Après une brève conversation expliquant ce que je voulais, indiquant que je pensais que cela pouvait être résolu avec « sed » et donnant un exemple, Bing a renvoyé ma réponse. C’est marrant, parce que je lui ai demandé en anglais et il a continué à répondre en espagnol, mais ça n’avait pas d’importance : la réponse était parfaite.
J’avais tout le texte dans un fichier appelé « recording.txt » et j’ai généré un nouveau fichier appelé « result.txt » avec la commande indiquée dans votre réponse, que j’ai entré dans un terminal (béni) sur mon Mac mini M1 exécutant macOS . Temps investi ? Environ deux minutes.
Restait maintenant la dernière étape : faire en sorte que ce texte génère l’abstrait recherché. ChatGPT et Bing avec ChatGPT peuvent tous deux résumer des textes, mais ils ont un problème : leur limite de caractères, qui par exemple dans Bing est de 2 000 caractères d’entrée. Ce texte était beaucoup plus grand, j’avais donc besoin d’une alternative.
C’est là que de nouvelles alternatives ont émergé à nouveau. Ces derniers jours, divers outils sont apparus pour synthétiser des visioconférences jusqu’à études scientifiques. J’avais besoin d’une option pour résumer de longs texteset parmi eux j’ai trouvé Casper IAune extension pour Chrome capable d’offrir des résumés des sites Web que nous visitons et qui a des options plus frappantes, comme générer des tweets avec un titre frappant généré à partir de ce contenu visité.
Pour fonctionner, oui, le texte Unpacked 2023 devait être sur un site Web, donc je l’ai copié et collé dans un nouveau message dans mon autre blog —les expériences, mieux avec le soda— que je n’ai même pas eu besoin de publier : il suffisait de les prévisualiser dans le navigateur Chrome pour que Casper AI puisse faire son travail.
En seulement 10 secondes avait dans la barre latérale générée par Casper AI le résumé de cet événement, répartis en petits paragraphes avec les principaux points qui ont été offerts au cours de cette heure de conversation.
Le texte était en anglais et le résumé aussi, mais il est logique de penser qu’il existe déjà des alternatives similaires dans notre langue ou que celles qui existent le supporteront (comme beaucoup d’autres) dans peu de temps. La performance de Casper AI à cet égard était sans faille, mais la question est, était-ce un bon résumé de l’événement ?
La vérité est que le résumé était pratiquement parfait, quelque chose qui m’a vraiment étonné. Ce système montrait un tour d’horizon de la petite introduction du PDG de Samsung puis résumait les principales caractéristiques du Galaxy S23 Ultra et des options telles que sa « nightography » – il a compris « nitography » – pour les photos en basse lumière. Il a également montré des détails sur QuickShare et la mention par Samsung de ses nouveaux Ultrabooks.
Il est vrai qu’en cours de route il a laissé quelques détails sur le reste des appareils de la gamme Galaxy S23 et aussi sur ces ultraportables. Il a également confondu un nom, comme le nouveau Snapdragon de ces mobiles, mais même ainsi, le résumé était spectaculaire en raison de sa précision.
Qu’est-ce que cela prouve ? Que certainement ce type d’outils peut être très utile pour gagner du temps pour pouvoir l’investir dans des tâches plus prioritaires pour nous. Sans aucun doute, une fantastique démonstration pratique de ce que ces solutions peuvent faire.
Image: Priscilla Du Preez