Je me suis habitué à découvrir ce que les choses que je trouve dans la rue utilisent l’IA. Et c'est une amélioration plutôt cool.

Je me suis habitué à découvrir ce que les choses que je trouve dans la rue utilisent l’IA. Et c'est une amélioration plutôt cool.

C'est drôle à quelle vitesse l'IA a été intégrée dans notre vie quotidienne. Ceux qui ont fait le plus et le moins ont fait quelque chose avec ChatGPT, ont généré une image avec Bing ou ont utilisé l'IA de leur téléphone mobile pour réécrire un paragraphe et le rendre plus formel. C'est curieux. Normalement, la technologie met du temps à pénétrer les utilisateurs, mais l’IA est entrée comme un éléphant dans un magasin de porcelaine. Et dans mon cas, une utilisation que j’ai trouvée particulièrement utile a été celle de guide touristique.

En voyage avec l'IA. Cet été, j'ai parcouru Budapest, Vienne et Prague. Je n'ai pas la moindre idée du hongrois ou du tchèque et je ne parle qu'à moitié français, donc comme vous pouvez l'imaginer, le téléphone portable a été un grand allié. Cela a toujours été, vraiment, un de mes piliers dans la recherche d'itinéraires, d'endroits où manger, d'arrêts de bus et de métro, etc., mais cette année, j'ai aussi décidé de donner une chance à l'IA.

Comme? L'utiliser pour identifier des choses. Google Lens a toujours été là, mais Google Gemini va encore plus loin dans l'expérience. L’une des principales utilisations que je lui ai données était de traduire. Mais je ne parle pas de saisir du texte à la main ou de le dicter, non. Si l'IA permet quelque chose, c'est d'être aussi paresseux que l'on veut et d'obtenir un bon résultat, il suffisait donc de prendre une photo de l'affiche et de la joindre avec un « qu'est-ce qu'elle dit ici en espagnol » clair et direct.

Utiliser Gemini comme traducteur | Image : Simseo

Utiliser Gemini comme traducteur | Image : Simseo

L'IA l'a non seulement traduit, mais a également donné un certain contexte à ce qu'elle regardait. C'est-à-dire que je n'ai pas besoin de dire « ça ressemble à un menu de restaurant » quand j'ai littéralement le menu dans une main et la boisson dans l'autre, mais si je regarde un panneau publicitaire dans la rue, ou un signe, les choses changent. L'image ci-dessus est le meilleur exemple. Ce contexte supplémentaire et la possibilité d’élargir les informations offrent plus qu’une simple traduction.

Et qu'est-ce que c'est ? En règle générale, lorsque mon partenaire et moi partons en voyage, nous l'accompagnons un peu. Nous avons déjà vu des lieux, mais nous aimons nous perdre et découvrir la ville à pied. Si vous allez à Budapest, vous verrez le Bastion des Pêcheurs, le Parlement, le Pont des Chaînes ou les thermes, ce qui est normal, mais si vous vous promenez sur la place Jozsef Nador, vous verrez un immense bâtiment, gardé et sans aucun signe (qui J'ai vu ), mais magnifique.

Avec une seule photo mal prise, Google Gemini a pu deviner ce que je regardais | Image : Simseo
Avec une seule photo mal prise, Google Gemini a pu deviner ce que je regardais | Image : Simseo

Avec une seule photo mal prise, Google Gemini a pu deviner ce que je regardais | Image : Simseo

La seule chose que je devais faire pour savoir de quoi il s’agissait était de prendre une photo de la façade. Et même pas une photo complète, mais une photo verticale prise mal et vite. J'ai envoyé cette photo à Google Gemini avec un modeste « Qu'est-ce que ce bâtiment » et en quelques secondes j'ai découvert qu'il s'agissait du bâtiment du ministère hongrois des Finances, de son histoire et de quelques faits curieux.

Votre prochain collègue sera une IA, selon le PDG de NVIDIA. Et ce sera la norme à l'avenir

Un peu plus loin, sur la Place de la Liberté, se trouve un monument aux victimes de l'occupation allemande. Si vous le recherchez sur Wikipédia, vous verrez sa description et un minimum d'informations sur la controverse entourant son emplacement. Cette statue représente l'archange Saint Gabriel, symbole de la Hongrie, attaqué par un aigle impérial, symbole de l'Allemagne nazie. Cette symbolique a été durement critiquée car elle semble oublier que la Hongrie a collaboré activement à la déportation de 450 000 Juifs hongrois vers les camps d'extermination pendant la guerre.

Le Mémorial aux victimes de l'occupation allemande à Budapest | Image : Simseo
Le Mémorial aux victimes de l'occupation allemande à Budapest | Image : Simseo

Le Mémorial aux victimes de l'occupation allemande à Budapest | Image : Simseo

Ce n'est pas sur le panneau devant le monument. Je l'ai découvert parce que j'ai demandé à Google Gemini s'il y avait eu une controverse sur son emplacement, car devant le monument il y avait d'autres petits monuments réalisés par des personnes avec plus de photos et de textes qui parlaient précisément de la controverse. Des textes que j’ai d’ailleurs pu aussi traduire et mieux comprendre grâce à l’IA.

Résumé de la polémique avec le monument réalisé par Google Gemini | Image : Simseo
Résumé de la polémique avec le monument réalisé par Google Gemini | Image : Simseo

Résumé de la polémique avec le monument réalisé par Google Gemini | Image : Simseo

Et avec la nourriture ? En fait, avec la nourriture, je m'en fiche plus ou moins parce qu'en fin de compte, je sais ce que je commande. Attention cependant, poser des questions sur une recette ou les ingrédients d'un plat ne fait jamais de mal. Quoi qu’il en soit, j’y vais. Lors d'un voyage en Turquie, après le dîner, le serveur nous a apporté du thé. Je n'ai pas pu localiser la saveur, même si elle était étrangement familière.

J'ai pris une photo du verre, que vous pouvez voir sous ces lignes. Il s’agit probablement de la photo la plus générique que vous puissiez imaginer d’un verre contenant un liquide sombre à l’intérieur qui pourrait très bien être un café mal préparé ou un thé générique. Eh bien, en prenant en compte les détails de l'assiette et du verre, l'IA a réussi à découvrir qu'il s'agissait d'un verre de thé turc (qui est en fait une sorte de thé noir.

Google Gemini extrait d'une photo d'un verre de thé aussi simple que celui-ci qu'il s'agit bien de thé turc | Image : Simseo
Google Gemini extrait d'une photo d'un verre de thé aussi simple que celui-ci qu'il s'agit bien de thé turc | Image : Simseo

Google Gemini extrait d'une photo d'un verre de thé aussi simple que celui-ci qu'il s'agit bien de thé turc | Image : Simseo

Mais je n'y fais toujours pas confiance du tout. Bien que la grande majorité du temps, surtout s’il s’agit de problèmes simples, l’IA fonctionne généralement parfaitement, je ne lui fais pas entièrement confiance. Je n’aurais pas une confiance aveugle dans quelque chose généré par l’IA, du moins pas dans des choses importantes. Je ne confierais pas un paragraphe d'article ou un email important à une IA, mais pour ce genre de chose qui, en fin de compte, est d'alimenter la curiosité, cela me semble exceptionnel.

Son utilisation est simple, bien plus que d'écrire sur Google « grand bâtiment blanc carré XX de la ville YY » ou « statue ZZ » signifiant ». Nous savons tous prendre une photo, nous savons tous écrire dans un chat. N'est-ce pas ? N'est-il pas plus facile de procéder ainsi ? C'est vrai qu'il y a encore place à l'amélioration, qu'on a toujours ce doute quant à savoir si l'IA aura halluciné dans sa réponse ou pas, mais c'est avec ce genre de choses que vous réalisez l’utilité réelle et pratique de l’IA dans le monde réel.

Images | Simseo

À Simseo | Le méga-guide des 71 outils d'intelligence artificielle : dites-moi pourquoi vous en avez besoin et je vous dirai quelles IA sont les meilleures