Top 10 des démos d'apprentissage automatique : Édition Hugging Face Spaces

Top 10 des démos d’apprentissage automatique : Édition Hugging Face Spaces


Image de l’auteur

La liste des dix premiers est basée sur la popularité, la convivialité et l’unicité. Dans ce blog, nous allons découvrir les meilleures démos de machine learning sur Hugging Face Spaces. Le Les espaces vous permet de télécharger votre application Streamlit, votre démo Gradio et votre application HTML à l’aide de Git.

Ce Pokémon n’existe pas utilise le ruDALL-E modèle pour générer des illustrations, et des noms aléatoires avec des attributs sont choisis dans la liste. Pour collecter le pokémon rare et unique, vous devez écrire votre nom et appuyer sur le bouton Soumettre. Cette application Web est simple mais l’une de mes préférées.

Ce Pokémon n'existe pas

MAGMA (Multimodal Augmentation of Generative Models through Adapter-based Fine Tuning) est un modèle de langage visuel pour décrire ou répondre à des questions sur les images. En savoir plus sur MAGMA sur arxiv.org. Pour utiliser la démo ML, vous devez fournir une image et poser une question spécifique. Par exemple, « décrivez l’image ». En savoir plus sur les cas d’utilisation ici.

MAGMA

AnimeGANv2 est l’application d’apprentissage automatique la plus populaire sur Hugging Face Spaces avec 515 ?. Il produit également des résultats rapides avec une touche artistique incroyable. En savoir plus sur l’interfonctionnement des modèles génératifs ici. Pour utiliser la démo, vous devez télécharger un portrait, puis choisir le style pour générer un art de style Anime.

AnimeGANv2

Quand j’ai vu le Restauration et colorisation d’images démo sur Twitter, j’ai pensé qu’ils devaient utiliser un exemple parfait pour montrer les sorties. Mais, lorsque je l’ai essayé moi-même sur une toute nouvelle photo, j’ai été époustouflé par la simplicité et la fonctionnalité puissante de l’application. La démo Gradio vous demande de télécharger l’image en noir et blanc et endommagée, et elle renverra une photo colorée et de haute qualité. Vous pouvez également jouer avec plusieurs options pour obtenir de meilleurs résultats.

Restauration et colorisation d'images

DiT Analyse de la mise en page du document La démo utilise un modèle de transformateur d’image de document pré-formé auto-supervisé pour prédire les étiquettes sur un document pdf. Par exemple, détecter des tableaux, du texte, des images, etc. La démo nécessitait un document pdf, et le reste appartient au puissant modèle pour mettre en évidence différentes parties du document.

Analyse de la mise en page des documents DiT

Chef Transformateur démo utilise le t5-recette-génération modèle pour générer des recettes basées sur le chef, le style de cuisine et les ingrédients. Si vous avez faim et que les options alimentaires sont limitées, tapez les ingrédients et obtenez la recette d’un plat délicieux. C’est mon application préférée car elle est visuellement attrayante avec un cas d’utilisation unique.

ArcaneGAN Vidéo utilise u-net aromatisé formé sur l’ensemble de données d’anime Arcane, et les images sont générées via un stylegan2 mélangé. En savoir plus sur la mise en œuvre du modèle ici. Pour cette démo Gradio, il vous suffit de télécharger un exemple de vidéo et de laisser le modèle faire la magie. La vidéo de sortie sera en Ésotérique style animé.

ArcaneGAN Vidéo

Rick et Morty ChatBot utilise une version affinée de DialoGPT, qui a été formé sur l’ensemble de données conversationnelles de Rick et Morty. La fonctionnalité de chatbot est nouvelle et vous offre une expérience de chat améliorée. Tapez simplement des questions idiotes et continuez la conversation jusqu’à ce que vous vous ennuyiez.

Rick et Morty ChatBot

OCR pour Captcha Le modèle a été formé sur une combinaison de CNN et de RNN avec une couche de point de terminaison pour la mise en œuvre de la perte de CTC. Pour en savoir plus sur la formation de modèles, consultez Keras’s exemple de code. L’application vous a demandé de télécharger une image d’un captcha et de renvoyer un texte alphanumérique très précis.

OCR pour Captcha

Fastspeech2 TTS utilise des architectures de synthèse vocale de pointe en temps réel telles que Tacotron-2, Melgan, Multiband-Melgan, FastSpeech, FastSpeech2 basées sur TensorFlow. Si vous voulez une expérience de synthèse vocale naturelle, essayez de taper du texte et laissez-vous surprendre. Cette application vous permet également de tester à partir de différentes architectures de modèles. J’adore le son naturel d’un haut-parleur.

Fastspeech2 TTS

Lorsque j’ai été invité au test bêta de Spaces, j’étais sceptique, mais en un mois, les Spaces ont dépassé le cloud Streamlit, Heroku et d’autres plates-formes de déploiement cloud. En termes de facilité d’utilisation, d’intégrations et d’inférence plus rapide. Je suis amoureux des espaces HuggingFace et de la façon dont les membres de la communauté proposent des idées uniques pour les applications Web. Dans ce blog, nous avons couvert la liste des dix meilleures démos d’apprentissage automatique sur HF Spaces et appris comment ces applications fonctionnent.

S’il vous plaît laissez-moi savoir votre classement des dix premiers dans la section des commentaires.