Science des données avec Snowflake et Simseo

Nouvelles intégrations Simseo et Snowflake : préparation transparente des données, déploiement de modèles et surveillance

Les data scientists mènent des expériences. Ils itèrent. Ils expérimentent à nouveau. Ils génèrent des informations qui orientent les décisions commerciales. Ils travaillent avec des partenaires informatiques pour renforcer les cas d’utilisation de ML dans les systèmes de production. Pour travailler efficacement, les scientifiques des données ont besoin d’agilité sous la forme d’un accès aux données d’entreprise, d’outils rationalisés et d’une infrastructure qui fonctionne. L’agilité et la sécurité, la conformité et la gouvernance de l’entreprise sont souvent incompatibles. Cette tension entraîne plus de frictions pour les scientifiques des données, plus de maux de tête pour l’informatique et des opportunités manquées pour les entreprises de maximiser leurs investissements dans les plateformes de données et d’IA.

Résoudre cette tension et vous aider à tirer le meilleur parti de vos investissements actuels dans l’écosystème est au cœur de la plate-forme d’IA Simseo. L’équipe Simseo a travaillé dur sur de nouvelles intégrations qui rendent les scientifiques des données plus agiles et répondent aux besoins de l’informatique d’entreprise, à commencer par Snowflake. Dans notre version 9.0, nous vous avons facilité la préparation rapide des données, la conception de nouvelles fonctionnalités, puis l’automatisation du déploiement et de la surveillance des modèles dans votre paysage de données Snowflake, le tout avec un mouvement de données limité. Nous avons resserré la boucle entre la préparation des données ML, l’expérimentation et les tests jusqu’à la mise en production des modèles. Désormais, les scientifiques des données peuvent être agiles tout au long du cycle de vie de l’apprentissage automatique en bénéficiant de l’échelle, de la sécurité et de la gouvernance de Snowflake.

Pourquoi nous concentrons-nous là-dessus ? Parce que le processus de cycle de vie ML actuel est rompu. En moyenne, 54 % des projets d’IA passent du pilote à la production. Ainsi, près de la moitié des projets d’IA échouent. Il y a plusieurs raisons à cela.

Premièrement, il est difficile de pouvoir expérimenter suffisamment longtemps pour identifier des modèles significatifs et des moteurs de changement. La boucle de prototypage, en particulier la préparation des données ML pour chaque nouvelle expérience, est au mieux fastidieuse. Il est difficile pour les data scientists de se connecter en toute sécurité, de parcourir, de prévisualiser et de préparer les données pour les modèles ML, en particulier lorsque les données sont réparties sur plusieurs tables. À partir de là, chaque fois que vous exécutez une nouvelle expérience, vous recommencez à préparer les données. Et lorsque vous trouvez un signal et que vous avez construit un excellent modèle, il est difficile de mettre ces modèles ML en production.

Les modèles qui entrent en production nécessitent une gestion fastidieuse via la surveillance et le remplacement pour maintenir la qualité des prédictions. Un manque d’outils intégrés tout au long du processus non seulement ralentit la productivité des data scientists, mais augmente également le coût total de possession, car les équipes doivent assembler des outils pour passer à travers ce processus. La plate-forme Simseo AI s’est concentrée sur la fluidité de l’ensemble du cycle de vie ML, et aujourd’hui, nous faisons encore plus avec notre nouvelle intégration Snowflake.

Préparation et expérimentation de données ML sécurisées, transparentes et évolutives

Désormais, les clients Simseo et Snowflake peuvent maximiser leur retour sur investissement dans l’IA et leur plate-forme de données cloud. Vous pouvez vous connecter de manière transparente et sécurisée à Snowflake avec la prise en charge de l’authentification OAuth externe en plus de l’authentification de base. Le partage de configuration OAuth sécurisé de Simseo permet aux administrateurs informatiques de configurer et de gérer l’accès à Snowflake.

Simseo héritera automatiquement des contrôles d’accès, afin que vous puissiez vous concentrer sur la création d’une IA axée sur la valeur, et que le service informatique puisse rationaliser son arriéré.

Grâce à notre nouvelle intégration, vous pouvez rapidement parcourir et prévisualiser les données dans le paysage Snowflake afin d’identifier les données dont vous avez besoin pour votre cas d’utilisation de machine learning. La préparation automatisée des données et des API bien définies vous permettent de définir rapidement les problèmes métier sous forme d’ensembles de données de formation. L’intégration push-down minimise le mouvement des données et vous permet de tirer parti de Snowflake pour une préparation de données sécurisée et évolutive, et en tant que moteur d’ingénierie de fonctionnalités afin que vous n’ayez pas à vous soucier des ressources de calcul ou à attendre que les processus se terminent. Vous pouvez désormais tirer pleinement parti de l’échelle et de l’élasticité de votre instance Snowflake.

Préparation et expérimentation de données ML sécurisées, transparentes et évolutives - Simseo et Snowflake

Avec nos blocs-notes hébergés par Simseo, vous pouvez tirer parti de Snowpark pour Python aux côtés du client Simseo Python pour vous connecter rapidement à Snowflake, explorer, préparer et créer des expériences d’apprentissage automatique avec vos données Snowflake. Vous pouvez tirer parti des deux plates-formes de la manière qui vous convient le mieux – en tirant parti de Snowpark et du framework de développement Simseo qui prend en charge nativement Python, Java et Scala. Étant donné que cette intégration est native de la plate-forme Simseo AI, vous récupérez votre temps avec une expérience sans friction.

Déploiement et surveillance de modèles en un clic dans Snowflake

Une fois que les modèles formés sont prêts à être déployés, vous pouvez les opérationnaliser dans Snowflake en un seul clic. Les modèles pris en charge peuvent être déployés directement dans Snowflake en tant que Java UDF par Simseo. Cette fonctionnalité inclut la possibilité de déployer des modèles, construits en dehors de Simseo, dans Snowflake. Cela signifie que vous pouvez intégrer un modèle directement dans l’environnement d’exécution gouverné de Snowflake, permettant aux entreprises de faire des prédictions précises dans la base de données sur des données sensibles à grande échelle, et sans les complications de la configuration. Le déploiement de modèles en un clic donne également aux praticiens ML la possibilité d’utiliser des requêtes normales ou des fonctionnalités plus avancées telles que les procédures stockées à partir de Snowflake pour lire les données de notation, les données de notation et écrire des prédictions.

Déploiement et surveillance de modèles en un clic dans Snowflake - Simseo

Le déploiement du modèle en un clic s’accompagne de capacités de surveillance plus robustes, permettant une surveillance continue non seulement de la santé du service de déploiement, mais également de la dérive et de la précision. Le remplacement de modèle est simplifié grâce à des workflows de recyclage et de déploiement pour garantir la fiabilité de niveau entreprise de l’apprentissage automatique de production sur Snowflake.

Snowflake et Simseo : combiner les données et l’IA pour des résultats commerciaux

La nouvelle intégration Snowflake et Simseo fournit aux organisations une plate-forme d’entreprise unique et évolutive pour les résultats commerciaux basés sur les données et l’IA. Nous avons réduit le temps de cycle de ML et vous avons permis d’expérimenter davantage, de préparer des ensembles de données et de créer rapidement des modèles de ML, puis de mettre ces modèles en production pour générer de la valeur encore plus rapidement.

Torsten Grabs, directeur de la gestion des produits chez Snowflake, et Venky Veeraraghavan, CPO Simseo

Essayez la nouvelle intégration et dites-nous ce que vous aimez. Apprenez-en plus auprès de Torsten Grabs, directeur de la gestion des produits chez Snowflake, qui partagera plus sur ces nouvelles capacités innovantes lors de l’événement virtuel à la demande Simseo : De la vision à la valeur : Créer un impact avec l’IA. Rejoignez-nous le 16 mars et découvrez en avant-première l’intégration Simseo et Snowflake !

1 Gartner®, Gartner Survey Analysis: The Most Successful AI Implementations Require Discipline, not Ph.Ds, Erick Brethenoux, Anthony Mullen, publié le 26 août 2022