Datalore
Collaborative data science platform for teams
Datalore Enterprise 2022.2 : installation basée sur Docker ultra-rapide, planification des exécutions de notebooks, collaboration sur les fichiers joints, et plus
Que diriez-vous de pouvoir déployer une plateforme privée de science de données pour votre équipe en moins de 10 minutes ? Aujourd’hui, nous avons le plaisir de vous présenter l’installation basée sur Docker pour a Datalore Enterprise et tout un ensemble d’autres moyens de simplifier le travail de votre équipe de science des données. Poursuivez votre lecture pour découvrir les principales nouveautés de cette version !
Datalore Enterprise est une plateforme collaborative de science des données pour les équipes, qui peut être hébergée dans un cloud privé ou sur site. Vous pouvez l’essayer gratuitement pendant 30 jours, faites simplement une demande ici.
Installation basée sur Docker
La nouvelle installation basée sur Docker vous permet d’exécuter une configuration de base privée de Datalore en moins de 10 minutes. Que ce soit sur AWS, GCP, Azure ou d’une machine locale, vous pourrez configurer Datalore en exécutant une seule commande Docker. Vous pourrez ensuite connecter des modules d’authentification, configurer des forfaits d’utilisation internes et personnaliser les environnements étape par étape.
Outre l’installation basée sur Docker, une installation Kubernetes est aussi disponible. Vous avez la possibilité de migrer vers Kubernetes à partir de l’installation basée sur Docker ultérieurement ou de commencer directement avec Kubernetes. Consultez le tableau comparatif détaillé entre une installation basée sur Docker et une installation basée sur Kubernetes ici.
Demander un essai gratuit de 30 jours
Planification de l’exécution des notebooks
Avec Datalore Enterprise 2022.2, vous pouvez planifier les exécutions de vos notebooks toutes les heures, tous les jours, toutes les semaines ou tous les mois, et fournir des mises à jour régulières des rapports publiés.
Vous pouvez choisir les paramètres de planification dans l’interface utilisateur ou utiliser la chaîne CRON pour spécifier des options plus complexes. Pour notifier les collaborateurs en cas d’échec ou de réussite de l’exécution du notebook, il suffit de choisir les destinataires dans la liste lorsque vous configurez la planification.
Dans le système de fichiers de l’espace de travail, vous pourrez voir toutes les exécutions de notebooks planifiées, les suspendre, modifier la planification et télécharger les résultats des exécutions sous forme de fichiers ipynb.
Vous aimeriez en savoir plus sur ce cas d’utilisation ou tout autre cas spécifique ? N’hésitez pas à planifier une démo avec notre équipe !
Onglet Computation
Nous avons ajouté un onglet Computation à la barre latérale gauche pour fournir un accès à toutes les options de calcul nécessaires en un clic. Les options de planification, les types de machines et les paramètres du noyau sont configurables depuis ce même emplacement.
Collaboration sur les fichiers joints
Avec la version 2022.2 de Datalore Enterprise , vous pouvez désormais collaborer en temps réel sur les fichiers de l’espace de travail et les notebooks ! Cela vous permet de créer ou de modifier des scripts Python et des fichiers texte en collaboration avec les membres de votre équipe. Double-cliquez sur le fichier à partir des données jointes du notebook, consultez les curseurs des collaborateurs dans l’éditeur de barre latérale de droite, suivez les collaborateurs en cliquant sur leur avatar et obtenez des mises à jour en temps réel du contenu des fichiers.
Si vous souhaitez collaborer sur la modification de fichiers .csv, vous pouvez aussi ouvrir ces fichiers en texte brut et les modifier ensemble.
Amélioration de l’intégration des bases de données
Depuis leur lancement en novembre 2021, les fonctionnalités d’intégration des bases de données et des cellules SQL ont été accueillies très positivement par nos clients. Dans cette version, nous avons implémenté de nombres nouveautés sur la base des retours d’expérience dont ils nous ont fait part.
Requêtes SQL paramétrées
Il est maintenant possible d’utiliser des variables (chaînes de caractères, nombres, booléens, listes) définies dans votre code Python à l’intérieur des cellules SQL. Cela permet de pouvoir créer des rapports interactifs avec des requêtes paramétrées, d’avoir moins de code SQL à écrire et de proposer une meilleure interface aux utilisateurs des rapports.
Limitation du schéma de base de données pour l’introspection
Les bases de données peuvent occuper des centaines de gigaoctets d’espace, alors qu’un data scientist n’a besoin que de quelques tables pour travailler au quotidien.
Vous pouvez désormais choisir des schémas et des tables de base de données spécifiques pour les introspections lors de la création initiale d’une connexion à une base de données dans Datalore. Cela permet d’accélérer l’introspection initiale et de faciliter la navigation dans les schémas.
Prise en charge de MS SQL Server
Datalore prend en charge tous les types de base de données SQL les plus courants, parmi lesquels MySQL, Postgres, Snowflake et Redshift. Dans les versions précédentes, il manquait seulement la prise en charge de la base de données MS SQL Server.
Avec Datalore Enterprise 2022.2, vous pouvez maintenant vous connecter à une base de données MS SQL Server directement depuis l’interface de l’éditeur, naviguer vers le schéma et bénéficier de la saisie semi-automatique du code pour les requêtes SQL à l’intérieur des cellules SQL.
Autres améliorations :
- Ajout d’une option d’arrêt d’activité de 24 heures pour les calculs en arrière-plan.
- Ajout de codes cadeaux pour les instances et le stockage.
- Amélioration globale des performances, en particulier lors du travail avec de grands DataFrames et de l’utilisation de l’onglet Statistics ou du visualiseur Variable.
- Amélioration de la sécurité du transfert des mots de passe de la base de données vers le serveur lors du test de la connexion à la base de données.
- Amélioration de la stabilité du noyau suite à des erreurs de code non critiques.
- Amélioration de la stabilité du noyau lors de l’utilisation de contrôles interactifs en mode réactif.
- Correction du problème d’ouverture des notebooks avec des informations syntaxiques erronées.
- Correction du problème de mise à jour de la valeur de la liste déroulante dans les rapports interactifs.
Essai gratuit de 30 jours
Essayez gratuitement Datalore Enterprise pendant 30 jours. Pour demander un essai ou nous poser des questions, contactez-nous à l’adresse datalore-enterprise@jetbrains.com ou planifiez un rendez-vous avec notre équipe. Nous assurons une assistance dédiée à chaque évaluateur de Datalore Enterprise.
Demander un essai gratuit de 30 jours
Comment faire la mise à niveau
Pour effectuer une mise à niveau à partir de votre version actuelle de Datalore, veuillez suivre les étapes de notre documentation. Si vous utilisez actuellement le framework Kustomize pour l’installation de Datalore, veuillez migrer vers l’installation Helm. Retrouvez le guide de migration ici.
Pour vous tenir au courant des nouvelles fonctionnalités de Datalore, abonnez-vous à notre blog et suivez-nous sur Twitter !
L’Équipe Datalore
Auteur de l’article original en anglais :