Datalore
Collaborative data science platform for teams
Datalore Enterprise 2022.3:新定价、报告构建器、交互式表、升级版基于 Docker 的安装等
大家好!
Datalore 在 2022.3 版本中面临的挑战之一是消除在公司范围内理解和共享数据科学成果的障碍。 我们很高兴地在报告工作流中引入了重大更新,并使小型团队能够以更低的成本使用 Datalore。 继续阅读以了解 2022.3 版本中的最新变化或观看下方视频概览!
Datalore Enterprise 现在对小型团队免费!
对于需要将数据保存在私有云或本地部署的小型团队,我们有令人振奋的消息。 Datalore Enterprise 现在可供多达 4 人的团队免费使用!
此外,由于前 4 名用户可以免费使用,面向大型团队的价格同样有所降低。 例如,如果您有一支 10 人的团队,则每位用户的费用将为 75 美元/月,而非 125 美元/月。 这是一个巨大的区别!
Datalore Enterprise 现在也正式加入 JetBrains 特别优惠计划。 您可以从我们的新版网站中详细了解可用的创业公司、非营利组织和课堂折扣!
报告和共享最新变化
简而言之,数据科学家现在可以使用报告构建器构建精美的仪表板风格报告,使用 Metric(指标)单元高亮显示特定数字,通过 Date(日期)单元处理日期输入,从 UI 筛选和排序 DataFrame,以及与用户组共享他们的工作。
报告构建器
报告构建器彻底改变了在 Datalore 中从 Notebook 构建交互式报告的方式。 拖放画布上的单元,轻松调整其高度和宽度,点击按钮将结果发布为静态或交互式报告,并通过链接与利益相关者共享。
Datalore 报告的特别之处在于分析、数据、环境和最终报告之间存在直接联系。 这意味着您在几秒钟内便可更新报告,并轻松回答有关数据来源的任何问题。
交互式表
我们添加了一些用于在 Datalore 中处理 DataFrame 的 Excel。 直接在单元输出中对 Pandas DataFrame 和 SQL 查询结果应用筛选和排序。 选择要显示的列,按特定列排列数据集,使用“equals”和“contains”表达式进行筛选,并轻松跳转到数据集的顶部或底部。 让 Datalore 生成 Python 样板代码,以便稍后在 Notebook 中重现相同的表表示法。
指标和日期单元
数据驱动型团队会根据某些指标在一段时间内的变化而采取相应举措。 借助 2022.3 版本,数据科学家现在可以轻松地在其工作中强调各种指标的动态变化,并显示由报告用户指定的特定时间段内的结果。
借助 Metric (指标)单元,您可以使您的 Python 变量从 Notebook 的其余部分中突显出来,并选择将其与其他常量变量或单元先前执行的结果进行比较。
借助 Date(日期)单元,您可以要求报告用户选择特定日期或期间,然后将此选择用作代码中的变量。
用户组支持
您现在可以通过群组共享来轻松管理谁可以访问 Notebook 和工作区。 可以通过两种方式创建用户组:
- 在 Datalore 的 Admin(管理)面板中手动创建
- 使用 JetBrains Hub 身份验证模块从您的身份验证提供程序(例如 Azure AD )同步组,即可同步到 Datalore。 您可以在此处详细了解支持的身份验证模块。 请发送电子邮件至 datalore-enterprise@jetbrains.com 以了解您的身份验证提供程序是否支持同步。
更新的报告 UI
当我们大幅升级报告工作流时,我们决定刷新报告的外观:
- 目录现在可收起。
- Recalculate report(重新计算报告)按钮已移至右上角。
- 静态和交互式报告现在看起来相同。
- 发布和打印选项现在嵌套在 Menu(菜单)选项卡下。
- Comment(注释)和 Embed(嵌入)功能现在支持在单元悬停时使用。
其他修正:
- 我们已弃用单元可见性控件,因为您现在可以使用报告构建器选择要在报告中包含哪些单元。
- 我们已修正导致密钥无法附加到交互式报告的错误,现在重新运行此类报告将可以顺利处理。
数据连接最新变化
简而言之,您可以连接到 Google BigQuery,在使用 S3 存储桶时享受更好的用户体验,以及开启 SSH 隧道以访问专用网络中的数据库。
Google BigQuery 支持
在 2022.3 版本中,我们已将 Google BigQuery 添加到支持的数据库集成列表当中。 您现在可以通过 Datalore 的界面创建 Google BigQuery 连接,选择您要使用的架构,浏览架构树以及在原生 SQL 单元中查询数据。 在 SQL 方面,您可以享受代码补全和语法高亮显示;在查询结果方面,您可以获得自动绘图、交互式排序和筛选、统计总结;以及无缝过渡到 Python。
针对 S3 存储桶改进了用户体验
您现在可以从与 SQL 数据库相同的界面中附加 AWS S3 和 GCS 存储桶以及浏览存储桶的文件系统! 您可以在右侧边栏中看到文件预览,并一键复制文件路径。
SSH 隧道
在 Datalore 中使用 SSH 隧道连接到远程数据库。 这将在 Datalore 与您的网关服务器之间创建加密 SSH 连接。 使用 SSH 隧道即可支持连接到未暴露于公共网络的数据库。
安装和配置最新变化
简而言之,您现在可以使用 Docker Swarm 在计算机集群上运行 Datalore 以及借助无缝式 TeamCity 集成连接到集群外部的计算机。
基于 Docker 的安装中的多机连接
当我们在 2022 年 6 月首次发布基于 Docker 的安装时,仅支持在一台计算机上运行 Datalore。如果您想在集群上运行 Datalore,那么基于 Kubernetes 的安装曾经是可行的方法。
Datalore Enterprise 2022.3 支持使用 Docker Swarm 将多台计算机连接到基于 Docker 的安装。 如果您不具备现有的 k8s 集群,那么 Docker Swarm 计算机连接可用作 Datalore 基于 Kubernetes 的安装的替代方案。 您可以在我们的文档中获取更多详细信息。
使用 TeamCity 进行外部机器连接
如果您具有任何集群外部的算机,现在可以使用无缝式 TeamCity 集成将它们连接到您的 Datalore 算力当中。 您可以在我们的文档中获取有关此集成的更多详细信息。
高级审计日志记录
我们显著扩展了 Datalore 的日志功能,并启用了与 Admin(管理)面板、终端、Attached data(附加数据)选项卡、工作区、Computation(计算)选项卡等相关操作的日志记录功能。
如何试用 Datalore Enterprise 2022.3
您可以先从适用于 4 名用户的免费 Datalore Enterprise 方案开始,或者申请适用于多达 1000 名用户的 1 个月试用机会。
要从当前版本的 Datalore 升级,请按照我们文档中的说明进行操作。
此外,如果您想向您的团队展示 Datalore,可以申请演示或试用由 JetBrains 托管的 Community 或 Professional 版 Datalore。
接下来有什么值得期待的?
下一个 Datalore Enterprise 版本将侧重于质量改进,例如添加新的身份验证方法、提高性能以及增强基础架构。
要随时掌握有关 Datalore 新功能的最新信息,请订阅我们的博客并在 Twitter 上关注我们!
此致!
Datalore 团队
本博文英文原作者: