Company

Visit jetbrains.com

JetBrains Plugins

大数据工具插件更新：Spark、HDFS、Parquet 等等

Lei

自我们上次更新以来已经有一段时间了。如果您还记得的话，我们去年宣布了 IntelliJ IDEA 与 Apache Zeppelin、S3 的集成以及与 Apache Spark 的实验性集成。后者的集成作为实验功能发布，仅在非稳定的更新渠道中可用。但是我们有一些好消息！今天，我们发布了该插件的新版本，使 Spark 支持终于公开可用。它还增加了对 HDFS 和 Parquet 的支持。

Spark 监控

现在，Spark 集成已在公共更新中提供，让我们快速了解它可以为您做什么。

为了能够监视您的 Spark 作业，现在要做的就是转到 Big Data Tools Connections 设置并添加 Spark History Server 的 URL：

完成此操作后，关闭设置并打开 IDE 窗口右下方的 Spark 工具窗口。Spark 工具窗口显示已完成且正在运行的 Spark 应用程序列表（这是 “Applications” 选项卡，默认情况下处于折叠状态）、作业列表、其阶段和任务。

通过点击 “Executors” 选项卡，您将看到有关活动和非活动执行者的信息：

目前，“SQL” 选项卡显示了最近查询的列表，但尚未包括实际的 SQL。此外，如果您将 Kerberos 与 Spark 一起使用，则 IDE 可能不允许您连接到服务器。我们正努力在下一个更新中解决此问题。如果您使用 Kerberos，请告知我们，我们会优先执行此任务。

HDFS

与我们在 12 月引入的 S3 支持类似，该插件现在允许您连接到 HDFS 服务器以从 IDE 浏览和管理文件。要启用此功能，只需转到 “Big Data Tools Connections” 设置并添加 HDFS 配置：

当前，您必须指定根路径和连接到服务器的方式：“Configuration Files Directory” 或 “Explicit URI”。

配置完 HDFS 服务器后，您会看到它们出现在 Big Data Tools 工具窗口中（当然，如果配置了 Apache Zeppelin 笔记本和 S3 存储桶，则它们旁边）：

“Big Data Tools” 工具窗口显示存储在已配置服务器中的文件和文件夹。与 S3 一样，HDFS 中的 CSV 和 Parquet 文件可以在树中展开以显示其文件模式。在任何文件或文件夹上调用的上下文菜单提供了多种操作：

这些选项使您可以管理文件、将文件复制到本地计算机或在编辑器中预览。通过预览，您可以查看文件内容的第一部分，而无需将其完全复制到计算机中。

Parquet

如上所述，此更新引入了对 Parquet 文件的初始支持。现在，您可以在 IDE 中打开任何 Parquet 文件，并以表的形式查看其内容：

打开 Parquet 文件时，插件仅显示第一部分，而不显示全部内容。当您处理非常大的文件时，这特别有用。

请注意，就像使用 Spark 一样，您需要对服务器进行物理访问才能访问文件。这意味着，如果您的服务器位于 SSH 隧道之后，则当前必须自己建立隧道。如果您在访问文件时遇到任何问题或不便，请务必告知我们。否则，我们可能不知道尚不支持的特定情况。您越早提供反馈，越好！

今天的文章就到这里了。您可能还注意到，到目前为止，我们已经在 Scala 博客中发布了更新信息，这是 IntelliJ IDEA 博客中发布的第一个更新。我们这样做是因为现在该插件不再仅提供 Apache Zeppelin 和 Scala 支持。相反，它集成了各种各样的工具来处理大数据。

要查看此更新中的错误修复的完整列表，请参阅版本说明。最后，如果您需要有关如何使用插件的任何功能的帮助，请务必查看文档。还需要帮助吗？请在意见部分中或通过我们的官方微信给我们留言。

附注：由于该插件仍处于开发的早期阶段，因此其许多集成可能无法支持所有各种情况。所以，我们目前非常依赖您的反馈。如果您发现重要的用户方案不支持（例如某种授权类型或某些其他特定要求），请在意见部分、问题跟踪器或反馈调查中告知我们。

原文发表于 2020 年 2 月 25 日，作者 Andrey Cheptsov

JetBrains 20 周年庆回顾客户案例分享：Unidata 的 WebStorm 使用方式

Discover more

程序员在写代码时往往追求”性能”，这性能可以分为两种：一种是代码运行时的性能好坏、一种则是程序员写代码时的速度及品质，换言之就是生产力的体现。而 IntelliJ IDEA 最为人所喜好的，就是在开发生产力上的提升。除了默认集成的特性外，JetBrains 的插件市场（Plugin Marketplace）上也提供了许多由官方或第三方开发者制作的插件，可以依不同需求场景扩充 IntelliJ IDEA 的功能。在这篇文章里，我以几个常见的需求及场景做分类，介绍数个可以增强 IntelliJ IDEA 的插件（这些插件也可以适用在其他 JetBrains IDE 里），不仅能让您的 Intel…

JetBrains 作为一间跨国公司，我们非常重视每一位用户使用的语言。我们知道若用户能用自己习惯且熟悉的语言，将可以更好地理解我们的服务及产品功能。因此从去年开始，我们启动了本地化项目，开始着手进行网站及产品 UI 的本地化。在 2019 年 11 月正式推出支持 8 种不同语言的 JetBrains 官网后，我们的本地化团队紧接着进行 IntelliJ IDEA 的 UI 本地化工作。 JetBrains 官网目前已支持简体中文目前 IntelliJ IDEA 的 UI 本地化工作已经有了初步的成果，并以 EAP（Early Access Program，早期试用计划）插件的形式发布…

JetBrains 已成立 20 年，在这 20 年间，我们一直在打磨与公司自身的风格、价值观和需求相匹配的开发方式。这些流程非常适合我们，在此我们想与其他人分享。例如，内部测试在我们的产品开发过程中一直扮演着中心角色，通过这个视频，我们想与大家分享它在我们的创意流程中的角色。在软件开发行业中，内部测试是指在自己的公司内像最终用户一样测试产品的做法。实际上，您必须使用自己的产品才能确保它有最高质量。在这方面，JetBrains 一直都有独特的优势。事实上，自 2000 年我们开始开发第一款 JetBrains 产品以来，我们工具的理念经常源自内部需求。从 IntelliJ IDE…

为了让 Kotlin 开发者可以更轻松、更快速地开发出 Web 应用，JetBrains 的技术团队用 Kotlin 打造了 Ktor 框架，只需要几行代码，就可以用简洁易懂的语法写出网站、API 或微服务。写代码是变轻松了，那要怎么部署呢？在这篇教程里就是要跟大家分享，如何将写好的 Ktor 应用以 fat-jar 的方式部署至云服务器。先创建一个 API 应用为求教程完整，先简单演示一下如何用 Ktor 创建一个 API 应用吧！先开启 IntelliJ IDEA，选择 Create New Project。选择左边 Ktor 的项目模板，配置 …

Company

大数据工具插件更新：Spark、HDFS、Parquet 等等

Spark 监控

HDFS

Parquet

Discover more

给 IntelliJ IDEA 新用户的插件指南

三分钟让 IntelliJ IDEA 显示简体中文

JetBrains 的软件开发之道：内部测试以及那些主要原则

部署 Ktor 应用至云服务器

Company

大数据工具插件更新：Spark、HDFS、Parquet 等等

Spark 监控

HDFS

Parquet

Subscribe to JetBrains Blog updates

Discover more

给 IntelliJ IDEA 新用户的插件指南

三分钟让 IntelliJ IDEA 显示简体中文

JetBrains 的软件开发之道：内部测试以及那些主要原则

部署 Ktor 应用至云服务器