Company

访问 jetbrains.com

AI News

Developer Productivity AI Arena 正式上线：用于 AI 编码智能体基准测试的开放平台

Sue

Read this post in other languages:

25 年来，JetBrains 一直致力于塑造跨多种编程语言的软件开发格局，不断改进开发者和组织的软件构建方式。我们一直专注于提升工作效率和整体开发者体验。

随着 AI 的兴起，现在的一项关键挑战是如何衡量 AI 辅助工具在现实世界中带来的效率提升。为了应对这一挑战，JetBrains 决定打造 Developer Productivity AI Arena (DPAI Arena)，并最终将其献给 Linux Foundation。

“随着 AI 编码智能体成为现代软件开发不可或缺的一部分，行业迫切需要一种透明、可信的方式来衡量它们对开发者工作效率的真正影响。 DPAIA 建立了一个开放的供应商中立式框架，用于评估跨语言、框架和环境的 AI 辅助开发。
我们诚邀编码智能体和框架提供商加入这项工作，共同制定用于定义下一代软件创作的基准。我们鼓励最终用户参与其中，在自身实际工作负载上验证 AI 工具，从而确保生态系统能够以开放、可信和可衡量的影响不断发展。”

Mark Collier
– Linux Foundation AI 与基础架构总经理

DPAI Arena 是业内首款开放式、多语言、多框架和多工作流基准测试平台，旨在衡量 AI 编码智能体在现实世界软件工程任务中的成效。它围绕灵活且基于路径的架构构建而成，能够对各种工作流（例如，修补、bug 修正、PR 审查、测试生成、静态分析等）进行公平、可重现的比较。

重新定义基准测试

当前的基准测试所依赖的数据集已过时，涵盖的技术范围狭窄，并且过于局限地关注问题到补丁工作流。随着 AI 编码工具的快速发展，业界仍然缺乏一个中立且基于标准的框架，用于衡量它们对开发者工作效率的真正影响。

“JetBrains 二十多年来一直致力于构建各种工具，帮助数千万开发者进行批判性思考、自信地编写代码并快速创新。这让我们对 AI 目前为软件开发领域带来的潜在影响与压力有了独到的理解。我们亲眼目睹了广大团队在提高工作效率的同时兼顾代码质量、透明度和可信度方面所做的努力 – 这些挑战并非仅靠性能基准就能解决。
Developer Productivity AI Arena 旨在实现清晰且可追责的方法，以持续且协作的方式评估和改进 AI 编码智能体，并帮助行业了解甚至衡量仅能加快工作速度的 AI 与能够真正理解和促进工作效果的 AI 之间的区别。我们希望通过定义一种用于 AI 智能体基准测试的共享框架，来促进整个 AI 系统的透明度和可信度。 ”

Kirill Skrygan
– JetBrains 首席执行官

DPAI Arena 通过透明的评估管道、可重现的基础架构以及可扩展的社区驱动型多路径数据集填补了这一空白。

衡量重要指标

DPAI Arena 将可衡量的工作效率带入 AI 辅助软件开发领域。 AI 工具提供商可以在实际任务中对其工具进行基准测试和不断完善，技术供应商可以通过贡献领域特定的基准来帮助其生态系统维持一流水平，企业在采用某些工具前可以获得可信的方式对其进行评估，开发者可以获得有关哪些工具能够真正提高工作效率的透明洞察。

DPAI Arena 旨在让每个人都能为 AI 编码的未来做出贡献。 Spring Benchmark 是该平台的第一项基准，它带来了针对未来贡献的技术标准。首先，它实现了数据集创建准则，并详细说明了支持的评估格式和一般规则。其次，它为解耦基础架构提供了坚实的基础，使任何人都能采用自己的数据集（BYOD 方式）并重用基础架构进行自己的评估。

我们也在关注 Spring AI Bench，以扩展 DPAI Arena 中的 Java 基准测试流，并与该项目的核心团队紧密合作以推动 Java 生态系统中的更多可变性和多路径基准测试。

加入 DPAI Arena

我们计划将此项目献给 Linux Foundation，供其建立多元且包容的技术指导委员会，以确定平台的未来发展方向。

请访问 https://dpaia.dev/ 关注平台最新进展。有关详情，请参阅我们的项目概览或 GitHub 组织。

本博文英文原作者：

Arun Gupta

Arun Gupta is a globally recognized expert in developer relations, open source strategy, and go-to-market innovation. He is the VP of Developer Experience at JetBrains, leading the effort to connect with the global developer community and external partners. With over 25 years of experience at Intel, Apple, Amazon, and Red Hat, he’s built developer communities that drive adoption and aligned DevRel with product, marketing, and sales to create lasting champions. Arun advocates mindfulness, kindness, and developer empathy as the foundation of modern DevRel.

He chaired the CNCF and OpenSSF governing boards, leading ecosystem growth and open source security initiatives. Arun also helped Fortune 100 companies embrace open collaboration through founding multiple open source program offices. A global speaker and author, Arun has keynoted in 50+ countries, is a Docker Captain and Java Champion, and founded Devoxx4Kids USA. He actively leads initiatives like TEDAI and the UN’s Tech Over Hackathon.

IDE、.NET 工具、dotUltimate 和 All Products Pack 将上调订阅价格 Java 开源项目如何使用 IntelliJ IDEA：现实示例 – 第 2 部分

Discover more

JetBrains 在 2024 Gartner® Peer Insights™ 集成开发环境 (IDE) 软件客户之声中荣获客户选择奖，这是我们连续两年获此殊荣。阅读报告值得信赖的供应商我们相信，JetBrains 的持续创新和开发者至上理念为我们赢得了这一认可。凭借 IntelliJ IDEA、PyCharm、PhpStorm、Rider、WebStorm 等旗舰 IDE，JetBrains 帮助开发者编写更好的代码和提高工作效率。我们很荣幸连续两年荣获 IDE 类别的客户选择奖。我们相信，这一认可彰显了我们在 IDE 方面持续投资提供卓越开发者体验的承诺。 JetBra…

JetBrains IDE Services 是一套致力于提高整个组织开发者工作效率的企业套件，现已登陆云端！通过提供 JetBrains 托管的服务，IDE Services Cloud 可以简化许可证管理、增强安全性并提供无缝的可扩缩性，确保组织可以更专注于开发而不是管理。作为此次更新的一部分，IDE Services 旗下的所有产品现在均以 SaaS 形式提供给客户。包括： License Vault，可用于高效地大规模管理 IDE 许可证。这项服务还包括随用随付许可证等选项，可供即时扩缩使用量，以及浮动模式，让您可以将可用许可证重新指定给组织内的其他开发者。 IDE Prov…

更新：CLion、RubyMine 和 DataGrip 现在也对非商业用途免费。我们很激动地宣布许可模式将有所变动，我们相信这一变动将惠及开发者社区 – WebStorm 和 Rider 现在对非商业用途免费！请继续阅读，详细了解这一变动以及我们做出改变的原因，并务必查看下面的“常见问题解答”部分，以了解更多详细信息。情况介绍今年早些时候，我们为最近推出的 IDE RustRover 和 Aqua 实施了一种新的许可模式，即面向非商业用途免费提供。现在，我们要将这一模式扩展到 WebStorm 和 Rider。如果您将这些 IDE 用于非商业用途，例如学习、开源项目开发、内容…

您喜欢为科技社区创作精彩内容吗？您愿意与他人分享您的编码之旅吗？快来加入我们新推出的 JetBrains 内容创作者计划吧！ JetBrains 不仅致力于提供卓越的开发者体验，还努力激励和支持尽可能多的程序员。通过新推出的内容创作者计划，我们将向内容创作者及其受众授予 JetBrains IDE 使用权限，无论他们选择什么技术堆栈。谁可以加入 JetBrains 内容创作者计划？我们的计划欢迎多种类型内容的创作者，包括视频、教程、直播、播客、社交媒体帖子、简报等。如果您已经拥有至少 2,000 名关注者并将持续创作新内容，我们很乐意与您合作！加入能获得哪些权益？参加 JetB…

Company