JetBrains AI

Supercharge your tools with AI-powered features inside many JetBrains products

Explore More

News Releases

Mellum2 开放源代码：适用于 AI 工作流的快速模型

Sue

Read this post in other languages:

Mellum2 从零开始训练，专为实际部署而设计，旨在用于软件工程系统中的路由、问答、子智能体和私有 AI。

今天，我们将开放 Mellum2 的源代码，它是一个 120 亿参数的模型，专为解决生产 AI 中的延迟、吞吐量和成本这三大最棘手的挑战而设计。Mellum2 从零开始构建，基于 Apache 2.0 许可证发布，为您的基础架构提供高性能、高性价比的替代方案。

Mellum 最初用于代码补全；如今已演进为可以同时处理自然语言和代码。它现在是一款多功能工具，能够为现代 AI 工作流中的路由、总结和中间推理步骤提供支持。

无论您想要试验、微调还是大规模部署，Mellum2 都可以随时在您自己的系统中运行。

试用 Mellum

架构与性能

Mellum2 通过自身架构和侧重于效率的设计，专为解决生产级系统的瓶颈而打造。

混合专家 (MoE) 设计：模型共有 120 亿参数，但由于其采用 MoE 设计，每个 token 仅有 25 亿参数处于激活状态。此设计在降低计算成本的同时，可以对实时工作负载进行高吞吐量、低延迟推理。
专属侧重点：与很多现代模型不同，Mellum2 并非多模态模型，它专门针对自然语言与代码数据进行训练。这种专门化可以确保模型在软件工程环境中表现出色，同时保持轻量和高速。

在我们的技术报告中，我们详细介绍了模型在代码生成、科学、数学和推理基准测试中的表现。Mellum2 在与同规模模型的竞争中不落下风，同时将推理时间缩短至不到一半 — 这对生产级部署来说是一项决定性优势。

Mellum2 的主要用例

路由和编排 AI 工作负载：使用 Mellum2 分析传入提示，帮助为每项任务选择合适的模型或工具。
构建低延迟 RAG 流水线：检索相关上下文、使用 Mellum2 进行总结，并即时生成回答。
为复杂工作流中的快速子智能体提供支持：将智能体流水线拆分为多个步骤，例如上下文收集、规划和验证。使用 Mellum2 执行快速、专门的任务，而不依赖于单个大模型。
实现私有、本地 AI 部署：在本地运行 Mellum2 或进行自托管，以确保代码和数据完全在您的掌控之中。

“焦点模型”理念：为什么专注式模型的可扩缩性更好

随着 AI 系统日益复杂，性能瓶颈已从原始能力转向大规模部署时的延迟、吞吐量和成本。并非每项任务都需要规模最大的模型。现代 AI 系统中的许多步骤都是重复的、对延迟敏感且高频。这些步骤更适合通过可以高效实现路由、托管和控制的快速可靠的模型来处理。

JetBrains 相信未来属于协同系统，而非单一模型。前沿模型将继续突破极限，但实用的 AI 产品同样需要焦点模型：能够高效处理高频任务的快速、专用组件。

这就是我们对 Mellum2 在下一代 AI 软件工具中所扮演角色的看法。

开始使用 Mellum2

如果您正在为软件工程构建 AI 系统 — 无论是在 IDE 内部、RAG 流水线中、作为智能体工作流的一部分，还是完全在您自己的基础架构上 — 我们都非常希望您尝试 Mellum2。

开源是打造更出色工具的方式。

试用 Mellum

本博文英文原作者：

Anton Semenkin

Nikita Pavlichenko

Koog 登陆 Java：JetBrains 推出企业级 AI 智能体框架

Discover more

AI 编码智能体正在迅速增多。一些最常见的 AI 编码智能体包括 Gemini CLI、Claude Code、Auggie、OpenCode 和 Copilot，而且每天都有新的智能体发布。每个智能体都有其独特优势、特定设置，以及对编辑器不同程度的支持。想要弄清市面上有哪些智能体就已经很不容易了，更不用说在 IDE 中运行这些智能体了。不过，从现在开始，情况将有所改观。我们与 Zed（Zed 公告）联合推出了官方 ACP 智能体注册表：一个直接集成到 JetBrains IDE 和 Zed 中的 AI 编码智能体目录。浏览可用智能体、点击 Install（安装），即可立即开始使用。这次…

如果您曾尝试过构建由多个 AI 智能体组成的系统，很可能会遇到难题。一开始很简单：您有一个智能体负责撰写博文，另一个智能体负责校对博文，或许还有第三个智能体负责建议或生成图像。单独来看，它们都很高效。但要让它们协同工作呢？往往这个时候就会开始出现问题。每个智能体都有自己的一套“语言”：一个使用不同的 API 接口，另一个有自己的消息格式，而且它们可能都有特定的身份验证要求。要让它们彼此通信，就意味着需要为每一个连接编写自定义的集成代码。结果，您无法专注于让各个智能体变得更智能、更快速或更有用，而是被困在为它们搭建沟通桥梁上。 A2A 的作用：跨智能体通信层这就是 Agent2A…

我们为 Kotlin 社区带来了一些好消息！在今年的 KotlinConf 上，我们将推出 Koog，这是一个创新型开源智能体框架，可以帮助开发者使用现代 Kotlin DSL 在 JVM 生态系统中构建 AI 智能体。我们设计 Koog 是为了向开发者提供创建智能、自主代理所需的工具，并让他们能够像使用 Kotlin 一样轻松高效地进行日常开发。这是将 Kotlin 打造成一流 AI 语言的重要里程碑，我们非常期待社区构建的成果。尝试 Koog 我们为什么要为 Kotlin 构建智能体框架起初，我们都对聊天助手和 LLM 的潜力感到震惊。但随着这些模型的发展，它们的能力显然远远超…

代码补全一直是 JetBrains IDE 中的突出功能，可以帮助开发者更快速、更智能地编写代码，并减少错误。但要是它能做的更多呢？要是它不但可以预测下一个元素，还可以预测整行代码，甚至可以补全代码块呢？这就是我们一直以来努力的方向。我们在 AI 方面投入了大量时间和精力，因此我们的代码补全功能已发展得无比强大，比以往任何时候都更精确、快速和智能。在这篇博文中，我们决定分享 JetBrains IDE 中 AI 代码补全的原理，它的发展历程以及即将取得的激动人心的进展。我们开始吧！什么是 JetBrains AI 代码补全？ JetBrains 通过两种方式提供 AI 代码补全：…

JetBrains AI

Mellum2 开放源代码：适用于 AI 工作流的快速模型

架构与性能

Mellum2 的主要用例

“焦点模型”理念：为什么专注式模型的可扩缩性更好

开始使用 Mellum2

Anton Semenkin

Nikita Pavlichenko

Discover more

ACP 智能体注册表已上线：在 JetBrains IDE 中查找并连接 AI 编码智能体

Koog × A2A：使用 Kotlin 构建互联的 AI 智能体

Koog：助力 Kotlin 开发者构建 AI 智能体

完成不可完成的补全任务：JetBrains IDE 中 AI 补全的现状

JetBrains AI

Mellum2 开放源代码：适用于 AI 工作流的快速模型

架构与性能

Mellum2 的主要用例

“焦点模型”理念：为什么专注式模型的可扩缩性更好

开始使用 Mellum2

Anton Semenkin

Nikita Pavlichenko

Subscribe to JetBrains AI Blog updates

Discover more

ACP 智能体注册表已上线：在 JetBrains IDE 中查找并连接 AI 编码智能体

Koog × A2A：使用 Kotlin 构建互联的 AI 智能体

Koog：助力 Kotlin 开发者构建 AI 智能体

完成不可完成的补全任务：JetBrains IDE 中 AI 补全的现状