Ai logo

JetBrains AI

Supercharge your tools with AI-powered features inside many JetBrains products

News Releases

Mellum2 のオープンソース化: AI ワークフロー向けの高速なモデル

Read this post in other languages:

ゼロからトレーニングされ、実際のデプロイ向けに設計された Mellum2 は、ソフトウェア開発システムでのルーティング、質疑応答、サブエージェント、プライベートな AI の使用を想定した作りになっています。

本日、本番運用の AI で最も困難な「遅延」「スループット」「コスト」の課題を解決するために開発された 12B モデルである Mellum2 をオープンソース化します。ゼロから構築され、Apache 2.0 ライセンスの下でリリースされる Mellum2 は、ユーザーのインフラストラクチャに高性能でコスト効率に優れた選択肢を提供します。

当初はコード補完を処理していた Mellum は、自然言語とコードの両方を処理できるまでに進化しました。今ではモダンな AI ワークフロー全体でルーティング、要約、中間推論のステップを強力に支える汎用性の高いツールとなっています。

Mellum2 は実験、ファインチューニング、大規模なデプロイのどれを目的としていても、ユーザー独自のシステム上ですぐに実行できます。

Mellum を試す

アーキテクチャとパフォーマンス

Mellum2 はそのアーキテクチャと的を絞った効率性重視の設計により、本番運用レベルのシステムのボトルネックを解消するように開発されています。

  • Mixture-of-Experts(MoE: 混合専門家)設計: このモデルは合計 120 億個のパラメーターが特色ですが、MoE 設計を採用しているため、1 トークンあたりの有効パラメーター数は 25 億個のみです。これにより、リアルタイムのワークロードに対応可能な高スループットと低遅延を実現すると同時にコストを削減しています。
  • 専門化に注力: Mellum2 は多くのモダンなモデルとは異なり、マルチモーダルではありません。自然言語データとコードデータに特化してトレーニングされています。このような専門化により、ソフトウェア開発環境下で優れた性能を発揮しながらも、軽量かつ高速なモデルを実現しています。


















テクニカルレポートでは、「コード生成」「科学」「数学」「推論」の各ベンチマークにおけるこのモデルのパフォーマンスについて詳しく解説しています。Mellum2 は他の同規模モデルに負けない性能を持ちながら、推論時間を半分以下に短縮します。これは本番運用レベルのデプロイには決定的な利点です。

Mellum2 の主なユースケース

  • AI ワークロードのルーティングとオーケストレーション: Mellum2 を使用してユーザープロンプトを解析し、各タスクに適したモデルやツールの選定に活用できます。
  • 低遅延の RAG パイプラインを構築: 関連するコンテキストを取得し、Mellum2 でそれを要約して瞬時に回答を生成できます。
  • 複雑なワークフローで高速なサブエージェントの活用: エージェントのパイプラインを「コンテキスト収集」「計画」「検証」といったステップに分解できます。Mellum2 を使用することで、1 つの大規模モデルに頼ることなく専門性の高いタスクに素早く対応できます。
  • プライベートなローカル AI のデプロイを実現: Mellum2 をローカルで実行またはセルフホストすることで、コードとデータを完全にユーザーの管理下に置くことができます。

「フォーカルモデル」の考え方: 専門化モデルが拡張性に優れている理由

AI システムの複雑化に伴い、パフォーマンスのボトルネックは単純な処理能力から大規模環境での遅延、スループット、コストへと移行しています。すべてのタスクに巨大なモデルが必要なわけではありません。モダンな AI システムの処理ステップの多くは何度も繰り返され、遅延の影響を受けやすく、高頻度で実行されます。このようなステップは、ルーティング、ホスティング、管理を効率的に行える高速で信頼性の高いモデルの恩恵を受けます。

JetBrains は未来は単一のモデルではなく、連携するシステムにあると考えています。フロンティアモデルは今後も限界を突破し続けるでしょうが、実用的な AI 製品にはフォーカルモデル(高頻度のタスクを効率よく処理する高速で専門化されたコンポーネント)も不可欠です。

それはまさに次世代の AI ソフトウェアツールにおいて Mellum2 が果たすべき役割だと考えています。

Mellum2 の使用を始める

ソフトウェア開発向けの AI システムを構築している方は、ぜひ Mellum2 をお試しください。IDE 内でも、RAG パイプライン内でも、エージェントワークフローに組み込む形でも、または完全に独自のインフラ上でもお使いいただけます。

オープンソースは優れたツールを生み出す原動力です。

Mellum を試す

オリジナル(英語)ブログ投稿記事の作者:

Anton Semenkin

Anton Semenkin

Nikita Pavlichenko

Nikita Pavlichenko

Discover more