Ai logo

JetBrains AI

Supercharge your tools with AI-powered features inside many JetBrains products

News Releases

Mellum2 devient open source : un modèle rapide pour les workflows d’IA

Read this post in other languages:

Entraîné à partir de zéro et conçu pour un déploiement pratique, Mellum2 est conçu pour le routage, les questions-réponses, les sous-agents et l’utilisation de l’IA privée dans les systèmes d’ingénierie logicielle.

Aujourd’hui, nous passons Mellum2 en open source. C’est un modèle de 12 milliards de paramètres, conçu pour résoudre les aspects les plus complexes de l’IA en production : latence, débit et coût. Créé à partir de zéro et distribué sous la licence Apache 2.0, Mellum2 offre une alternative hautement performante et économique pour votre infrastructure.

Mellum a commencé par la complétion de code mais a désormais évolué pour gérer à la fois le code et le langage naturel. Il est désormais un outil polyvalent, capable de prendre en charge le routage, la synthèse et les étapes intermédiaires de raisonnement dans vos workflows d’IA modernes.

Que vous souhaitiez expérimenter, affiner ou déployer à grande échelle, Mellum2 est prêt à fonctionner sur vos propres systèmes.

Essayer Mellum

Architecture et performance

Mellum2 est conçu pour résoudre les goulots d’étranglement dans les systèmes à l’échelle de la production grâce à son architecture et à sa conception axées sur l’efficacité.

  • Conception MoE (Mixture-of-Experts) : le modèle comporte 12 milliards de paramètres au total, mais grâce à sa conception MoE, seuls 2,5 milliards de paramètres sont actifs par jeton. Cela réduit les coûts de calcul, tout en permettant une inférence à haut débit et à faible latence pour les charges de travail en temps réel.
  • Spécialisation : contrairement à de nombreux modèles modernes, Mellum2 n’est pas multimodal. Il est entraîné spécifiquement sur des données en langage naturel et en code. Cette spécialisation garantit que le modèle excelle dans les environnements d’ingénierie logicielle tout en restant léger et rapide.


















Dans notre rapport technique, nous détaillons les performances de notre modèle sur des benchmarks de génération de code, de science, de mathématiques et de raisonnement. Mellum2 offre des performances comparables à celles d’autres modèles de taille similaire, tout en réduisant le temps d’inférence de plus de moitié, ce qui constitue un avantage significatif dans les environnements de déploiement de production.

Principaux cas d’utilisation de Mellum2

  • Router et orchestrer les charges de travail d’IA : utilisez Mellum2 pour analyser les prompts entrants et aider à sélectionner le modèle ou l’outil approprié pour chaque tâche.
  • Construire des pipelines RAG à faible latence : récupérez le contexte pertinent, utilisez Mellum2 pour le résumer et générez des réponses instantanément.
  • Créer des sous-agents rapides dans des workflows complexes : décomposez les pipelines d’agents en plusieurs étapes, comme la collecte du contexte, la planification et la validation. Utilisez Mellum2 pour effectuer des tâches rapides et spécialisées au lieu de vous fier à un seul grand modèle.
  • Permettre un déploiement d’IA privée et locale : exécutez Mellum2 localement ou hébergez-le vous-même pour garder le contrôle sur le code et les données.

La philosophie du « modèle focal » : pourquoi les modèles focalisés sont plus évolutifs

À mesure que les systèmes d’IA se complexifient, les goulots d’étranglement des performances se déplacent de la capacité pure vers les problèmes de latence, de débit et de coût à grande échelle. Toutes les tâches ne nécessitent pas le modèle le plus grand. De nombreuses étapes des systèmes d’IA modernes sont répétitives, sensibles à la latence et exécutées à haute fréquence. Pour ces étapes, un modèle rapide et stable pouvant être routé, hébergé et contrôlé efficacement, est plus bénéfique.

Chez JetBrains, nous pensons que l’avenir est aux systèmes coordonnés, et non aux modèles uniques. Les modèles de pointe continueront à repousser les limites, mais les produits d’IA pratiques nécessitent également des modèles focaux : des composants rapides et spécialisés qui traitent efficacement des tâches à haute fréquence.

C’est le rôle que nous envisageons pour Mellum2 dans l’écosystème des outils logiciels d’IA de nouvelle génération.

Commencer à utiliser Mellum2

Si vous créez des systèmes d’IA pour l’ingénierie logicielle (que ce soit dans un IDE, dans un pipeline RAG, dans le cadre d’un workflow d’agent, ou entièrement sur votre propre infrastructure), nous serions ravis de vous voir essayer Mellum2.

L’open source permet de créer de meilleurs outils.

Essayer Mellum

Auteurs de l’article original en anglais :

Anton Semenkin

Anton Semenkin

Nikita Pavlichenko

Nikita Pavlichenko

Discover more