JetBrains AI

Supercharge your tools with AI-powered features inside many JetBrains products

Explore More

News Releases

Mellum2 devient open source : un modèle rapide pour les workflows d’IA

Delphine Massenhove

Read this post in other languages:

Entraîné à partir de zéro et conçu pour un déploiement pratique, Mellum2 est conçu pour le routage, les questions-réponses, les sous-agents et l’utilisation de l’IA privée dans les systèmes d’ingénierie logicielle.

Aujourd’hui, nous passons Mellum2 en open source. C’est un modèle de 12 milliards de paramètres, conçu pour résoudre les aspects les plus complexes de l’IA en production : latence, débit et coût. Créé à partir de zéro et distribué sous la licence Apache 2.0, Mellum2 offre une alternative hautement performante et économique pour votre infrastructure.

Mellum a commencé par la complétion de code mais a désormais évolué pour gérer à la fois le code et le langage naturel. Il est désormais un outil polyvalent, capable de prendre en charge le routage, la synthèse et les étapes intermédiaires de raisonnement dans vos workflows d’IA modernes.

Que vous souhaitiez expérimenter, affiner ou déployer à grande échelle, Mellum2 est prêt à fonctionner sur vos propres systèmes.

Essayer Mellum

Architecture et performance

Mellum2 est conçu pour résoudre les goulots d’étranglement dans les systèmes à l’échelle de la production grâce à son architecture et à sa conception axées sur l’efficacité.

Conception MoE (Mixture-of-Experts) : le modèle comporte 12 milliards de paramètres au total, mais grâce à sa conception MoE, seuls 2,5 milliards de paramètres sont actifs par jeton. Cela réduit les coûts de calcul, tout en permettant une inférence à haut débit et à faible latence pour les charges de travail en temps réel.
Spécialisation : contrairement à de nombreux modèles modernes, Mellum2 n’est pas multimodal. Il est entraîné spécifiquement sur des données en langage naturel et en code. Cette spécialisation garantit que le modèle excelle dans les environnements d’ingénierie logicielle tout en restant léger et rapide.

Dans notre rapport technique, nous détaillons les performances de notre modèle sur des benchmarks de génération de code, de science, de mathématiques et de raisonnement. Mellum2 offre des performances comparables à celles d’autres modèles de taille similaire, tout en réduisant le temps d’inférence de plus de moitié, ce qui constitue un avantage significatif dans les environnements de déploiement de production.

Principaux cas d’utilisation de Mellum2

Router et orchestrer les charges de travail d’IA : utilisez Mellum2 pour analyser les prompts entrants et aider à sélectionner le modèle ou l’outil approprié pour chaque tâche.
Construire des pipelines RAG à faible latence : récupérez le contexte pertinent, utilisez Mellum2 pour le résumer et générez des réponses instantanément.
Créer des sous-agents rapides dans des workflows complexes : décomposez les pipelines d’agents en plusieurs étapes, comme la collecte du contexte, la planification et la validation. Utilisez Mellum2 pour effectuer des tâches rapides et spécialisées au lieu de vous fier à un seul grand modèle.
Permettre un déploiement d’IA privée et locale : exécutez Mellum2 localement ou hébergez-le vous-même pour garder le contrôle sur le code et les données.

La philosophie du « modèle focal » : pourquoi les modèles focalisés sont plus évolutifs

À mesure que les systèmes d’IA se complexifient, les goulots d’étranglement des performances se déplacent de la capacité pure vers les problèmes de latence, de débit et de coût à grande échelle. Toutes les tâches ne nécessitent pas le modèle le plus grand. De nombreuses étapes des systèmes d’IA modernes sont répétitives, sensibles à la latence et exécutées à haute fréquence. Pour ces étapes, un modèle rapide et stable pouvant être routé, hébergé et contrôlé efficacement, est plus bénéfique.

Chez JetBrains, nous pensons que l’avenir est aux systèmes coordonnés, et non aux modèles uniques. Les modèles de pointe continueront à repousser les limites, mais les produits d’IA pratiques nécessitent également des modèles focaux : des composants rapides et spécialisés qui traitent efficacement des tâches à haute fréquence.

C’est le rôle que nous envisageons pour Mellum2 dans l’écosystème des outils logiciels d’IA de nouvelle génération.

Commencer à utiliser Mellum2

Si vous créez des systèmes d’IA pour l’ingénierie logicielle (que ce soit dans un IDE, dans un pipeline RAG, dans le cadre d’un workflow d’agent, ou entièrement sur votre propre infrastructure), nous serions ravis de vous voir essayer Mellum2.

L’open source permet de créer de meilleurs outils.

Essayer Mellum

Auteurs de l’article original en anglais :

Anton Semenkin

Nikita Pavlichenko

Donner à l’IA quelque chose qui mérite d’être amplifié : trois priorités pour les responsables techniques Gouvernance de l’IA agentique : concevoir pour garantir la responsabilité et le contrôle

Discover more

Cursor est désormais disponible comme agent d'IA dans les IDE JetBrains via l'Agent Client Protocol (ACP). Il vous suffit de le choisir à partir du sélecteur d'agents pour qu'il ait accès à votre projet. Si vous avez déjà pratiqué la programmation assistée par IA, vous connaissez sûrement déjà Cu…

Aujourd'hui, nous annonçons le lancement de la JetBrains Console, qui offre une gestion et une analyse de l'IA améliorées pour les organisations, avec notamment de nouvelles fonctionnalités pour gérer, observer et contrôler l'utilisation et les coûts de l'IA dans l'ensemble des équipes. L'IA n'est p…

OpenAI Codex est désormais intégré nativement au chat JetBrains AI, vous offrant ainsi une puissante option supplémentaire pour résoudre des tâches de développement concrètes directement dans votre IDE. Vous pouvez utiliser Codex avec un abonnement JetBrains AI, votre compte ChatGPT ou une …

Chez JetBrains, nous sommes toujours à l'écoute de nos utilisateurs afin de nous assurer que nos produits leur offrent une expérience cohérente et intuitive. Au cours de ce processus, il s'est avéré que l'une des améliorations les plus demandées concernait l'unification de deux interfaces utilisateu…

JetBrains AI

Mellum2 devient open source : un modèle rapide pour les workflows d’IA

Architecture et performance

Principaux cas d’utilisation de Mellum2

La philosophie du « modèle focal » : pourquoi les modèles focalisés sont plus évolutifs

Commencer à utiliser Mellum2

Anton Semenkin

Nikita Pavlichenko

Discover more

Cursor est maintenant Inclus dans le registre ACP et disponible dans les IDE JetBrains

Meilleure gestion et analyse de l’IA pour les organisations

Codex est désormais intégré aux JetBrains IDEs

Junie est maintenant intégré au chat IA

JetBrains AI

Mellum2 devient open source : un modèle rapide pour les workflows d’IA

Architecture et performance

Principaux cas d’utilisation de Mellum2

La philosophie du « modèle focal » : pourquoi les modèles focalisés sont plus évolutifs

Commencer à utiliser Mellum2

Anton Semenkin

Nikita Pavlichenko

Subscribe to JetBrains AI Blog updates

Discover more

Cursor est maintenant Inclus dans le registre ACP et disponible dans les IDE JetBrains

Meilleure gestion et analyse de l’IA pour les organisations

Codex est désormais intégré aux JetBrains IDEs

Junie est maintenant intégré au chat IA