{"id":711212,"date":"2026-06-01T16:11:50","date_gmt":"2026-06-01T15:11:50","guid":{"rendered":"https:\/\/blog.jetbrains.com\/?post_type=ai&#038;p=711212"},"modified":"2026-06-01T16:12:00","modified_gmt":"2026-06-01T15:12:00","slug":"mellum2-devient-open-source-un-modele-rapide-pour-les-workflows-d-ia","status":"publish","type":"ai","link":"https:\/\/blog.jetbrains.com\/fr\/ai\/2026\/06\/mellum2-devient-open-source-un-modele-rapide-pour-les-workflows-d-ia\/","title":{"rendered":"Mellum2 devient open source\u00a0: un mod\u00e8le rapide pour les workflows d&#8217;IA"},"content":{"rendered":"<p><strong>Entra\u00een\u00e9 \u00e0 partir de z\u00e9ro et con\u00e7u pour un d\u00e9ploiement pratique, Mellum2 est con\u00e7u pour le routage, les questions-r\u00e9ponses, les sous-agents et l&#8217;utilisation de l&#8217;IA priv\u00e9e dans les syst\u00e8mes d&#8217;ing\u00e9nierie logicielle.<\/strong><\/p>\n<p>Aujourd&#8217;hui, nous passons Mellum2 en open source. C&#8217;est un mod\u00e8le de 12\u00a0milliards de param\u00e8tres, con\u00e7u pour r\u00e9soudre les aspects les plus complexes de l&#8217;IA en production\u00a0: latence, d\u00e9bit et co\u00fbt. Cr\u00e9\u00e9 \u00e0 partir de z\u00e9ro et distribu\u00e9 sous la licence Apache\u00a02.0, <a href=\"https:\/\/www.jetbrains.com\/fr-fr\/mellum\/\" target=\"_blank\" rel=\"noopener\">Mellum2<\/a> offre une alternative hautement performante et \u00e9conomique pour votre infrastructure.<\/p>\n<p>Mellum a commenc\u00e9 par la <a href=\"https:\/\/blog.jetbrains.com\/fr\/ai\/2025\/05\/mellum-devient-open-source-un-llm-specialement-concu-pour-les-developpeurs-maintenant-sur-hugging-face\/\">compl\u00e9tion de code<\/a> mais a d\u00e9sormais \u00e9volu\u00e9 pour g\u00e9rer \u00e0 la fois le code et le langage naturel. Il est d\u00e9sormais un outil polyvalent, capable de prendre en charge le routage, la synth\u00e8se et les \u00e9tapes interm\u00e9diaires de raisonnement dans vos workflows d&#8217;IA modernes.<\/p>\n<p>Que vous souhaitiez exp\u00e9rimenter, affiner ou d\u00e9ployer \u00e0 grande \u00e9chelle, Mellum2 est pr\u00eat \u00e0 fonctionner sur vos propres syst\u00e8mes.<\/p>\n<p align=\"center\"><a class=\"jb-download-button\" href=\"https:\/\/huggingface.co\/collections\/JetBrains\/mellum-2\" target=\"_blank\" rel=\"noopener\"><i class=\"download-icon\"><\/i>Essayer Mellum<\/a><\/p>\n<h2 class=\"wp-block-heading\">Architecture et performance<\/h2>\n<p>Mellum2 est con\u00e7u pour r\u00e9soudre les goulots d&#8217;\u00e9tranglement dans les syst\u00e8mes \u00e0 l&#8217;\u00e9chelle de la production gr\u00e2ce \u00e0 son architecture et \u00e0 sa conception ax\u00e9es sur l&#8217;efficacit\u00e9.<\/p>\n<ul>\n<li><strong>Conception MoE (Mixture-of-Experts)\u00a0:<\/strong> le mod\u00e8le comporte 12\u00a0milliards de param\u00e8tres au total, mais gr\u00e2ce \u00e0 sa conception MoE, seuls 2,5\u00a0milliards de param\u00e8tres sont actifs par jeton. Cela r\u00e9duit les co\u00fbts de calcul, tout en permettant une inf\u00e9rence \u00e0 haut d\u00e9bit et \u00e0 faible latence pour les charges de travail en temps r\u00e9el.<\/li>\n<li><strong>Sp\u00e9cialisation\u00a0:<\/strong> contrairement \u00e0 de nombreux mod\u00e8les modernes, Mellum2 n&#8217;est pas multimodal. Il est entra\u00een\u00e9 sp\u00e9cifiquement sur des donn\u00e9es en langage naturel et en code. Cette sp\u00e9cialisation garantit que le mod\u00e8le excelle dans les environnements d&#8217;ing\u00e9nierie logicielle tout en restant l\u00e9ger et rapide.<\/li>\n<\/ul>\n<div class=\"slider slider-full\">\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-1-LiveCodeBench-v6.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-1-LiveCodeBench-v6.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-2-BFCL-V4-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-2-BFCL-V4-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-3-AIME-2526-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-3-AIME-2526-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-4-GSMPlus.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-4-GSMPlus.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-5-GPQA-Diamond.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-5-GPQA-Diamond.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-6-MMLU-Redux.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-6-MMLU-Redux.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-7-JetBrains-Internal-Pairwise.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-7-JetBrains-Internal-Pairwise.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-8-MixEval-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-8-MixEval-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-9-IFEval.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-9-IFEval.png\" alt=\"\" \/><br \/><\/a><\/div>\n<\/div>\n<p>Dans notre <a href=\"https:\/\/arxiv.org\/abs\/2605.31268\" target=\"_blank\" rel=\"noopener\">rapport technique<\/a>, nous d\u00e9taillons les performances de notre mod\u00e8le sur des benchmarks de g\u00e9n\u00e9ration de code, de science, de math\u00e9matiques et de raisonnement. Mellum2 offre des performances comparables \u00e0 celles d&#8217;autres mod\u00e8les de taille similaire, tout en r\u00e9duisant le temps d&#8217;inf\u00e9rence de plus de moiti\u00e9, ce qui constitue un avantage significatif dans les environnements de d\u00e9ploiement de production.<\/p>\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" loading=\"lazy\" class=\"wp-image-710603\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/05\/Blog-1280x720-1-1.png\" alt=\"\" width=\"1280\" height=\"720\" \/><\/figure>\n<h2 class=\"wp-block-heading\">Principaux cas d&#8217;utilisation de Mellum2<\/h2>\n<ul>\n<li><strong>Router et orchestrer les charges de travail d&#8217;IA\u00a0:<\/strong> utilisez Mellum2 pour analyser les prompts entrants et aider \u00e0 s\u00e9lectionner le mod\u00e8le ou l&#8217;outil appropri\u00e9 pour chaque t\u00e2che.<\/li>\n<li><strong>Construire des pipelines RAG \u00e0 faible latence\u00a0:<\/strong> r\u00e9cup\u00e9rez le contexte pertinent, utilisez Mellum2 pour le r\u00e9sumer et g\u00e9n\u00e9rez des r\u00e9ponses instantan\u00e9ment.<\/li>\n<li><strong>Cr\u00e9er des sous-agents rapides dans des workflows complexes\u00a0:<\/strong> d\u00e9composez les pipelines d&#8217;agents en plusieurs \u00e9tapes, comme la collecte du contexte, la planification et la validation. Utilisez Mellum2 pour effectuer des t\u00e2ches rapides et sp\u00e9cialis\u00e9es au lieu de vous fier \u00e0 un seul grand mod\u00e8le.<\/li>\n<li><strong>Permettre un d\u00e9ploiement d&#8217;IA priv\u00e9e et locale\u00a0:<\/strong> ex\u00e9cutez Mellum2 localement ou h\u00e9bergez-le vous-m\u00eame pour garder le contr\u00f4le sur le code et les donn\u00e9es.<\/li>\n<\/ul>\n<h2 class=\"wp-block-heading\">La philosophie du \u00ab\u00a0mod\u00e8le focal\u00a0\u00bb\u00a0: pourquoi les mod\u00e8les focalis\u00e9s sont plus \u00e9volutifs<\/h2>\n<p>\u00c0 mesure que les syst\u00e8mes d&#8217;IA se complexifient, les goulots d&#8217;\u00e9tranglement des performances se d\u00e9placent de la capacit\u00e9 pure vers les probl\u00e8mes de latence, de d\u00e9bit et de co\u00fbt \u00e0 grande \u00e9chelle. Toutes les t\u00e2ches ne n\u00e9cessitent pas le mod\u00e8le le plus grand. De nombreuses \u00e9tapes des syst\u00e8mes d&#8217;IA modernes sont r\u00e9p\u00e9titives, sensibles \u00e0 la latence et ex\u00e9cut\u00e9es \u00e0 haute fr\u00e9quence. Pour ces \u00e9tapes, un mod\u00e8le rapide et stable pouvant \u00eatre rout\u00e9, h\u00e9berg\u00e9 et contr\u00f4l\u00e9 efficacement, est plus b\u00e9n\u00e9fique.<\/p>\n<p>Chez JetBrains, nous pensons que l&#8217;avenir est aux syst\u00e8mes coordonn\u00e9s, et non aux mod\u00e8les uniques. Les mod\u00e8les de pointe continueront \u00e0 repousser les limites, mais les produits d&#8217;IA pratiques n\u00e9cessitent \u00e9galement des mod\u00e8les focaux\u00a0: des composants rapides et sp\u00e9cialis\u00e9s qui traitent efficacement des t\u00e2ches \u00e0 haute fr\u00e9quence.<\/p>\n<p>C&#8217;est le r\u00f4le que nous envisageons pour Mellum2 dans l\u2019\u00e9cosyst\u00e8me des outils logiciels d\u2019IA de nouvelle g\u00e9n\u00e9ration.<\/p>\n<h2 class=\"wp-block-heading\">Commencer \u00e0 utiliser Mellum2<\/h2>\n<p>Si vous cr\u00e9ez des syst\u00e8mes d&#8217;IA pour l&#8217;ing\u00e9nierie logicielle (que ce soit dans un IDE, dans un pipeline RAG, dans le cadre d&#8217;un workflow d&#8217;agent, ou enti\u00e8rement sur votre propre infrastructure), nous serions ravis de vous voir essayer Mellum2.<\/p>\n<p>L&#8217;open source permet de cr\u00e9er de meilleurs outils.<\/p>\n<p align=\"center\"><a class=\"jb-download-button\" href=\"https:\/\/huggingface.co\/collections\/JetBrains\/mellum-2\" target=\"_blank\" rel=\"noopener\"><i class=\"download-icon\"><\/i>Essayer Mellum<\/a><\/p>\n\n\n<p><em>Auteurs de l&#8217;article original en anglais<\/em> :<\/p>\n\n\n    <div class=\"about-author \">\n        <div class=\"about-author__box\">\n            <div class=\"row\">\n                <div class=\"about-author__box-img\">\n                    <img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2025\/04\/github_copy-e1746002997805-200x200.jpg\" width=\"200\" height=\"200\" alt=\"Anton Semenkin\" loading=\"lazy\"  class=\"avatar avatar-200 wp-user-avatar wp-user-avatar-200 photo avatar-default\">\n                <\/div>\n                <div class=\"about-author__box-text\">\n                                            <h4>Anton Semenkin<\/h4>\n                                                        <\/div>\n            <\/div>\n        <\/div>\n    <\/div>\n\n\n    <div class=\"about-author \">\n        <div class=\"about-author__box\">\n            <div class=\"row\">\n                <div class=\"about-author__box-img\">\n                    <img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/TDwPaqpy_400x400.jpg\" width=\"200\" height=\"200\" alt=\"Nikita Pavlichenko\" loading=\"lazy\"  class=\"avatar avatar-200 wp-user-avatar wp-user-avatar-200 photo avatar-default\">\n                <\/div>\n                <div class=\"about-author__box-text\">\n                                            <h4>Nikita Pavlichenko<\/h4>\n                                                        <\/div>\n            <\/div>\n        <\/div>\n    <\/div>\n","protected":false},"author":813,"featured_media":711271,"comment_status":"closed","ping_status":"closed","template":"","categories":[89,907],"tags":[6847,8638,103],"cross-post-tag":[],"acf":[],"_links":{"self":[{"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/ai\/711212"}],"collection":[{"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/ai"}],"about":[{"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/types\/ai"}],"author":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/users\/813"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/comments?post=711212"}],"version-history":[{"count":9,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/ai\/711212\/revisions"}],"predecessor-version":[{"id":711294,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/ai\/711212\/revisions\/711294"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/media\/711271"}],"wp:attachment":[{"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/media?parent=711212"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/categories?post=711212"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/tags?post=711212"},{"taxonomy":"cross-post-tag","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/fr\/wp-json\/wp\/v2\/cross-post-tag?post=711212"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}