{"id":711211,"date":"2026-06-02T01:39:20","date_gmt":"2026-06-02T00:39:20","guid":{"rendered":"https:\/\/blog.jetbrains.com\/?post_type=ai&#038;p=711211"},"modified":"2026-06-02T01:39:31","modified_gmt":"2026-06-02T00:39:31","slug":"mellum2-wird-open-source-ein-schnelles-modell-fuer-ki-workflows","status":"publish","type":"ai","link":"https:\/\/blog.jetbrains.com\/de\/ai\/2026\/06\/mellum2-wird-open-source-ein-schnelles-modell-fuer-ki-workflows\/","title":{"rendered":"Mellum2 wird Open Source: ein schnelles Modell f\u00fcr KI-Workflows"},"content":{"rendered":"<p><strong>Mellum2 wurde f\u00fcr praktische Anwendungen erstellt und von Grund auf neu trainiert. Es ist auf Routing, Frage-Antwort-Anwendungen, Unteragenten und die vertrauliche KI-Nutzung in Softwareentwicklungssystemen ausgelegt.<\/strong><\/p>\n<p>Heute stellen wir Mellum2 als Open-Source bereit \u2013 ein Modell mit 12 Milliarden Parametern, das f\u00fcr die schwierigsten Herausforderungen beim Produktionseinsatz von KI konzipiert wurde: Latenz, Durchsatz und Kosten. Das von Grund auf neu entwickelte, unter der Apache-2.0-Lizenz ver\u00f6ffentlichte <a href=\"https:\/\/www.jetbrains.com\/mellum\/\" target=\"_blank\" rel=\"noopener\">Mellum2<\/a> ist eine leistungsstarke, kosteng\u00fcnstige Alternative f\u00fcr Ihre Infrastruktur.<\/p>\n<p>Mellum war zun\u00e4chst auf <a href=\"https:\/\/blog.jetbrains.com\/ai\/2025\/04\/mellum-goes-open-source-a-purpose-built-llm-for-developers-now-on-hugging-face\/\">Code-Completion<\/a> ausgelegt; jetzt haben wir es so weiterentwickelt, dass es sowohl nat\u00fcrliche Sprache als auch Code verarbeiten kann. Es ist nun ein vielseitiges Werkzeug, das Sie f\u00fcr Routing, Zusammenfassungen und intermedi\u00e4re Denkschritte in Ihren modernen KI-Workflows nutzen k\u00f6nnen.<\/p>\n<p>Ganz gleich, ob Sie experimentieren, feintunen oder das Modell in gro\u00dfem Ma\u00dfstab einsetzen m\u00f6chten \u2013 Mellum2 ist bereit f\u00fcr die Nutzung in Ihren Systemen.<\/p>\n<p align=\"center\"><a class=\"jb-download-button\" href=\"https:\/\/huggingface.co\/collections\/JetBrains\/mellum-2\" target=\"_blank\" rel=\"noopener\"><i class=\"download-icon\"><\/i>Mellum ausprobieren<\/a><\/p>\n<h2 class=\"wp-block-heading\">Architektur und Performance<\/h2>\n<p>Die Architektur und das zielgerichtete, effizienzorientierte Design von Mellum2 sind darauf ausgelegt, Engp\u00e4sse in gro\u00dffl\u00e4chig eingesetzten Produktionssystemen zu beseitigen.<\/p>\n<ul>\n<li><strong>Mixture-of-Experts-Modell (MoE):<\/strong> Das Modell verf\u00fcgt \u00fcber insgesamt 12 Milliarden Parameter, doch da es auf einem MoE-Design basiert, sind pro Token nur 2,5 Milliarden Parameter aktiv. Dadurch werden die Rechenkosten gesenkt und gleichzeitig Inferenzen mit hohem Durchsatz und geringer Latenz f\u00fcr Echtzeitanwendungen erm\u00f6glicht.<\/li>\n<li><strong>Spezialisierung:<\/strong> Im Gegensatz zu vielen modernen Modellen ist Mellum2 nicht multimodal. Es wurde speziell mit Daten aus dem Bereich der nat\u00fcrlichen Sprache und der Programmierung trainiert. Diese Spezialisierung gew\u00e4hrleistet, dass sich das Modell in der Softwareentwicklung besonders gut bew\u00e4hrt und dabei schlank und schnell bleibt.<\/li>\n<\/ul>\n<div class=\"slider slider-full\">\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-1-LiveCodeBench-v6.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-1-LiveCodeBench-v6.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-2-BFCL-V4-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-2-BFCL-V4-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-3-AIME-2526-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-3-AIME-2526-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-4-GSMPlus.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-4-GSMPlus.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-5-GPQA-Diamond.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-5-GPQA-Diamond.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-6-MMLU-Redux.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-6-MMLU-Redux.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-7-JetBrains-Internal-Pairwise.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-7-JetBrains-Internal-Pairwise.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-8-MixEval-1.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-8-MixEval-1.png\" alt=\"\" \/><br \/><\/a><\/div>\n<div class=\"slider__slide\"><a href=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-9-IFEval.png\"><br \/><img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/DSGN-26150-9-IFEval.png\" alt=\"\" \/><br \/><\/a><\/div>\n<\/div>\n<p>In unserem <a href=\"https:\/\/arxiv.org\/abs\/2605.31268\" target=\"_blank\" rel=\"noopener\">technischen Bericht<\/a> beschreiben wir die Leistungsf\u00e4higkeit unseres Modells anhand von Benchmarks in den Bereichen Codegenerierung, Naturwissenschaften, Mathematik und logisches Denken. Mellum2 h\u00e4lt mit anderen Modellen \u00e4hnlicher Gr\u00f6\u00dfe mit und verk\u00fcrzt dabei die Inferenzzeit auf weniger als die H\u00e4lfte \u2013 ein entscheidender Vorteil f\u00fcr den Einsatz in Produktionsumgebungen.<\/p>\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" loading=\"lazy\" class=\"wp-image-710603\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/05\/Blog-1280x720-1-1.png\" alt=\"\" width=\"1280\" height=\"720\" \/><\/figure>\n<h2 class=\"wp-block-heading\">Wichtige Anwendungsf\u00e4lle f\u00fcr Mellum2<\/h2>\n<ul>\n<li><strong>Routing und Orchestrierung von KI-Aufgaben:<\/strong> Verwenden Sie Mellum2, um eingehende Prompts zu analysieren und das richtige Modell oder Tool f\u00fcr die jeweilige Aufgabe auszuw\u00e4hlen.<\/li>\n<li><strong>RAG-Pipelines mit geringer Latenz:<\/strong> Rufen Sie den relevanten Kontext ab, lassen Sie Mellum2 eine Zusammenfassung erstellen und generieren Sie sofortige Antworten.<\/li>\n<li><strong>Leistungsstarke Unteragenten in komplexen Workflows:<\/strong> Gliedern Sie Agent-Pipelines in einzelne Schritte wie Kontexterfassung, Planung und Validierung. Verwenden Sie Mellum2 f\u00fcr schnelle, spezialisierte Aufgaben, statt sich auf ein einziges gro\u00dfes Modell zu beschr\u00e4nken.<\/li>\n<li><strong>Vertrauliche, lokale KI-Nutzung:<\/strong> F\u00fchren Sie Mellum2 lokal aus oder hosten Sie es auf den eigenen Servern, um die vollst\u00e4ndige Kontrolle \u00fcber Code und Daten zu behalten.<\/li>\n<\/ul>\n<h2 class=\"wp-block-heading\">\u201eFocal-Model\u201c-Philosophie: Warum fokussierte Modelle besser skalierbar sind<\/h2>\n<p>Mit zunehmender Komplexit\u00e4t verlagern sich die Leistungsengp\u00e4sse von KI-Systemen von der reinen Performance hin zu Latenz, Durchsatz und Kosten bei gro\u00dffl\u00e4chiger Nutzung. Nicht jede Aufgabe erfordert das gr\u00f6\u00dfte Modell. Viele Schritte in modernen KI-Systemen sind wiederkehrend, latenzempfindlich und hochfrequent. Diese Schritte profitieren von einem schnellen und zuverl\u00e4ssigen Modell, das sich effizient routen, hosten und kontrollieren l\u00e4sst.<\/p>\n<p>Bei JetBrains sind wir davon \u00fcberzeugt, dass die Zukunft nicht einzelnen Modellen, sondern koordinierten Systemen geh\u00f6rt. Frontier-Modelle werden weiterhin die Grenzen erweitern, doch f\u00fcr praxistaugliche KI-Produkte sind auch fokussierte Modelle erforderlich: schnelle, spezialisierte Komponenten, die hochfrequente Aufgaben effizient bew\u00e4ltigen.<\/p>\n<p>Das ist die Rolle, in der wir Mellum2 in der n\u00e4chsten Generation der KI-Softwaretools sehen.<\/p>\n<h2 class=\"wp-block-heading\">Legen Sie mit Mellum2 los<\/h2>\n<p>Wenn Sie KI-Systeme f\u00fcr die Softwareentwicklung bauen \u2013 sei es innerhalb einer IDE, in einer RAG-Pipeline, als Teil eines Agentenworkflows oder vollst\u00e4ndig in Ihrer eigenen Infrastruktur \u2013, w\u00fcrden wir uns freuen, wenn Sie Mellum2 ausprobieren w\u00fcrden.<\/p>\n<p>Denn Open Source ist der Weg zu besseren Tools.<\/p>\n<p align=\"center\"><a class=\"jb-download-button\" href=\"https:\/\/huggingface.co\/collections\/JetBrains\/mellum-2\" target=\"_blank\" rel=\"noopener\"><i class=\"download-icon\"><\/i>Mellum ausprobieren<\/a><\/p>\n<p><strong>Autor*innen des urspr\u00fcnglichen Blogposts<\/strong><\/p>\n\n    <div class=\"about-author \">\n        <div class=\"about-author__box\">\n            <div class=\"row\">\n                <div class=\"about-author__box-img\">\n                    <img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2025\/04\/github_copy-e1746002997805-200x200.jpg\" width=\"200\" height=\"200\" alt=\"Anton Semenkin\" loading=\"lazy\"  class=\"avatar avatar-200 wp-user-avatar wp-user-avatar-200 photo avatar-default\">\n                <\/div>\n                <div class=\"about-author__box-text\">\n                                            <h4>Anton Semenkin<\/h4>\n                                                        <\/div>\n            <\/div>\n        <\/div>\n    <\/div>\n\n\n    <div class=\"about-author \">\n        <div class=\"about-author__box\">\n            <div class=\"row\">\n                <div class=\"about-author__box-img\">\n                    <img decoding=\"async\" src=\"https:\/\/blog.jetbrains.com\/wp-content\/uploads\/2026\/06\/TDwPaqpy_400x400.jpg\" width=\"200\" height=\"200\" alt=\"Nikita Pavlichenko\" loading=\"lazy\"  class=\"avatar avatar-200 wp-user-avatar wp-user-avatar-200 photo avatar-default\">\n                <\/div>\n                <div class=\"about-author__box-text\">\n                                            <h4>Nikita Pavlichenko<\/h4>\n                                                        <\/div>\n            <\/div>\n        <\/div>\n    <\/div>\n","protected":false},"author":964,"featured_media":708232,"comment_status":"closed","ping_status":"closed","template":"","categories":[89,907],"tags":[6847,8638,103],"cross-post-tag":[],"acf":[],"_links":{"self":[{"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/ai\/711211"}],"collection":[{"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/ai"}],"about":[{"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/types\/ai"}],"author":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/users\/964"}],"replies":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/comments?post=711211"}],"version-history":[{"count":2,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/ai\/711211\/revisions"}],"predecessor-version":[{"id":711349,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/ai\/711211\/revisions\/711349"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/media\/708232"}],"wp:attachment":[{"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/media?parent=711211"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/categories?post=711211"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/tags?post=711211"},{"taxonomy":"cross-post-tag","embeddable":true,"href":"https:\/\/blog.jetbrains.com\/de\/wp-json\/wp\/v2\/cross-post-tag?post=711211"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}