{"id":574,"date":"2025-01-28T07:03:48","date_gmt":"2025-01-28T07:03:48","guid":{"rendered":"https:\/\/janusai.pro\/?p=574"},"modified":"2025-01-28T08:08:08","modified_gmt":"2025-01-28T08:08:08","slug":"released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut","status":"publish","type":"post","link":"https:\/\/janusai.pro\/de\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/","title":{"rendered":"Sp\u00e4t in der Nacht ver\u00f6ffentlicht! DeepSeek definiert KI-Bilderzeugung und -Verst\u00e4ndnis neu: Das bahnbrechende Janus-Pro Comprehensive Model feiert sein Deb\u00fct!"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"915\" height=\"564\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2.png\" alt=\"\" class=\"wp-image-580\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2.png 915w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-300x185.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-768x473.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-18x12.png 18w\" sizes=\"auto, (max-width: 915px) 100vw, 915px\" \/><\/figure>\n\n\n\n<p><strong>Wichtigste Highlights<\/strong><br>\ud83d\udd39&nbsp;<strong>Vereinheitlichte Transformator-Architektur<\/strong>: Ein einziges Modell ist f\u00fcr das Verstehen beider Bilder zust\u00e4ndig&nbsp;<em>und<\/em>&nbsp;Generation, wodurch die Notwendigkeit separater Systeme entf\u00e4llt.<br>\ud83d\udd39&nbsp;<strong>Skalierbar &amp; Open-Source<\/strong>: Verf\u00fcgbar in&nbsp;<strong>1B<\/strong>&nbsp;und&nbsp;<strong>7B<\/strong>&nbsp;Parameter-Versionen (MIT-lizensiert), optimiert f\u00fcr verschiedene Anwendungen und kommerzielle Nutzung.<br>\ud83d\udd39&nbsp;<strong>Leistung auf dem neuesten Stand der Technik<\/strong>: \u00dcbertrifft OpenAIs DALL-E 3 und Stable Diffusion in Benchmarks wie GenEval und DPG-Bench.<br>\ud83d\udd39&nbsp;<strong>Vereinfachte Bereitstellung<\/strong>: Die schlanke Architektur senkt die Kosten f\u00fcr Schulungen und Einweisungen, w\u00e4hrend die Flexibilit\u00e4t erhalten bleibt.<\/p>\n\n\n\n<p><strong>Modell Links<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Janus-Pro-7B<\/strong>:&nbsp;<a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">HuggingFace<\/a><\/li>\n\n\n\n<li><strong>Janus-Pro-1B<\/strong>:&nbsp;<a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-1B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">HuggingFace<\/a><\/li>\n\n\n\n<li><strong>GitHub<\/strong>:&nbsp;<a href=\"https:\/\/github.com\/deepseek-ai\/Janus\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Code &amp; Dokumente<\/a><\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_72 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhalts\u00fcbersicht<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Inhaltsverzeichnis umschalten\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten auf<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/de\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Why_Janus-Pro_Stands_Out\" title=\"Warum Janus-Pro sich abhebt\">Warum Janus-Pro sich abhebt<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/de\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Benchmark_Dominance\" title=\"Benchmark-Dominanz\">Benchmark-Dominanz<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/de\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Technical_Breakdown\" title=\"Technische Gliederung\">Technische Gliederung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/de\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Community_Buzz\" title=\"Gemeinschaft Buzz\">Gemeinschaft Buzz<\/a><\/li><\/ul><\/nav><\/div>\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Why_Janus-Pro_Stands_Out\"><\/span><strong>Warum Janus-Pro sich abhebt<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>1. Zwei Superm\u00e4chte in einem Modell<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Modus verstehen<\/strong>: Verwendet&nbsp;<strong>SigLIP-L<\/strong>&nbsp;(die \"Superbrille\") zur Analyse von Bildern (bis zu 384\u00d7384) und Text.<\/li>\n\n\n\n<li><strong>Erzeugungsmodus<\/strong>: Hebelwirkung&nbsp;<strong>Rektifizierter Durchfluss<\/strong>&nbsp;+&nbsp;<strong>SDXL-VAE<\/strong>&nbsp;(der \"magische Pinsel\"), um hochwertige Bilder zu erstellen.<\/li>\n<\/ul>\n\n\n\n<p><strong>2. Gehirnleistung &amp; Training<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Kern-LLM<\/strong>: Basiert auf dem leistungsstarken Sprachmodell von DeepSeek (1,5B\/7B Parameter), das sich durch kontextbezogene Schlussfolgerungen auszeichnet.<\/li>\n\n\n\n<li><strong>Ausbildung Pipeline<\/strong>: Pre-Training auf riesigen Datens\u00e4tzen \u2192 \u00dcberwachtes Fine-Tuning \u2192 EMA-Optimierung f\u00fcr Spitzenleistung.<\/li>\n<\/ul>\n\n\n\n<p><strong>3. Warum Transformator-\u00dcberdiffusion?<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Vielseitigkeit der Aufgaben<\/strong>: Der Schwerpunkt liegt auf dem einheitlichen Verst\u00e4ndnis und der Generierung, w\u00e4hrend sich Diffusionsmodelle ausschlie\u00dflich auf die Bildqualit\u00e4t konzentrieren.<\/li>\n\n\n\n<li><strong>Wirkungsgrad<\/strong>: Autoregressive Generierung (Einzelschritt) vs. iterative Entrauschung durch Diffusion (z.B. 20 Schritte bei stabiler Diffusion).<\/li>\n\n\n\n<li><strong>Kosten-Wirksamkeit<\/strong>: Ein einziger Transformer-Backbone vereinfacht Schulung und Bereitstellung.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"955\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-1024x955.jpeg\" alt=\"\" class=\"wp-image-578\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-1024x955.jpeg 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-300x280.jpeg 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-768x716.jpeg 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-13x12.jpeg 13w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4.jpeg 1080w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Benchmark_Dominance\"><\/span><strong>Benchmark-Dominanz<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>\ud83d\udcca Multimodales Verstehen<\/strong><br>Janus-Pro-7B \u00fcbertrifft spezialisierte Modelle (z. B. LLaVA) bei vier wichtigen Benchmarks und skaliert gleichm\u00e4\u00dfig mit der Parametergr\u00f6\u00dfe.<\/p>\n\n\n\n<p><strong>\ud83c\udfa8 Text-zu-Bild-Generierung<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>GenEval<\/strong>: Passt zu SDXL und DALL-E 3.<\/li>\n\n\n\n<li><strong>DPG-Bench<\/strong>:&nbsp;<strong>84.2% Genauigkeit<\/strong>&nbsp;(Janus-Pro-7B) und \u00fcbertrifft damit alle Wettbewerber.<\/li>\n<\/ul>\n\n\n\n<p><strong>Realit\u00e4tsnahe Tests<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Geschwindigkeit<\/strong>: ~15 Sekunden\/Bild (L4-GPU, 22 GB VRAM).<\/li>\n\n\n\n<li><strong>Qualit\u00e4t<\/strong>: Starke prompte Einhaltung, auch wenn kleinere Details verfeinert werden m\u00fcssen.<\/li>\n\n\n\n<li><strong>Colab-Demo<\/strong>:&nbsp;<a href=\"https:\/\/colab.research.google.com\/drive\/1V3bH2oxhikj_B_EYy5yRG_9yqSqxxqgS?usp=sharing\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Versuchen Sie Janus-Pro-7B<\/a>&nbsp;(Pro-Stufe erforderlich).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Technical_Breakdown\"><\/span><strong>Technische Gliederung<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Architektur<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"376\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-1024x376.png\" alt=\"\" class=\"wp-image-579\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-1024x376.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-300x110.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-768x282.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-18x7.png 18w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640.png 1080w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Pfad des Verst\u00e4ndnisses<\/strong>: Sauberes Bild \u2192 SigLIP-L-Encoder \u2192 LLM \u2192 Textantwort.<\/li>\n\n\n\n<li><strong>Generation Pfad<\/strong>: Verrauschtes Bild \u2192 Rectified Flow Decoder + LLM \u2192 Iterative Rauschunterdr\u00fcckung.<\/li>\n<\/ul>\n\n\n\n<p><strong>Wichtige Innovationen<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Entkoppelte visuelle Kodierung<\/strong>: Getrennte Wege zum Verstehen\/Erzeugen verhindern \"Rollenkonflikte\" in Sehmodulen.<\/li>\n\n\n\n<li><strong>Gemeinsamer Transformatorkern<\/strong>: Erm\u00f6glicht einen aufgaben\u00fcbergreifenden Wissenstransfer (z. B. hilft das Erlernen von \"Katzen\"-Konzepten sowohl beim Erkennen als auch beim Zeichnen).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Community_Buzz\"><\/span><strong>Gemeinschaft Buzz<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>AK (KI-Forscher)<\/strong>:&nbsp;<em>\"Die Einfachheit und Flexibilit\u00e4t von Janus-Pro machen es zu einem erstklassigen Kandidaten f\u00fcr multimodale Systeme der n\u00e4chsten Generation. Durch die Entkopplung der Bildverarbeitungspfade bei gleichzeitiger Beibehaltung eines einheitlichen Transformators schafft es ein Gleichgewicht zwischen Spezialisierung und Generalisierung - eine seltene Leistung.<\/em><\/p>\n<\/blockquote>\n\n\n\n<p><strong>Warum die MIT-Lizenz wichtig ist<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Freiheit<\/strong>: Kommerzielle Nutzung, \u00c4nderung und Verbreitung mit minimalen Einschr\u00e4nkungen.<\/li>\n\n\n\n<li><strong>Transparenz<\/strong>: Vollst\u00e4ndiger Code-Zugriff beschleunigt die von der Gemeinschaft betriebenen Verbesserungen.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p><strong>Endg\u00fcltige Entscheidung<\/strong><br>Janus-Pro von DeepSeek ist nicht nur ein weiteres KI-Modell, sondern ein Paradigmenwechsel. Durch die Vereinheitlichung von Verst\u00e4ndnis und Erzeugung unter einem Dach \u00f6ffnet es die T\u00fcren f\u00fcr intelligentere kreative Werkzeuge, Echtzeitanwendungen und kosteneffiziente Implementierungen. Mit Open-Source-Zugang und MIT-Lizenzierung k\u00f6nnte dies der Katalysator f\u00fcr die n\u00e4chste Welle der multimodalen Innovation sein. \ud83d\ude80<\/p>\n\n\n\n<p><em>F\u00fcr Entwickler: Sehen Sie sich die&nbsp;<a href=\"https:\/\/github.com\/deepseek-ai\/Janus\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">ComfyUI-Knoten<\/a>&nbsp;und schlie\u00dfen Sie sich der Experimentierwelle an!<\/em><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>dieser Beitrag wird gesponsert von:<\/p>\n\n\n\n<a href=\"https:\/\/dang.ai\/\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/cdn.prod.website-files.com\/63d8afd87da01fb58ea3fbcb\/6487e2868c6c8f93b4828827_dang-badge.png\" alt=\"Dang.ai\" style=\"width: 150px; height: 54px;\" width=\"150\" height=\"54\"\/><\/a>\n\n\n\n<p><a href=\"https:\/\/dang.ai\/\" target=\"_blank\" rel=\"noreferrer noopener\"><\/a><\/p>\n\n\n\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>Wichtige Highlights\ud83d\udd39 Einheitliche Transformer-Architektur: Ein einziges Modell \u00fcbernimmt sowohl das Bildverst\u00e4ndnis als auch die Bilderzeugung, wodurch separate Systeme \u00fcberfl\u00fcssig werden.\ud83d\udd39 Skalierbar &amp; Open-Source: Erh\u00e4ltlich in 1B- und 7B-Parameter-Versionen (MIT-lizenziert), optimiert f\u00fcr verschiedene Anwendungen und kommerzielle Nutzung.\ud83d\udd39 State-of-the-Art Performance: \u00dcbertrifft OpenAI's DALL-E 3 und Stable Diffusion in Benchmarks wie GenEval und DPG-Bench.\ud83d\udd39 Vereinfachter Einsatz: Die schlanke Architektur reduziert die Trainings-\/Inferenzkosten bei gleichbleibender Flexibilit\u00e4t. Modell Links...<\/p>","protected":false},"author":1,"featured_media":580,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-574","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/comments?post=574"}],"version-history":[{"count":3,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/574\/revisions"}],"predecessor-version":[{"id":609,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/574\/revisions\/609"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media\/580"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media?parent=574"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/categories?post=574"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/tags?post=574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}