{"id":698,"date":"2025-01-29T11:13:31","date_gmt":"2025-01-29T11:13:31","guid":{"rendered":"https:\/\/janusai.pro\/?p=698"},"modified":"2025-01-29T11:14:26","modified_gmt":"2025-01-29T11:14:26","slug":"janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it","status":"publish","type":"post","link":"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/","title":{"rendered":"Janus Pro DeepSeek: Tiefes Eintauchen in die Technologie und Anwendung des neuesten KI-Modells | Entdecken Sie die Innovationskraft dahinter"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p>Das kosteng\u00fcnstige und leistungsstarke Open-Source-Modell von deepseek hat sich wie ein Virus verbreitet. Zahlreiche neue Nutzer haben sich auf der deepseek-Website registriert, was immer wieder zum Absturz der Website f\u00fchrte.<\/p>\n\n\n\n<p>Mit der rasanten Entwicklung der Technologie der k\u00fcnstlichen Intelligenz ver\u00e4ndern gro\u00dfe Sprachmodelle (LLMs) jeden Aspekt unserer Arbeit und unseres Lebens.<\/p>\n\n\n\n<p>Aber es hat auch viele Schwierigkeiten und Herausforderungen in der letzten Zeit erlebt. Und in diesem Bereich sticht DeepSeek mit seiner innovativen Technologie und hervorragenden Leistung hervor.<\/p>\n\n\n\n<p>Wir werden einen tiefen Einblick in Janus Pro DeepSeek, das neueste KI-Modell und DeepSeeks neuestes multimodales Gro\u00dfmodell auf Open-Source-Basis, nehmen. Erfahren Sie mehr \u00fcber die technischen Merkmale, die Entwicklungsgeschichte und den praktischen Anwendungswert.<\/p>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhalts\u00fcbersicht<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Inhaltsverzeichnis umschalten\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten auf<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#What_is_Janus_Pro_DeepSeek\" >Was ist Janus Pro DeepSeek?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Development_of_Janus_Pro_DeepSeek\" >Entwicklung von Janus Pro DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Establishment_and_development\" >Gr\u00fcndung und Entwicklung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Technical_breakthroughs_and_product_iterations\" >Technische Durchbr\u00fcche und Produktwiederholungen<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeeks_core_technology\" >Janus Pro Die Kerntechnologie von DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Visual_coding_decoupling\" >Entkopplung der visuellen Kodierung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Unified_Transformer_architecture\" >Vereinheitlichte Transformator-Architektur<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Optimized_training_strategy\" >Optimierte Ausbildungsstrategie<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Expanded_training_data\" >Erweiterte Trainingsdaten<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Innovative_visual_encoder\" >Innovativer visueller Encoder<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#High-performance_generative_module\" >Leistungsstarkes generatives Modul<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-12\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Infrastructure_innovations\" >Infrastruktur-Innovationen<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-13\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multi-modal_understanding_and_generation_capabilities\" >Multimodale Verst\u00e4ndnis- und Generierungsf\u00e4higkeiten<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-14\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeek_performance\" >Janus Pro DeepSeek-Leistung<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-15\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multimodal_understanding_performance\" >Multimodale Verstehensleistung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-16\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_command_tracking\" >Text-zu-Bild-Befehlsverfolgung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-17\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_generation_performance\" >Leistung der Text-zu-Bild-Generierung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-18\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Model_architecture_and_training\" >Modellarchitektur und Schulung<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-19\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Scalability_and_deployment\" >Skalierbarkeit und Einsatz<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-20\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Practical_application_scenarios_of_Janus_Pro_DeepSeek\" >Praktische Anwendungsszenarien von Janus Pro DeepSeek<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-21\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\" >Wie w\u00e4hle ich die richtige Version von Janus Pro DeepSeek f\u00fcr mich aus?<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-22\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Applicable_scenarios\" >Anwendbare Szenarien<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-23\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Deployment_requirements\" >Anforderungen f\u00fcr den Einsatz<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-24\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Summary\" >Zusammenfassung<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-25\" href=\"https:\/\/janusai.pro\/de\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Community_support_and_resources\" >Unterst\u00fctzung und Ressourcen der Gemeinschaft<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"What_is_Janus_Pro_DeepSeek\"><\/span>Was ist <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a>?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"998\" height=\"793\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png\" alt=\"\" class=\"wp-image-699\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png 998w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-300x238.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-768x610.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-15x12.png 15w\" sizes=\"auto, (max-width: 998px) 100vw, 998px\" \/><\/figure>\n\n\n\n<p>Janus Pro ist ein vom DeepSeek-Team ver\u00f6ffentlichtes Open-Source-Modell f\u00fcr multimodale KI, das haupts\u00e4chlich f\u00fcr das Verstehen von Bildern und die Bilderzeugung verwendet wird.<\/p>\n\n\n\n<p>Kernfunktionen<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Multimodales Verstehen und Generieren<\/strong>: Janus Pro kann sowohl Text als auch Bilder gleichzeitig verarbeiten, indem es sowohl den Inhalt des Bildes versteht als auch Bilder auf der Grundlage der Textbeschreibung erzeugt.<\/li>\n\n\n\n<li><strong>Offene Quelle und gro\u00df angelegtes Modell<\/strong>: Es ist in zwei Parametergr\u00f6\u00dfen erh\u00e4ltlich, 1B und 7B, und ist Open Source und im Handel erh\u00e4ltlich<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Development_of_Janus_Pro_DeepSeek\"><\/span>Entwicklung von <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Establishment_and_development\"><\/span>Gr\u00fcndung und Entwicklung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Juli 2023<\/strong>: DeepSeek ist ein offiziell gegr\u00fcndetes Unternehmen mit Hauptsitz in Hangzhou, das sich auf Forschung und Entwicklung im Bereich der allgemeinen k\u00fcnstlichen Intelligenz (AGI) konzentriert.<\/li>\n\n\n\n<li><strong>2. November 2023<\/strong>: Ver\u00f6ffentlichung des ersten quelloffenen Code-Gro\u00dfmodells DeepSeek Coder, das Codegenerierung, Debugging und Datenanalyse in mehreren Programmiersprachen unterst\u00fctzt.<\/li>\n\n\n\n<li><strong>29. November 2023<\/strong>: DeepSeek LLM, ein allgemeines gro\u00dfes Modell mit einer Parameterskala von 67 Milliarden, wird eingef\u00fchrt, einschlie\u00dflich Basis- und Chat-Versionen von 7B und 67B.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Technical_breakthroughs_and_product_iterations\"><\/span>Technische Durchbr\u00fcche und Produktwiederholungen<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>7. Mai 2024<\/strong>: DeepSeek-V2, das Open-Source-Hybrid-Expertenmodell (MoE) der zweiten Generation, wird mit insgesamt 236 Milliarden Parametern und auf nur 1 RMB pro Million Token reduzierten Inferenzkosten ver\u00f6ffentlicht.<\/li>\n\n\n\n<li><strong>26. Dezember 2024<\/strong>: DeepSeek-V3 wird ver\u00f6ffentlicht, mit insgesamt 671 Milliarden Parametern. Es verwendet eine innovative MoE-Architektur und FP8-Training mit gemischter Pr\u00e4zision, und die Trainingskosten betragen nur 5,576 Millionen US-Dollar.<\/li>\n\n\n\n<li><strong>Januar 20, 2025<\/strong>: DeepSeek-R1, eine neue Generation von Inferenzmodellen, wird ver\u00f6ffentlicht, mit einer Leistung, die der offiziellen Version o1 von OpenAI gleichkommt, und ist als Open Source verf\u00fcgbar.<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"953\" height=\"521\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png\" alt=\"\" class=\"wp-image-701\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png 953w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-300x164.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-768x420.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-18x10.png 18w\" sizes=\"auto, (max-width: 953px) 100vw, 953px\" \/><\/figure>\n\n\n\n<p>Am 27. Januar hat die <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">janus pro multimodales Modell<\/a> wurde ver\u00f6ffentlicht und unmittelbar nach der Ver\u00f6ffentlichung als Open Source zur Verf\u00fcgung gestellt, damit mehr Menschen am Entwicklungsprozess gro\u00dfer KI-Modelle teilnehmen und die neueste KI-Technologie mit begrenzten Ressourcen nutzen und erlernen k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeeks_core_technology\"><\/span>Janus Pro Die Kerntechnologie von DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1017\" height=\"586\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png\" alt=\"\" class=\"wp-image-702\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png 1017w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-300x173.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-768x443.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-18x10.png 18w\" sizes=\"auto, (max-width: 1017px) 100vw, 1017px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Visual_coding_decoupling\"><\/span>Entkopplung der visuellen Kodierung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro nutzt die Technologie der visuellen Kodierung zur Entkopplung, um den visuellen Kodierungspfad in unabh\u00e4ngige Verarbeitungspfade aufzuteilen, die jeweils f\u00fcr multimodale Verstehens- und Generierungsaufgaben verwendet werden. Dieses Design l\u00f6st effektiv das Problem des Funktionskonflikts zwischen dem visuellen Kodierer in den Verstehens- und Erzeugungsaufgaben in traditionellen multimodalen Modellen und verbessert die Flexibilit\u00e4t und Aufgabenanpassung des Modells.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Unified_Transformer_architecture\"><\/span>Vereinheitlichte Transformator-Architektur<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Trotz der Entkopplung des visuellen Kodierungspfads verwendet Janus Pro weiterhin eine einzige Transformer-Architektur zur Bearbeitung multimodaler Aufgaben. Diese einheitliche Architektur vereinfacht das Modelldesign und verbessert gleichzeitig die Skalierbarkeit des Modells und die F\u00e4higkeit der Modelle, aufgaben\u00fcbergreifend zusammenzuarbeiten.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Optimized_training_strategy\"><\/span>Optimierte Ausbildungsstrategie<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro hat eine Reihe von Optimierungen an der Trainingsstrategie vorgenommen, darunter<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Verl\u00e4ngerung der Trainingszeit des ImageNet-Datensatzes, um die F\u00e4higkeiten des Modells zum Bildverst\u00e4ndnis zu verbessern.<\/li>\n\n\n\n<li>Durch das Training von Text-zu-Bild-Daten wird die generative F\u00e4higkeit des Modells optimiert.<\/li>\n\n\n\n<li>Die Anpassung des Anteils der Trainingsdaten sorgt f\u00fcr eine stabilere und effizientere Leistung des Modells bei multimodalen Aufgaben.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Expanded_training_data\"><\/span>Erweiterte Trainingsdaten<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro verwendet umfangreiche und vielf\u00e4ltige Trainingsdaten, einschlie\u00dflich multimodaler Verst\u00e4ndnisdaten und visueller Generierungsdaten. Die Erweiterung dieser Daten verbessert nicht nur die Verst\u00e4ndnisf\u00e4higkeit des Modells, sondern erh\u00f6ht auch seine generative Qualit\u00e4t.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Innovative_visual_encoder\"><\/span>Innovativer visueller Encoder<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>F\u00fcr multimodale Verst\u00e4ndnisaufgaben verwendet Janus Pro SigLIP-L als visuellen Encoder, der Bildeingaben mit einer Aufl\u00f6sung von bis zu 384\u00d7384 unterst\u00fctzt. Diese hohe Aufl\u00f6sung erm\u00f6glicht es dem Modell, mehr Bilddetails zu erfassen und dadurch die Genauigkeit des visuellen Verst\u00e4ndnisses zu verbessern.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"High-performance_generative_module\"><\/span>Leistungsstarkes generatives Modul<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>F\u00fcr Bilderzeugungsaufgaben verwendet Janus Pro den LlamaGen Tokenizer mit einer Downsampling-Rate von 16, um detailliertere Bilder zu erzeugen. Dieses Design macht die erzeugten Bilder realistischer und detaillierter.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Infrastructure_innovations\"><\/span>Infrastruktur-Innovationen<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro basiert auf den Modellen DeepSeek-LLM-1.5b und DeepSeek-LLM-7b, die das Modell mit leistungsstarken multimodalen Verarbeitungsf\u00e4higkeiten ausstatten, wodurch es sich bei multimodalen Verst\u00e4ndnis- und Generierungsaufgaben auszeichnet.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multi-modal_understanding_and_generation_capabilities\"><\/span>Multimodale Verst\u00e4ndnis- und Generierungsf\u00e4higkeiten<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro ist nicht nur in der Lage, multimodale Verstehensaufgaben zu bew\u00e4ltigen (z. B. die Beantwortung visueller Fragen und die Beschriftung von Bildern), sondern auch qualitativ hochwertige Bilder aus Textbeschreibungen zu erzeugen. Diese F\u00e4higkeit zeichnet es in multimodalen Szenarien aus.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"976\" height=\"845\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png\" alt=\"\" class=\"wp-image-703\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png 976w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-300x260.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-768x665.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-14x12.png 14w\" sizes=\"auto, (max-width: 976px) 100vw, 976px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeek_performance\"><\/span>Janus Pro DeepSeek-Leistung<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Das Janus-Pro-Modell von DeepSeek zeichnet sich bei multimodalen Verst\u00e4ndnis- und Generierungsaufgaben aus. Es folgt eine detaillierte Analyse seiner Leistung:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multimodal_understanding_performance\"><\/span>Multimodale Verstehensleistung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- MMBench-Benchmark: Janus-Pro-7B erreichte im MMBench-Benchmark f\u00fcr multimodales Verstehen eine Punktzahl von 79,2 und \u00fcbertraf damit die bestehenden, auf dem neuesten Stand der Technik befindlichen vereinheitlichten multimodalen Modelle wie Janus (69,4), TokenFlow (68,9) und MetaMorph (75,2).<\/p>\n\n\n\n<p>- Beantwortung visueller Fragen: Die Genauigkeit des Janus-Pro bei der Beantwortung visueller Fragen \u00fcbertrifft die des GPT-4V, indem es Details in Bildern genau identifiziert und entsprechende Fragen beantwortet.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_command_tracking\"><\/span>Text-zu-Bild-Befehlsverfolgung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- GenEval-Benchmark-Test: Janus-Pro-7B erreichte im GenEval-Test eine Gesamtgenauigkeit von 80% und \u00fcbertraf damit andere Modelle wie DALL-E 3 (67%) und Stable Diffusion 3 Medium (74%) deutlich.<\/p>\n\n\n\n<p>Komplexe Befehle verstehen: Im DPG-Bench-Test erzielte der Janus-Pro-7B hervorragende 84,19 Punkte und war in der Lage, komplexe Szenen wie \"einen schneebedeckten Berg mit einem blauen See an der Spitze\" korrekt zu erzeugen.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_generation_performance\"><\/span>Leistung der Text-zu-Bild-Generierung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Bildqualit\u00e4t und Stabilit\u00e4t: Trotz einer Ausgabeaufl\u00f6sung von 384\u00d7384 weisen die vom Janus-Pro-7B erzeugten Bilder einen hohen Grad an Realismus und Detailreichtum auf, insbesondere bei der Verarbeitung fantasievoller und kreativer Szenen. Es kann die semantischen Informationen in den eingegebenen W\u00f6rtern genau verstehen und logisch sinnvolle und koh\u00e4rente Bilder erzeugen.<\/p>\n\n\n\n<p>- Erzeugungsgeschwindigkeit: Janus-Pro unterst\u00fctzt die Erzeugung von 4K-Bildern auf einer einzigen Karte, was 2 Mal schneller ist als Stable Diffusion 3.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_architecture_and_training\"><\/span>Modellarchitektur und Schulung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Entkopplung der visuellen Kodierung: Janus-Pro verwendet eine unabh\u00e4ngige Kodierungsmethode, um die urspr\u00fcngliche Eingabe in Merkmale umzuwandeln, die dann von einem vereinheitlichten autoregressiven Transformator verarbeitet werden, um die Entkopplung der visuellen Kodierung bei multimodalen Verstehens- und Generierungsaufgaben zu erreichen.<\/p>\n\n\n\n<p>- Trainingsdaten: Janus-Pro bezieht 72 Millionen hochwertige synthetische Bilder in das Training ein, um ein 1:1-Verh\u00e4ltnis von realen zu synthetischen Daten zu gew\u00e4hrleisten. Dar\u00fcber hinaus werden etwa 90 Millionen Samples multimodaler Verst\u00e4ndnis-Trainingsdaten hinzugef\u00fcgt, was die Modellleistung erheblich verbessert.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Scalability_and_deployment\"><\/span>Skalierbarkeit und Einsatz<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Modellgr\u00f6\u00dfe: Die Janus-Pro-Serie bietet Modelle mit den Parametergr\u00f6\u00dfen 1B und 7B, die sowohl die Leistung als auch die Rechenkosten ber\u00fccksichtigen und f\u00fcr mehr Anwendungsf\u00e4lle geeignet sind.<\/p>\n\n\n\n<p>Minimaler Einsatz: Janus-Pro wird unter der MIT-Lizenz ver\u00f6ffentlicht, unterst\u00fctzt die kommerzielle Nutzung und bietet zwei Versionen: 1.5B (erfordert 16 GB VRAM) und 7B (erfordert 24 GB VRAM), die auf Standard-GPUs laufen k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Practical_application_scenarios_of_Janus_Pro_DeepSeek\"><\/span>Praktische Anwendungsszenarien von Janus Pro DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Multimodale KI-Modelle, insbesondere Text-Bild-Modelle, haben ein gro\u00dfes Entwicklungspotenzial f\u00fcr den kommerziellen Sektor. Nach einer langen Entwicklungszeit haben KI-Text-Bild-Modelle bereits gro\u00dfe Fortschritte gemacht<\/p>\n\n\n\n<p>Im h\u00e4ufigsten Szenario der Werbe- oder Plakatgestaltung k\u00f6nnen Designer oder Benutzer Janus pro verwenden, um eine Textbeschreibung einzugeben und schnell qualitativ hochwertige Plakate zu erstellen. Durch die Iteration von Plakatprototypen k\u00f6nnen sie Designzeit sparen und die kreative Effizienz verbessern. Dies kann die Effizienz von Designern erheblich steigern, so dass sie ihre Zeit mit wichtigeren Dingen verbringen k\u00f6nnen<\/p>\n\n\n\n<p>Neben dem traditionellen Plakat- oder Werbedesign kann das ai-Gro\u00dfmodell den Designern auch dabei helfen, Spielszenen, Charaktere und Gegenst\u00e4nde in Echtzeit zu generieren, was die Kosten und den Schwierigkeitsgrad der Entwicklung reduziert und gleichzeitig die visuellen Effekte des Spiels verbessert. Wir glauben, dass das ai-Gro\u00dfmodell auch weiterhin das Potenzial und die Fantasie von Designern freisetzen und interessantere Produkte realisieren kann.<\/p>\n\n\n\n<p>Neben dem Bereich des Designs wird sich das multimodale Modell auch in anderen Bereichen des Lernens, der Bildung und im vertikalen Berufsfeld der Medizin stark entwickeln.<\/p>\n\n\n\n<p>In Zukunft k\u00f6nnten weitere sehr interessante Anwendungen entstehen, die die Effizienz und die Qualit\u00e4t unseres Lebens erheblich verbessern k\u00f6nnen.<\/p>\n\n\n\n<p>Die Open-Source-Funktionen von Janus-Pro (MIT-Lizenz) und die minimalen Implementierungsmethoden (unterst\u00fctzt die Ausf\u00fchrung auf Standard-GPUs) senken die Einstiegsh\u00fcrde weiter, so dass es in den oben genannten Bereichen weit verbreitet ist.<\/p>\n\n\n\n<p>Dadurch k\u00f6nnen sich mehr Nutzer an der Entwicklung beteiligen, so dass mehr Menschen diese Funktionen verbessern und die M\u00f6glichkeiten der gesamten Gemeinschaft erweitern k\u00f6nnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\"><\/span>Wie w\u00e4hle ich die richtige Version von Janus Pro DeepSeek f\u00fcr mich aus?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro ist in zwei Versionen verf\u00fcgbar: Janus-Pro-1B und Janus-Pro-7B. F\u00fcr welche Version Sie sich entscheiden, h\u00e4ngt von Ihren spezifischen Bed\u00fcrfnissen, Computerressourcen und Anwendungsszenarien ab. Im Folgenden finden Sie einen detaillierten Vergleich und Empfehlungen:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Applicable_scenarios\"><\/span>Anwendbare Szenarien<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Leichtgewichtige Anwendungen: geeignet f\u00fcr den Einsatz auf mobilen Ger\u00e4ten, in Browsern oder in Umgebungen mit eingeschr\u00e4nkten Ressourcen. So k\u00f6nnen mehr Nutzer das neueste Janus pro erleben.<\/p>\n\n\n\n<p>- Schnelles Prototyping: geeignet f\u00fcr die schnelle Entwicklung und Pr\u00fcfung multimodaler Funktionen, ohne dass gro\u00dfe Rechenressourcen erforderlich sind. Dies ist sehr wichtig f\u00fcr KI-Enthusiasten, die schnell iterieren und Probleme, die in der Forschung aufgetreten sind, entdecken k\u00f6nnen, ohne dass sie viele Computerressourcen ben\u00f6tigen.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Hochwertige Bilderzeugung: Geeignet f\u00fcr Anwendungen, die die Erzeugung hochwertiger Bilder von komplexen Szenen erfordern, wie z. B. Werbedesign, Spieleentwicklung und k\u00fcnstlerische Gestaltung. Dieses Modell eignet sich besser f\u00fcr professionellere Design-Szenarien, die leistungsf\u00e4higere Hardware und mehr Rechenleistung erfordern.<\/p>\n\n\n\n<p>- Komplexes Anweisungsverst\u00e4ndnis: geeignet f\u00fcr Szenarien, in denen komplexe Textanweisungen verarbeitet und pr\u00e4zise Bilder erzeugt werden m\u00fcssen, z. B. in der virtuellen Realit\u00e4t (VR) und der erweiterten Realit\u00e4t (AR)<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Deployment_requirements\"><\/span>Anforderungen f\u00fcr den Einsatz<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Hardware-Anforderungen: Geeignet f\u00fcr die Ausf\u00fchrung auf ressourcenbeschr\u00e4nkten Ger\u00e4ten, wie z. B. GPUs, die 16 GB VRAM ben\u00f6tigen. Wenn Sie nur eine \u00e4ltere Grafikkarte haben, ist dies m\u00f6glicherweise besser f\u00fcr Sie geeignet<\/p>\n\n\n\n<p>- Anwendungsszenario: geeignet f\u00fcr die Ausf\u00fchrung im Browser oder die Bereitstellung auf leichten Ger\u00e4ten.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Hardware-Anforderungen: Erfordert h\u00f6here Rechenressourcen, z. B. einen Grafikprozessor mit 24 GB VRAM. Dies ist eher f\u00fcr Benutzer mit neueren Grafikkarten geeignet.<\/p>\n\n\n\n<p>- Anwendungsszenario: geeignet f\u00fcr die Ausf\u00fchrung auf Standard-GPUs und f\u00fcr Szenarien, die eine hohe Leistung erfordern.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Summary\"><\/span>Zusammenfassung<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Wenn Ihr Anwendungsszenario eine hohe Bildqualit\u00e4t und ein komplexes Befehlsverst\u00e4ndnis erfordert und Sie \u00fcber ausreichende Rechenressourcen verf\u00fcgen, empfehlen wir Janus-Pro-7B.<\/p>\n\n\n\n<p>Wenn Sie eine einfache Bereitstellung ben\u00f6tigen oder nur \u00fcber begrenzte Computerressourcen verf\u00fcgen, empfehlen wir Janus-Pro-1B.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Community_support_and_resources\"><\/span>Unterst\u00fctzung und Ressourcen der Gemeinschaft<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>DeepSeek bietet Entwicklern eine F\u00fclle von Ressourcen und Unterst\u00fctzung:<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>Die offizielle Dokumentation enth\u00e4lt detaillierte Beschreibungen der API-Schnittstelle und technische Leitf\u00e4den, einschlie\u00dflich der Feinabstimmung von Modellen, Anleitungen zur Bereitstellung und anderen Inhalten.<\/li>\n\n\n\n<li>Die Entwicklergemeinschaft bietet Foren und Diskussionsgruppen, um den Erfahrungsaustausch unter den Entwicklern zu erleichtern. Es finden regelm\u00e4\u00dfig technische Sitzungen und Hackathons statt.<\/li>\n\n\n\n<li>Der technische Support bietet professionelle technische Unterst\u00fctzung bei der L\u00f6sung von Problemen, die bei der Nutzung auftreten.<\/li>\n<\/ol>","protected":false},"excerpt":{"rendered":"<p>Das kosteng\u00fcnstige und leistungsstarke Open-Source-Modell von deepseek hat sich wie ein Virus verbreitet. Zahlreiche neue Nutzer haben sich auf der deepseek-Website registriert, was wiederholt zum Absturz der Website gef\u00fchrt hat. Mit der rasanten Entwicklung der Technologie der k\u00fcnstlichen Intelligenz ver\u00e4ndern gro\u00dfe Sprachmodelle (LLMs) jeden Aspekt unserer Arbeit und unseres Lebens. Aber es hat auch viele...<\/p>","protected":false},"author":2,"featured_media":704,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-698","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/698","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/comments?post=698"}],"version-history":[{"count":2,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/698\/revisions"}],"predecessor-version":[{"id":706,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/698\/revisions\/706"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media\/704"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media?parent=698"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/categories?post=698"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/tags?post=698"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}