{"id":847,"date":"2025-02-04T16:27:27","date_gmt":"2025-02-04T16:27:27","guid":{"rendered":"https:\/\/janusai.pro\/?p=847"},"modified":"2025-02-04T16:27:28","modified_gmt":"2025-02-04T16:27:28","slug":"how-good-is-deepseeks-janus-pro","status":"publish","type":"post","link":"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/","title":{"rendered":"Wie gut ist der Janus-Pro von DeepSeek?"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p>Am Vorabend des Fr\u00fchlingsfestes wurde das Modell DeepSeek-R1 ver\u00f6ffentlicht. Mit seiner reinen RL-Architektur hat es von den gro\u00dfen Innovationen von CoT gelernt und \u00fcbertrifft <a href=\"https:\/\/openai.com\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">ChatGPT<\/a> in Mathematik, Code und logischem Denken.<\/p>\n\n\n\n<p>Dar\u00fcber hinaus haben die Open-Source-Modellgewichte, die niedrigen Trainingskosten und die g\u00fcnstigen API-Preise DeepSeek zu einem Hit im Internet gemacht, der sogar die Aktienkurse von NVIDIA und ASML zeitweise in den Keller gehen lie\u00df.<\/p>\n\n\n\n<p>DeepSeek hat au\u00dferdem eine aktualisierte Version des multimodalen Gro\u00dfmodells Janus (Janus), Janus-Pro, ver\u00f6ffentlicht, die die einheitliche Architektur der vorherigen Generation des multimodalen Verstehens und Erzeugens \u00fcbernimmt und die Trainingsstrategie optimiert, indem sie die Trainingsdaten und die Modellgr\u00f6\u00dfe skaliert und so eine h\u00f6here Leistung erzielt.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"427\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02.png\" alt=\"\" class=\"wp-image-850\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-300x119.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-1024x405.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-768x304.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-18x7.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"522\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481.png\" alt=\"\" class=\"wp-image-854\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-300x145.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-1024x495.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-768x371.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-18x9.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Inhalts\u00fcbersicht<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Inhaltsverzeichnis umschalten\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Umschalten auf<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Janus-Pro\" >Janus-Pro<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Model_architecture\" >Modell der Architektur<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Training_strategy\" >Ausbildungsstrategie<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Training_data_scaling\" >Skalierung der Trainingsdaten<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Model_scaling\" >Skalierung der Modelle<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/de\/how-good-is-deepseeks-janus-pro\/#Model_evaluation\" >Bewertung des Modells<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus-Pro\"><\/span>Janus-Pro<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus-Pro<\/a> ist ein einheitliches multimodales Sprachmodell (MLLM), das gleichzeitig multimodale Verstehens- und Generierungsaufgaben bearbeiten kann, d.h. es kann den Inhalt eines Bildes verstehen und auch Text generieren.<\/p>\n\n\n\n<p>Es entkoppelt die visuellen Kodierer f\u00fcr multimodales Verstehen und Generieren (d.h. f\u00fcr den Input des Bildverstehens und den Input und Output der Bilderzeugung werden unterschiedliche Tokenizer verwendet) und verarbeitet sie mit einem einheitlichen autoregressiven Transformator.<\/p>\n\n\n\n<p>Als fortschrittliches multimodales Verstehens- und Generierungsmodell ist es eine verbesserte Version des fr\u00fcheren Janus-Modells.<\/p>\n\n\n\n<p>In der r\u00f6mischen Mythologie ist Janus (Janus) ein zweigesichtiger Schutzgott, der Widerspruch und \u00dcbergang symbolisiert. Er hat zwei Gesichter, was auch darauf hindeutet, dass das Janus-Modell Bilder verstehen und erzeugen kann, was sehr passend ist. Was genau hat PRO also verbessert?<\/p>\n\n\n\n<p>Janus, als kleines Modell von 1.3B, ist eher eine Vorabversion als eine offizielle Version. Es erforscht das einheitliche multimodale Verstehen und Erzeugen, hat aber viele Probleme, wie instabile Bilderzeugungseffekte, gro\u00dfe Abweichungen von den Benutzeranweisungen und unzureichende Details.<\/p>\n\n\n\n<p>Die Pro-Version optimiert die Trainingsstrategie, vergr\u00f6\u00dfert den Trainingsdatensatz und bietet ein gr\u00f6\u00dferes Modell (7B) zur Auswahl, w\u00e4hrend ein 1B-Modell bereitgestellt wird.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_architecture\"><\/span>Modell der Architektur<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Jaus-Pro und Janus<\/a> sind identisch in Bezug auf die Modellarchitektur. (Nur 1.3B! Janus vereinigt multimodales Verstehen und Generieren)<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"571\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006.png\" alt=\"\" class=\"wp-image-851\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-300x159.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-1024x541.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-768x406.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-18x10.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>Das zentrale Konstruktionsprinzip ist die Entkopplung der visuellen Kodierung, um multimodales Verstehen und Generieren zu unterst\u00fctzen. Janus-Pro kodiert die urspr\u00fcngliche Bild-\/Texteingabe separat, extrahiert hochdimensionale Merkmale und verarbeitet sie durch einen vereinheitlichten autoregressiven Transformator.<\/p>\n\n\n\n<p>Beim multimodalen Bildverst\u00e4ndnis wird SigLIP zur Kodierung von Bildmerkmalen verwendet (blauer Kodierer in der Abbildung oben), und bei der Generierungsaufgabe wird der VQ-Tokenizer zur Diskretisierung des Bildes verwendet (gelber Kodierer in der Abbildung oben). Schlie\u00dflich werden alle Merkmalssequenzen zur Verarbeitung in den LLM eingegeben<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Training_strategy\"><\/span>Ausbildungsstrategie<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Was die Trainingsstrategie betrifft, so hat Janus-Pro weitere Verbesserungen vorgenommen. Die alte Version von Janus verwendete eine dreistufige Trainingsstrategie, bei der in Stufe I der Eingabeadapter und der Bilderzeugungskopf f\u00fcr das Bildverst\u00e4ndnis und die Bilderzeugung trainiert werden, in Stufe II ein einheitliches Vortraining durchgef\u00fchrt wird und in Stufe III eine Feinabstimmung des Verst\u00e4ndnis-Encoders auf dieser Grundlage erfolgt. (Die Janus-Trainingsstrategie ist in der Abbildung unten dargestellt).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"381\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a.png\" alt=\"\" class=\"wp-image-849\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-300x106.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-1024x361.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-768x271.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-18x6.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>Bei dieser Strategie wird jedoch die PixArt-Methode verwendet, um das Training der Text-Bild-Erzeugung in Phase II aufzuteilen, was zu einer geringen Recheneffizienz f\u00fchrt.<\/p>\n\n\n\n<p>Zu diesem Zweck verl\u00e4ngerten wir die Trainingszeit von Phase I und f\u00fcgten ein Training mit ImageNet-Daten hinzu, so dass das Modell Pixelabh\u00e4ngigkeiten mit festen LLM-Parametern effektiv modellieren kann. In Phase II haben wir die ImageNet-Daten verworfen und direkt Text-Bild-Paar-Daten zum Training verwendet, was die Trainingseffizienz verbessert. Dar\u00fcber hinaus haben wir das Datenverh\u00e4ltnis in Phase III (multimodale:reine Textdaten:visuell-semantische Graphdaten von 7:3:10 auf 5:1:4) angepasst, um das multimodale Verst\u00e4ndnis zu verbessern und gleichzeitig die visuellen Generierungsf\u00e4higkeiten zu erhalten.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Training_data_scaling\"><\/span>Skalierung der Trainingsdaten<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro skaliert auch die Trainingsdaten von Janus in Bezug auf multimodales Verstehen und visuelle Erzeugung.<\/p>\n\n\n\n<p>Multimodales Verstehen: Die Pre-Trainingsdaten der Stufe II basieren auf DeepSeek-VL2 und umfassen etwa 90 Millionen neue Samples, darunter Bildbeschriftungsdaten (wie YFCC) und Daten zum Verst\u00e4ndnis von Tabellen, Diagrammen und Dokumenten (wie Docmatix).<\/p>\n\n\n\n<p>In der \u00fcberwachten Feinabstimmungsphase der Stufe III werden MEME-Verst\u00e4ndnis, chinesische Dialogdaten usw. eingef\u00fchrt, um die Leistung des Modells bei der Multi-Task-Verarbeitung und den Dialogf\u00e4higkeiten zu verbessern.<\/p>\n\n\n\n<p>Visuelle Erzeugung: In fr\u00fcheren Versionen wurden reale Daten von geringer Qualit\u00e4t und starkem Rauschen verwendet, was die Stabilit\u00e4t und \u00c4sthetik der textgenerierten Bilder beeintr\u00e4chtigte.<\/p>\n\n\n\n<p>Janus-Pro f\u00fchrt etwa 72 Millionen synthetische \u00e4sthetische Daten ein, wodurch das Verh\u00e4ltnis von realen zu synthetischen Daten 1:1 betr\u00e4gt. Experimente haben gezeigt, dass synthetische Daten die Modellkonvergenz beschleunigen und die Stabilit\u00e4t und \u00e4sthetische Qualit\u00e4t der erzeugten Bilder erheblich verbessern.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_scaling\"><\/span>Skalierung der Modelle<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus Pro erweitert die Modellgr\u00f6\u00dfe auf 7B, w\u00e4hrend die vorherige Version von Janus 1,5B DeepSeek-LLM verwendete, um die Wirksamkeit der Entkopplung der visuellen Kodierung zu \u00fcberpr\u00fcfen. Experimente zeigen, dass eine gr\u00f6\u00dfere LLM die Konvergenz von multimodalem Verstehen und visueller Generierung signifikant beschleunigt, was die starke Skalierbarkeit der Methode weiter verifiziert.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"864\" height=\"352\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b.png\" alt=\"\" class=\"wp-image-848\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b.png 864w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-300x122.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-768x313.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-18x7.png 18w\" sizes=\"auto, (max-width: 864px) 100vw, 864px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"536\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba.png\" alt=\"\" class=\"wp-image-852\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-300x149.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-1024x508.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-768x381.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-18x9.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>Das Experiment verwendet DeepSeek-LLM (1.5B und 7B, unterst\u00fctzt eine maximale Sequenz von 4096) als grundlegendes Sprachmodell. F\u00fcr die multimodale Verstehensaufgabe wird SigLIP-Large-Patch16-384 als visueller Kodierer verwendet, die W\u00f6rterbuchgr\u00f6\u00dfe des Kodierers betr\u00e4gt 16384, das Bild-Downsampling-Multiple ist 16, und sowohl der Verstehens- als auch der Generierungsadapter sind zweischichtige MLPs.<\/p>\n\n\n\n<p>Beim Training der Stufe II wird eine 270K-Fr\u00fchstoppstrategie verwendet, alle Bilder werden einheitlich auf eine Aufl\u00f6sung von 384\u00d7384 eingestellt, und die Sequenzpackung wird zur Verbesserung der Trainingseffizienz verwendet. Janus-Pro wird mit HAI-LLM trainiert und bewertet. Die Versionen 1.5B\/7B wurden auf 16\/32 Knoten (8\u00d7Nvidia A100 40GB pro Knoten) jeweils 9\/14 Tage lang trainiert.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_evaluation\"><\/span>Bewertung des Modells<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro wurde separat f\u00fcr das multimodale Verstehen und die Generierung bewertet. Insgesamt mag das Verstehen etwas schwach sein, aber es wird unter den Open-Source-Modellen derselben Gr\u00f6\u00dfe als ausgezeichnet angesehen (vermutlich ist es weitgehend durch die feste Eingabeaufl\u00f6sung und die OCR-F\u00e4higkeiten begrenzt).<\/p>\n\n\n\n<p>Im MMBench-Benchmark-Test erzielte der Janus-Pro-7B 79,2 Punkte, was in etwa dem Niveau von Open-Source-Modellen der ersten Reihe entspricht (die gleiche Gr\u00f6\u00dfe von InternVL2.5 und Qwen2-VL liegt bei 82 Punkten). Dennoch ist dies eine gute Verbesserung gegen\u00fcber der vorherigen Generation von Janus.<\/p>\n\n\n\n<p>Bei der Bilderzeugung ist die Verbesserung gegen\u00fcber der Vorg\u00e4ngergeneration sogar noch deutlicher und gilt als ausgezeichnetes Niveau unter den Open-Source-Modellen. Die Punktzahl von Janus-Pro im GenEval-Benchmark-Test (0,80) \u00fcbertrifft auch Modelle wie DALL-E 3 (0,67) und Stable Diffusion 3 Medium (0,74).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"827\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349.png\" alt=\"\" class=\"wp-image-853\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-300x230.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-1024x784.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-768x588.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-16x12.png 16w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"744\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55.png\" alt=\"\" class=\"wp-image-855\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-300x207.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-1024x705.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-768x529.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-18x12.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>","protected":false},"excerpt":{"rendered":"<p>Am Vorabend des Fr\u00fchlingsfestes wurde das Modell DeepSeek-R1 ver\u00f6ffentlicht. Mit seiner reinen RL-Architektur hat es von den gro\u00dfen Innovationen von CoT gelernt und \u00fcbertrifft ChatGPT in Mathematik, Code und logischem Denken. Dar\u00fcber hinaus haben die Open-Source-Modellgewichte, die niedrigen Trainingskosten und die g\u00fcnstigen API-Preise DeepSeek zu einem Hit im Internet gemacht, sogar...<\/p>","protected":false},"author":2,"featured_media":704,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-847","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/847","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/comments?post=847"}],"version-history":[{"count":1,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/847\/revisions"}],"predecessor-version":[{"id":856,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/posts\/847\/revisions\/856"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media\/704"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/media?parent=847"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/categories?post=847"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/de\/wp-json\/wp\/v2\/tags?post=847"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}