{"id":574,"date":"2025-01-28T07:03:48","date_gmt":"2025-01-28T07:03:48","guid":{"rendered":"https:\/\/janusai.pro\/?p=574"},"modified":"2025-01-28T08:08:08","modified_gmt":"2025-01-28T08:08:08","slug":"released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut","status":"publish","type":"post","link":"https:\/\/janusai.pro\/es\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/","title":{"rendered":"Lanzamiento nocturno DeepSeek redefine la generaci\u00f3n y comprensi\u00f3n de im\u00e1genes mediante IA con el debut del innovador modelo integral Janus-Pro."},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"915\" height=\"564\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2.png\" alt=\"\" class=\"wp-image-580\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2.png 915w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-300x185.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-768x473.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-2-18x12.png 18w\" sizes=\"auto, (max-width: 915px) 100vw, 915px\" \/><\/figure>\n\n\n\n<p><strong>Aspectos m\u00e1s destacados<\/strong><br>\ud83d\udd39&nbsp;<strong>Arquitectura unificada de transformadores<\/strong>: Un \u00fanico modelo se encarga de la comprensi\u00f3n de las im\u00e1genes&nbsp;<em>y<\/em>&nbsp;eliminando la necesidad de sistemas separados.<br>\ud83d\udd39&nbsp;<strong>Escalable y de c\u00f3digo abierto<\/strong>: Disponible en&nbsp;<strong>1B<\/strong>&nbsp;y&nbsp;<strong>7B<\/strong>&nbsp;versiones param\u00e9tricas (con licencia MIT), optimizadas para diversas aplicaciones y uso comercial.<br>\ud83d\udd39&nbsp;<strong>Rendimiento de vanguardia<\/strong>: Supera a DALL-E 3 de OpenAI y a Stable Diffusion en pruebas como GenEval y DPG-Bench.<br>\ud83d\udd39&nbsp;<strong>Implantaci\u00f3n simplificada<\/strong>: La arquitectura racionalizada reduce los costes de formaci\u00f3n\/informaci\u00f3n al tiempo que mantiene la flexibilidad.<\/p>\n\n\n\n<p><strong>Enlaces de modelos<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Janus-Pro-7B<\/strong>:&nbsp;<a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">HuggingFace<\/a><\/li>\n\n\n\n<li><strong>Janus-Pro-1B<\/strong>:&nbsp;<a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-1B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">HuggingFace<\/a><\/li>\n\n\n\n<li><strong>GitHub<\/strong>:&nbsp;<a href=\"https:\/\/github.com\/deepseek-ai\/Janus\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">C\u00f3digo y documentos<\/a><\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/es\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Why_Janus-Pro_Stands_Out\" >Por qu\u00e9 destaca Janus-Pro<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/es\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Benchmark_Dominance\" >Dominio de las referencias<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/es\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Technical_Breakdown\" >Desglose t\u00e9cnico<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/es\/released-late-at-night-deepseek-redefines-ai-image-generation-and-understanding-as-the-groundbreaking-janus-pro-comprehensive-model-makes-its-debut\/#Community_Buzz\" >Comunidad<\/a><\/li><\/ul><\/nav><\/div>\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Why_Janus-Pro_Stands_Out\"><\/span><strong>Por qu\u00e9 destaca Janus-Pro<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>1. Dos superpoderes en un solo modelo<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Entender el modo<\/strong>: Utiliza&nbsp;<strong>SigLIP-L<\/strong>&nbsp;(las \"supergafas\") para analizar im\u00e1genes (de hasta 384\u00d7384) y texto.<\/li>\n\n\n\n<li><strong>Modo de generaci\u00f3n<\/strong>: Aprovecha&nbsp;<strong>Flujo rectificado<\/strong>&nbsp;+&nbsp;<strong>SDXL-VAE<\/strong>&nbsp;(el \"pincel m\u00e1gico\") para crear im\u00e1genes de alta calidad.<\/li>\n<\/ul>\n\n\n\n<p><strong>2. Cerebro y formaci\u00f3n<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>LLM b\u00e1sico<\/strong>: Construido sobre el potente modelo de lenguaje de DeepSeek (1,5B\/7B par\u00e1metros), destacando en el razonamiento contextual.<\/li>\n\n\n\n<li><strong>Formaci\u00f3n<\/strong>: Preentrenamiento en conjuntos de datos masivos \u2192 Ajuste fino supervisado \u2192 Optimizaci\u00f3n EMA para obtener el m\u00e1ximo rendimiento.<\/li>\n<\/ul>\n\n\n\n<p><strong>3. \u00bfPor qu\u00e9 sobredifusi\u00f3n en el transformador?<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Versatilidad de tareas<\/strong>: Prioriza la comprensi\u00f3n unificada + la generaci\u00f3n, mientras que los modelos de difusi\u00f3n se centran \u00fanicamente en la calidad de la imagen.<\/li>\n\n\n\n<li><strong>Eficacia<\/strong>: Generaci\u00f3n autorregresiva (un solo paso) frente a la eliminaci\u00f3n de ruido iterativa de la difusi\u00f3n (por ejemplo, 20 pasos para la difusi\u00f3n estable).<\/li>\n\n\n\n<li><strong>Relaci\u00f3n coste-eficacia<\/strong>: Una \u00fanica red troncal Transformer simplifica la formaci\u00f3n y el despliegue.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"955\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-1024x955.jpeg\" alt=\"\" class=\"wp-image-578\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-1024x955.jpeg 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-300x280.jpeg 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-768x716.jpeg 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4-13x12.jpeg 13w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/b84eb858a5b578c05460fcee5e528fd4.jpeg 1080w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Benchmark_Dominance\"><\/span><strong>Dominio de las referencias<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>\ud83d\udcca Comprensi\u00f3n multimodal<\/strong><br>Janus-Pro-7B supera a los modelos especializados (por ejemplo, LLaVA) en cuatro pruebas de referencia clave, escalando suavemente con el tama\u00f1o de los par\u00e1metros.<\/p>\n\n\n\n<p><strong>\ud83c\udfa8 Generaci\u00f3n de texto a imagen<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>GenEval<\/strong>: Coincide con SDXL y DALL-E 3.<\/li>\n\n\n\n<li><strong>DPG-Bench<\/strong>:&nbsp;<strong>84.2% precisi\u00f3n<\/strong>&nbsp;(Janus-Pro-7B), superando a todos los competidores.<\/li>\n<\/ul>\n\n\n\n<p><strong>Pruebas en el mundo real<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Velocidad<\/strong>: ~15 segundos\/imagen (GPU L4, 22GB VRAM).<\/li>\n\n\n\n<li><strong>Calidad<\/strong>: Cumplimiento estricto de los plazos, aunque hay que pulir peque\u00f1os detalles.<\/li>\n\n\n\n<li><strong>Demostraci\u00f3n Colab<\/strong>:&nbsp;<a href=\"https:\/\/colab.research.google.com\/drive\/1V3bH2oxhikj_B_EYy5yRG_9yqSqxxqgS?usp=sharing\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Prueba Janus-Pro-7B<\/a>&nbsp;(Se requiere nivel Pro).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Technical_Breakdown\"><\/span><strong>Desglose t\u00e9cnico<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Arquitectura<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"376\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-1024x376.png\" alt=\"\" class=\"wp-image-579\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-1024x376.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-300x110.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-768x282.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640-18x7.png 18w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/640.png 1080w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Comprender el camino<\/strong>: Imagen limpia \u2192 Codificador SigLIP-L \u2192 LLM \u2192 Respuesta de texto.<\/li>\n\n\n\n<li><strong>Ruta de generaci\u00f3n<\/strong>: Imagen ruidosa \u2192 Decodificador de flujo rectificado + LLM \u2192 Eliminaci\u00f3n de ruido iterativa.<\/li>\n<\/ul>\n\n\n\n<p><strong>Innovaciones clave<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Codificaci\u00f3n visual desacoplada<\/strong>: Las v\u00edas separadas para la comprensi\u00f3n\/generaci\u00f3n evitan el \"conflicto de roles\" en los m\u00f3dulos de visi\u00f3n.<\/li>\n\n\n\n<li><strong>N\u00facleo de transformador compartido<\/strong>: Permite la transferencia de conocimientos entre tareas (por ejemplo, el aprendizaje de los conceptos de \"gato\" ayuda tanto al reconocimiento como al dibujo).<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Community_Buzz\"><\/span><strong>Comunidad<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>AK (Investigador de IA)<\/strong>:&nbsp;<em>\"La sencillez y flexibilidad de Janus-Pro lo convierten en un candidato ideal para los sistemas multimodales de nueva generaci\u00f3n. Al desacoplar las v\u00edas de visi\u00f3n y mantener un Transformer unificado, equilibra la especializaci\u00f3n con la generalizaci\u00f3n, algo poco frecuente\".<\/em><\/p>\n<\/blockquote>\n\n\n\n<p><strong>Por qu\u00e9 es importante la licencia MIT<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Libertad<\/strong>: Utilizar, modificar y distribuir comercialmente con restricciones m\u00ednimas.<\/li>\n\n\n\n<li><strong>Transparencia<\/strong>: El acceso total al c\u00f3digo acelera las mejoras impulsadas por la comunidad.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p><strong>Conclusi\u00f3n<\/strong><br>Janus-Pro de DeepSeek no es s\u00f3lo otro modelo de IA: es un cambio de paradigma. Al unificar la comprensi\u00f3n y la generaci\u00f3n bajo un mismo techo, abre las puertas a herramientas creativas m\u00e1s inteligentes, aplicaciones en tiempo real y despliegues rentables. Con acceso a c\u00f3digo abierto y licencia del MIT, podr\u00eda ser el catalizador de la pr\u00f3xima ola de innovaci\u00f3n multimodal. \ud83d\ude80<\/p>\n\n\n\n<p><em>Para desarrolladores: Echa un vistazo a la&nbsp;<a href=\"https:\/\/github.com\/deepseek-ai\/Janus\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Nodos ComfyUI<\/a>&nbsp;\u00a1y \u00fanete a la ola de la experimentaci\u00f3n!<\/em><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p>este post est\u00e1 patrocinado por:<\/p>\n\n\n\n<a href=\"https:\/\/dang.ai\/\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/cdn.prod.website-files.com\/63d8afd87da01fb58ea3fbcb\/6487e2868c6c8f93b4828827_dang-badge.png\" alt=\"Dang.ai\" style=\"width: 150px; height: 54px;\" width=\"150\" height=\"54\"\/><\/a>\n\n\n\n<p><a href=\"https:\/\/dang.ai\/\" target=\"_blank\" rel=\"noreferrer noopener\"><\/a><\/p>\n\n\n\n<p><\/p>","protected":false},"excerpt":{"rendered":"<p>Principales caracter\u00edsticas\ud83d\udd39 Arquitectura de transformador unificada: Un \u00fanico modelo gestiona tanto la comprensi\u00f3n como la generaci\u00f3n de im\u00e1genes, eliminando la necesidad de sistemas separados.\ud83d\udd39 Escalable y de c\u00f3digo abierto: Disponible en versiones de par\u00e1metros 1B y 7B (con licencia MIT), optimizadas para diversas aplicaciones y uso comercial.\ud83d\udd39 Rendimiento de \u00faltima generaci\u00f3n: Supera a DALL-E 3 de OpenAI y a Stable Diffusion en pruebas comparativas como GenEval y DPG-Bench.\ud83d\udd39 Despliegue simplificado: La arquitectura simplificada reduce los costes de formaci\u00f3n\/inferencia manteniendo la flexibilidad. Enlaces de modelos...<\/p>","protected":false},"author":1,"featured_media":580,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-574","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/comments?post=574"}],"version-history":[{"count":3,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/574\/revisions"}],"predecessor-version":[{"id":609,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/574\/revisions\/609"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media\/580"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media?parent=574"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/categories?post=574"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/tags?post=574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}