{"id":698,"date":"2025-01-29T11:13:31","date_gmt":"2025-01-29T11:13:31","guid":{"rendered":"https:\/\/janusai.pro\/?p=698"},"modified":"2025-01-29T11:14:26","modified_gmt":"2025-01-29T11:14:26","slug":"janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it","status":"publish","type":"post","link":"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/","title":{"rendered":"Janus Pro DeepSeek: Profundiza en la tecnolog\u00eda y la aplicaci\u00f3n del \u00faltimo modelo de IA | Explora el poder innovador que hay detr\u00e1s de \u00e9l"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p>El modelo de c\u00f3digo abierto de bajo coste y alto rendimiento de deepseek se ha vuelto viral. Un gran n\u00famero de nuevos usuarios se han registrado en el sitio web de deepseek, lo que ha provocado repetidas ca\u00eddas del mismo.<\/p>\n\n\n\n<p>Con el r\u00e1pido desarrollo de la tecnolog\u00eda de inteligencia artificial, los grandes modelos ling\u00fc\u00edsticos (LLM) est\u00e1n cambiando todos los aspectos de nuestro trabajo y nuestras vidas.<\/p>\n\n\n\n<p>Pero tambi\u00e9n ha conocido muchas dificultades y retos en el \u00faltimo tiempo. Y en este campo, DeepSeek destaca por su tecnolog\u00eda innovadora y su extraordinario rendimiento.<\/p>\n\n\n\n<p>Nos sumergiremos en Janus Pro DeepSeek, el \u00faltimo modelo de IA y el \u00faltimo modelo multimodal de c\u00f3digo abierto de DeepSeek. Conozca sus caracter\u00edsticas t\u00e9cnicas, su historia de desarrollo y su valor de aplicaci\u00f3n pr\u00e1ctica.<\/p>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#What_is_Janus_Pro_DeepSeek\" >\u00bfQu\u00e9 es Janus Pro DeepSeek?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Development_of_Janus_Pro_DeepSeek\" >Desarrollo de Janus Pro DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Establishment_and_development\" >Creaci\u00f3n y desarrollo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Technical_breakthroughs_and_product_iterations\" >Avances t\u00e9cnicos e iteraciones de productos<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeeks_core_technology\" >Janus Pro Tecnolog\u00eda central de DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Visual_coding_decoupling\" >Desacoplamiento de la codificaci\u00f3n visual<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Unified_Transformer_architecture\" >Arquitectura de transformadores unificada<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Optimized_training_strategy\" >Estrategia de formaci\u00f3n optimizada<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Expanded_training_data\" >Datos de formaci\u00f3n ampliados<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Innovative_visual_encoder\" >Innovador codificador visual<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#High-performance_generative_module\" >M\u00f3dulo generativo de alto rendimiento<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-12\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Infrastructure_innovations\" >Innovaciones en infraestructuras<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-13\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multi-modal_understanding_and_generation_capabilities\" >Capacidad de comprensi\u00f3n y generaci\u00f3n multimodal<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-14\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeek_performance\" >Janus Pro Rendimiento de DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-15\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multimodal_understanding_performance\" >Rendimiento de la comprensi\u00f3n multimodal<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-16\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_command_tracking\" >Seguimiento de comandos de texto a imagen<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-17\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_generation_performance\" >Rendimiento de la generaci\u00f3n de texto a imagen<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-18\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Model_architecture_and_training\" >Arquitectura del modelo y formaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-19\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Scalability_and_deployment\" >Escalabilidad e implantaci\u00f3n<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-20\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Practical_application_scenarios_of_Janus_Pro_DeepSeek\" >Escenarios de aplicaci\u00f3n pr\u00e1ctica de Janus Pro DeepSeek<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-21\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\" >\u00bfC\u00f3mo elijo la versi\u00f3n de Janus Pro DeepSeek que m\u00e1s me conviene?<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-22\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Applicable_scenarios\" >Escenarios aplicables<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-23\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Deployment_requirements\" >Requisitos de implantaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-24\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Summary\" >Resumen<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-25\" href=\"https:\/\/janusai.pro\/es\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Community_support_and_resources\" >Apoyo y recursos comunitarios<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"What_is_Janus_Pro_DeepSeek\"><\/span>\u00bfQu\u00e9 es la <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a>?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"998\" height=\"793\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png\" alt=\"\" class=\"wp-image-699\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png 998w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-300x238.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-768x610.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-15x12.png 15w\" sizes=\"auto, (max-width: 998px) 100vw, 998px\" \/><\/figure>\n\n\n\n<p>Janus Pro es un modelo de IA multimodal de c\u00f3digo abierto publicado por el equipo DeepSeek, utilizado principalmente para la comprensi\u00f3n y generaci\u00f3n de im\u00e1genes.<\/p>\n\n\n\n<p>Funciones principales<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Comprensi\u00f3n y generaci\u00f3n multimodal<\/strong>: Janus Pro puede procesar texto e im\u00e1genes al mismo tiempo, tanto entendiendo el contenido de la imagen como generando im\u00e1genes basadas en la descripci\u00f3n del texto.<\/li>\n\n\n\n<li><strong>C\u00f3digo abierto y modelo a gran escala<\/strong>: Est\u00e1 disponible en dos tama\u00f1os de par\u00e1metro, 1B y 7B, y es de c\u00f3digo abierto y est\u00e1 disponible comercialmente<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Development_of_Janus_Pro_DeepSeek\"><\/span>Desarrollo de <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Establishment_and_development\"><\/span>Creaci\u00f3n y desarrollo<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Julio de 2023<\/strong>: Se crea oficialmente DeepSeek, con sede en Hangzhou, centrada en la investigaci\u00f3n y el desarrollo en el campo de la inteligencia artificial general (AGI).<\/li>\n\n\n\n<li><strong>2 de noviembre de 2023<\/strong>: Lanzamiento del primer modelo de c\u00f3digo abierto de gran tama\u00f1o DeepSeek Coder, que admite tareas de generaci\u00f3n de c\u00f3digo, depuraci\u00f3n y an\u00e1lisis de datos en m\u00faltiples lenguajes de programaci\u00f3n.<\/li>\n\n\n\n<li><strong>29 de noviembre de 2023<\/strong>: Se lanza DeepSeek LLM, un gran modelo de prop\u00f3sito general con una escala de par\u00e1metros de 67.000 millones, que incluye versiones base y de chat de 7B y 67B.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Technical_breakthroughs_and_product_iterations\"><\/span>Avances t\u00e9cnicos e iteraciones de productos<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>7 de mayo de 2024<\/strong>: Se lanza DeepSeek-V2, el modelo experto h\u00edbrido (MoE) de c\u00f3digo abierto de segunda generaci\u00f3n, con un total de 236.000 millones de par\u00e1metros y un coste de inferencia reducido a solo 1 RMB por mill\u00f3n de tokens.<\/li>\n\n\n\n<li><strong>26 de diciembre de 2024<\/strong>: Lanzamiento de DeepSeek-V3, con un total de 671.000 millones de par\u00e1metros. Adopta una arquitectura MoE innovadora y una formaci\u00f3n de precisi\u00f3n mixta FP8, y el coste de formaci\u00f3n es de solo 5,576 millones de d\u00f3lares estadounidenses.<\/li>\n\n\n\n<li><strong>20 de enero de 2025<\/strong>: DeepSeek-R1, una nueva generaci\u00f3n de modelo de inferencia, se libera, con un rendimiento a la par con la versi\u00f3n oficial o1 de OpenAI, y de c\u00f3digo abierto.<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"953\" height=\"521\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png\" alt=\"\" class=\"wp-image-701\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png 953w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-300x164.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-768x420.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-18x10.png 18w\" sizes=\"auto, (max-width: 953px) 100vw, 953px\" \/><\/figure>\n\n\n\n<p>El 27 de enero, el <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Modelo multimodal janus pro<\/a> y se puso en c\u00f3digo abierto inmediatamente despu\u00e9s de su lanzamiento, para que m\u00e1s gente pueda participar en el proceso de desarrollo de grandes modelos de IA y utilizar y aprender la \u00faltima tecnolog\u00eda de IA con recursos limitados.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeeks_core_technology\"><\/span>Janus Pro Tecnolog\u00eda central de DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1017\" height=\"586\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png\" alt=\"\" class=\"wp-image-702\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png 1017w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-300x173.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-768x443.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-18x10.png 18w\" sizes=\"auto, (max-width: 1017px) 100vw, 1017px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Visual_coding_decoupling\"><\/span>Desacoplamiento de la codificaci\u00f3n visual<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro utiliza la tecnolog\u00eda de desacoplamiento de la codificaci\u00f3n visual para dividir la ruta de codificaci\u00f3n visual en rutas de procesamiento independientes, que se utilizan para las tareas multimodales de comprensi\u00f3n y generaci\u00f3n respectivamente. Este dise\u00f1o resuelve eficazmente el problema del conflicto funcional entre el codificador visual en las tareas de comprensi\u00f3n y generaci\u00f3n en los modelos multimodales tradicionales, y mejora la flexibilidad y la adaptabilidad a las tareas del modelo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Unified_Transformer_architecture\"><\/span>Arquitectura de transformadores unificada<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>A pesar de la disociaci\u00f3n de la ruta de codificaci\u00f3n visual, Janus Pro sigue utilizando una \u00fanica arquitectura Transformer para gestionar las tareas multimodales. Esta arquitectura unificada simplifica el dise\u00f1o de modelos al tiempo que mejora su escalabilidad y la capacidad de los modelos para trabajar juntos en distintas tareas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Optimized_training_strategy\"><\/span>Estrategia de formaci\u00f3n optimizada<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro ha realizado una serie de optimizaciones en la estrategia de formaci\u00f3n, entre ellas<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Ampliaci\u00f3n del tiempo de entrenamiento del conjunto de datos ImageNet para mejorar la capacidad de comprensi\u00f3n de im\u00e1genes del modelo.<\/li>\n\n\n\n<li>Centr\u00e1ndose en el entrenamiento de datos de texto a imagen, se optimiza la capacidad generativa del modelo.<\/li>\n\n\n\n<li>Ajustar la proporci\u00f3n de datos de entrenamiento garantiza un rendimiento m\u00e1s estable y eficaz del modelo en tareas multimodales.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Expanded_training_data\"><\/span>Datos de formaci\u00f3n ampliados<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro utiliza datos de entrenamiento diversos y a gran escala, incluidos datos de comprensi\u00f3n multimodal y datos de generaci\u00f3n visual. La ampliaci\u00f3n de estos datos no solo mejora la capacidad de comprensi\u00f3n del modelo, sino tambi\u00e9n su calidad generativa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Innovative_visual_encoder\"><\/span>Innovador codificador visual<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Para tareas de comprensi\u00f3n multimodal, Janus Pro utiliza SigLIP-L como codificador visual, que admite entradas de imagen de hasta 384\u00d7384 de resoluci\u00f3n. Este soporte de alta resoluci\u00f3n permite al modelo captar m\u00e1s detalles de la imagen, mejorando as\u00ed la precisi\u00f3n de la comprensi\u00f3n visual.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"High-performance_generative_module\"><\/span>M\u00f3dulo generativo de alto rendimiento<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Para las tareas de generaci\u00f3n de im\u00e1genes, Janus Pro utiliza LlamaGen Tokenizer con una tasa de downsampling de 16 para generar im\u00e1genes m\u00e1s detalladas. Este dise\u00f1o hace que las im\u00e1genes generadas sean m\u00e1s realistas y detalladas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Infrastructure_innovations\"><\/span>Innovaciones en infraestructuras<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro se basa en los modelos DeepSeek-LLM-1.5b y DeepSeek-LLM-7b, que dotan al modelo de potentes capacidades de procesamiento multimodal, lo que le permite destacar en tareas de comprensi\u00f3n y generaci\u00f3n multimodal.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multi-modal_understanding_and_generation_capabilities\"><\/span>Capacidad de comprensi\u00f3n y generaci\u00f3n multimodal<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro no s\u00f3lo es capaz de realizar tareas de comprensi\u00f3n multimodal (como la respuesta a preguntas visuales y el subtitulado de im\u00e1genes), sino tambi\u00e9n de generar im\u00e1genes de alta calidad a partir de descripciones de texto. Esta capacidad hace que destaque en escenarios multimodales.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"976\" height=\"845\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png\" alt=\"\" class=\"wp-image-703\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png 976w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-300x260.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-768x665.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-14x12.png 14w\" sizes=\"auto, (max-width: 976px) 100vw, 976px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeek_performance\"><\/span>Janus Pro Rendimiento de DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>El modelo Janus-Pro de DeepSeek destaca en tareas de comprensi\u00f3n y generaci\u00f3n multimodal. A continuaci\u00f3n se presenta un an\u00e1lisis detallado de su rendimiento:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multimodal_understanding_performance\"><\/span>Rendimiento de la comprensi\u00f3n multimodal<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Prueba MMBench: Janus-Pro-7B obtuvo una puntuaci\u00f3n de 79,2 en la prueba MMBench de comprensi\u00f3n multimodal, superando a los modelos multimodales unificados m\u00e1s avanzados, como Janus (69,4), TokenFlow (68,9) y MetaMorph (75,2).<\/p>\n\n\n\n<p>- Respuesta a preguntas visuales: La precisi\u00f3n de respuesta a preguntas visuales de Janus-Pro supera a la de GPT-4V, identificando con precisi\u00f3n detalles en im\u00e1genes y respondiendo a preguntas relacionadas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_command_tracking\"><\/span>Seguimiento de comandos de texto a imagen<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Prueba comparativa GenEval: Janus-Pro-7B alcanz\u00f3 una precisi\u00f3n global de 80% en la prueba GenEval, superando significativamente a otros modelos como DALL-E 3 (67%) y Stable Diffusion 3 Medium (74%).<\/p>\n\n\n\n<p>Comprensi\u00f3n de comandos complejos: En la prueba DPG-Bench, Janus-Pro-7B obtuvo una excelente puntuaci\u00f3n de 84,19 puntos y fue capaz de generar con precisi\u00f3n escenas complejas como \"una monta\u00f1a nevada con un lago azul en la cima\".<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_generation_performance\"><\/span>Rendimiento de la generaci\u00f3n de texto a imagen<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Calidad de imagen y estabilidad: A pesar de una resoluci\u00f3n de salida de 384\u00d7384, las im\u00e1genes generadas por Janus-Pro-7B muestran un alto grado de realismo y riqueza de detalles, especialmente al procesar escenas imaginativas y creativas. Es capaz de comprender con precisi\u00f3n la informaci\u00f3n sem\u00e1ntica de las palabras clave y generar im\u00e1genes l\u00f3gicamente razonables y coherentes.<\/p>\n\n\n\n<p>- Velocidad de generaci\u00f3n: Janus-Pro admite la generaci\u00f3n de im\u00e1genes 4K en una sola tarjeta, lo que es 2 veces m\u00e1s r\u00e1pido que Stable Diffusion 3.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_architecture_and_training\"><\/span>Arquitectura del modelo y formaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Desacoplamiento de la codificaci\u00f3n visual: Janus-Pro utiliza un m\u00e9todo de codificaci\u00f3n independiente para convertir la entrada original en caracter\u00edsticas, que luego son procesadas por un transformador autorregresivo unificado para lograr el desacoplamiento de la codificaci\u00f3n visual en tareas de comprensi\u00f3n y generaci\u00f3n multimodal.<\/p>\n\n\n\n<p>- Datos de entrenamiento: Janus-Pro incorpora 72 millones de im\u00e1genes sint\u00e9ticas de alta calidad al entrenamiento para garantizar una proporci\u00f3n 1:1 entre datos reales y sint\u00e9ticos. Tambi\u00e9n a\u00f1ade unos 90 millones de muestras de datos de entrenamiento de comprensi\u00f3n multimodal, lo que mejora significativamente el rendimiento del modelo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Scalability_and_deployment\"><\/span>Escalabilidad e implantaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Tama\u00f1o del modelo: La serie Janus-Pro ofrece modelos con tama\u00f1os de par\u00e1metro 1B y 7B, que tienen en cuenta tanto el rendimiento como los costes de computaci\u00f3n y son adecuados para m\u00e1s casos de uso.<\/p>\n\n\n\n<p>Despliegue m\u00ednimo: Janus-Pro se publica bajo licencia MIT, admite uso comercial y ofrece dos versiones: 1.5B (requiere 16 GB de VRAM) y 7B (requiere 24 GB de VRAM), que pueden ejecutarse en GPU est\u00e1ndar.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Practical_application_scenarios_of_Janus_Pro_DeepSeek\"><\/span>Escenarios de aplicaci\u00f3n pr\u00e1ctica de Janus Pro DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Los modelos multimodales de IA, especialmente los de texto a imagen, tienen un gran potencial de desarrollo en el sector comercial. Tras un largo periodo de desarrollo, los modelos de IA de texto a imagen ya han hecho grandes progresos<\/p>\n\n\n\n<p>En el escenario m\u00e1s com\u00fan de la publicidad o el dise\u00f1o de carteles, los dise\u00f1adores o usuarios pueden utilizar Janus pro para introducir una descripci\u00f3n de texto para generar r\u00e1pidamente carteles de alta calidad. Al iterar a trav\u00e9s de prototipos de carteles, pueden ahorrar tiempo de dise\u00f1o y mejorar la eficiencia creativa. Esto puede mejorar enormemente la eficiencia de los dise\u00f1adores, que pueden dedicar tiempo a cosas m\u00e1s significativas<\/p>\n\n\n\n<p>Adem\u00e1s del dise\u00f1o tradicional de carteles o publicidad, en los entornos de juego m\u00e1s populares hoy en d\u00eda, el modelo ai large tambi\u00e9n puede ayudar a los dise\u00f1adores a generar escenas de juego, personajes y objetos en tiempo real, reduciendo el coste y la dificultad del desarrollo y mejorando al mismo tiempo los efectos visuales del juego. Creemos que el modelo ai large puede seguir liberando el potencial y la imaginaci\u00f3n de los creadores, y hacer realidad productos m\u00e1s interesantes.<\/p>\n\n\n\n<p>Adem\u00e1s del campo del dise\u00f1o, en otros campos del aprendizaje, la educaci\u00f3n y el campo vertical profesional de la medicina, el modelo multimodal tambi\u00e9n tendr\u00e1 un gran desarrollo.<\/p>\n\n\n\n<p>En el futuro, es posible que veamos la aparici\u00f3n de m\u00e1s aplicaciones muy interesantes que pueden mejorar enormemente la eficiencia y la calidad de nuestras vidas.<\/p>\n\n\n\n<p>Por otro lado, las caracter\u00edsticas de c\u00f3digo abierto de Janus-Pro (licencia MIT) y los m\u00e9todos de implantaci\u00f3n m\u00ednimos (admite la ejecuci\u00f3n en GPU est\u00e1ndar) reducen a\u00fan m\u00e1s la barrera de entrada, lo que lo hace ampliamente aplicable a los campos mencionados.<\/p>\n\n\n\n<p>Esto permite que m\u00e1s usuarios participen en el desarrollo, de modo que m\u00e1s personas puedan mejorar estas funciones y aumentar las capacidades de toda la comunidad.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\"><\/span>\u00bfC\u00f3mo elijo la versi\u00f3n de Janus Pro DeepSeek que m\u00e1s me conviene?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro es de c\u00f3digo abierto en dos versiones: Janus-Pro-1B y Janus-Pro-7B. La versi\u00f3n que elija depender\u00e1 de sus necesidades espec\u00edficas, recursos inform\u00e1ticos y escenarios de aplicaci\u00f3n. A continuaci\u00f3n encontrar\u00e1 una comparaci\u00f3n detallada y recomendaciones:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Applicable_scenarios\"><\/span>Escenarios aplicables<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Aplicaciones ligeras: adecuadas para su uso en dispositivos m\u00f3viles, en navegadores o en entornos con recursos limitados. Esto permite que m\u00e1s usuarios experimenten lo \u00faltimo de Janus pro.<\/p>\n\n\n\n<p>- Prototipado r\u00e1pido: adecuado para desarrollar y probar r\u00e1pidamente funciones multimodales sin necesidad de muchos recursos inform\u00e1ticos. Esto es muy importante para los entusiastas de la IA, que pueden iterar r\u00e1pidamente y descubrir problemas encontrados en la investigaci\u00f3n sin requerir muchos recursos inform\u00e1ticos.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Generaci\u00f3n de im\u00e1genes de alta calidad: adecuado para aplicaciones que requieren la generaci\u00f3n de im\u00e1genes de alta calidad de escenas complejas, como el dise\u00f1o publicitario, el desarrollo de juegos y la creaci\u00f3n art\u00edstica. Este modelo es m\u00e1s adecuado para escenarios de dise\u00f1o m\u00e1s profesionales, que requieren capacidades de hardware m\u00e1s potentes y capacidades inform\u00e1ticas m\u00e1s potentes.<\/p>\n\n\n\n<p>- Comprensi\u00f3n de instrucciones complejas: adecuado para escenarios que necesitan procesar instrucciones de texto complejas y generar im\u00e1genes precisas, como la realidad virtual (RV) y la realidad aumentada (RA).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Deployment_requirements\"><\/span>Requisitos de implantaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Requisitos de hardware: apto para ejecutarse en dispositivos con recursos limitados, como GPU que requieran 16 GB de VRAM. Si solo dispones de una tarjeta gr\u00e1fica anterior, puede que esta sea m\u00e1s adecuada para ti.<\/p>\n\n\n\n<p>- Escenario de aplicaci\u00f3n: adecuado para ejecutarse en el navegador o desplegarse en dispositivos ligeros.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Requisitos de hardware: requiere mayores recursos inform\u00e1ticos, como una GPU con 24 GB de VRAM. Ser\u00e1 m\u00e1s adecuado para usuarios con tarjetas gr\u00e1ficas m\u00e1s recientes.<\/p>\n\n\n\n<p>- Escenario de aplicaci\u00f3n: adecuado para ejecutarse en GPU est\u00e1ndar y para escenarios que requieran un alto rendimiento.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Summary\"><\/span>Resumen<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Si su escenario de aplicaci\u00f3n requiere una alta calidad de imagen y una comprensi\u00f3n compleja de las instrucciones, y dispone de recursos inform\u00e1ticos suficientes, le recomendamos el Janus-Pro-7B.<\/p>\n\n\n\n<p>Si necesita una implantaci\u00f3n ligera o dispone de recursos inform\u00e1ticos limitados, le recomendamos Janus-Pro-1B.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Community_support_and_resources\"><\/span>Apoyo y recursos comunitarios<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>DeepSeek ofrece a los desarrolladores una gran cantidad de recursos y asistencia:<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>La documentaci\u00f3n oficial ofrece descripciones detalladas de la interfaz de la API y gu\u00edas t\u00e9cnicas, incluidos el ajuste de modelos, tutoriales de implantaci\u00f3n y otros contenidos.<\/li>\n\n\n\n<li>La comunidad de desarrolladores ofrece foros y grupos de debate para facilitar el intercambio de experiencias entre desarrolladores. Se celebran peri\u00f3dicamente sesiones de intercambio t\u00e9cnico y hackathones.<\/li>\n\n\n\n<li>El servicio de asistencia t\u00e9cnica ofrece servicios profesionales de asistencia t\u00e9cnica para resolver los problemas que encuentran los usuarios durante su uso.<\/li>\n<\/ol>","protected":false},"excerpt":{"rendered":"<p>El modelo de c\u00f3digo abierto de bajo coste y alto rendimiento de deepseek se ha vuelto viral. Un gran n\u00famero de nuevos usuarios se han registrado en la web de deepseek, lo que ha provocado repetidas ca\u00eddas del sitio. Con el r\u00e1pido desarrollo de la tecnolog\u00eda de inteligencia artificial, los grandes modelos ling\u00fc\u00edsticos (LLM) est\u00e1n cambiando todos los aspectos de nuestro trabajo y nuestras vidas. Pero tambi\u00e9n se han...<\/p>","protected":false},"author":2,"featured_media":704,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-698","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/698","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/comments?post=698"}],"version-history":[{"count":2,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/698\/revisions"}],"predecessor-version":[{"id":706,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/698\/revisions\/706"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media\/704"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media?parent=698"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/categories?post=698"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/tags?post=698"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}