{"id":847,"date":"2025-02-04T16:27:27","date_gmt":"2025-02-04T16:27:27","guid":{"rendered":"https:\/\/janusai.pro\/?p=847"},"modified":"2025-02-04T16:27:28","modified_gmt":"2025-02-04T16:27:28","slug":"how-good-is-deepseeks-janus-pro","status":"publish","type":"post","link":"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/","title":{"rendered":"\u00bfC\u00f3mo de bueno es el Janus-Pro de DeepSeek?"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p>En v\u00edsperas del Festival de Primavera, se lanz\u00f3 el modelo DeepSeek-R1. Con su arquitectura RL pura, ha aprendido de las grandes innovaciones de CoT, y supera a <a href=\"https:\/\/openai.com\/\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">ChatGPT<\/a> en matem\u00e1ticas, c\u00f3digo y razonamiento l\u00f3gico.<\/p>\n\n\n\n<p>Adem\u00e1s, los pesos de sus modelos de c\u00f3digo abierto, los bajos costes de formaci\u00f3n y el bajo precio de sus API han hecho de DeepSeek un \u00e9xito en Internet, provocando incluso el desplome de las cotizaciones burs\u00e1tiles de NVIDIA y ASML durante un tiempo.<\/p>\n\n\n\n<p>Al tiempo que se disparaba su popularidad, DeepSeek tambi\u00e9n lanz\u00f3 una versi\u00f3n actualizada del gran modelo multimodal Janus (Janus), Janus-Pro, que hereda la arquitectura unificada de la generaci\u00f3n anterior de comprensi\u00f3n y generaci\u00f3n multimodal, y optimiza la estrategia de entrenamiento, escalando los datos de entrenamiento y el tama\u00f1o del modelo, lo que aporta un mayor rendimiento.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"427\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02.png\" alt=\"\" class=\"wp-image-850\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-300x119.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-1024x405.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-768x304.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/56e80359-198e-4faf-981a-54b7dfe49f02-18x7.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"522\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481.png\" alt=\"\" class=\"wp-image-854\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-300x145.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-1024x495.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-768x371.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/af7da2cf-a17d-4ac3-95ba-42252fe1a481-18x9.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Janus-Pro\" >Janus-Pro<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Model_architecture\" >Arquitectura modelo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Training_strategy\" >Estrategia de formaci\u00f3n<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Training_data_scaling\" >Escalado de datos de entrenamiento<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Model_scaling\" >Escalado de modelos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/es\/how-good-is-deepseeks-janus-pro\/#Model_evaluation\" >Evaluaci\u00f3n de modelos<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus-Pro\"><\/span>Janus-Pro<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus-Pro<\/a> es un modelo de lenguaje multimodal unificado (MLLM) que puede procesar simult\u00e1neamente tareas de comprensi\u00f3n multimodal y tareas de generaci\u00f3n, es decir, puede comprender el contenido de una imagen y tambi\u00e9n generar texto.<\/p>\n\n\n\n<p>Desacopla los codificadores visuales para la comprensi\u00f3n y generaci\u00f3n multimodal (es decir, se utilizan diferentes tokenizadores para la entrada de la comprensi\u00f3n de im\u00e1genes y la entrada y salida de la generaci\u00f3n de im\u00e1genes), y los procesa utilizando un transformador autorregresivo unificado.<\/p>\n\n\n\n<p>Como modelo avanzado de comprensi\u00f3n y generaci\u00f3n multimodal, es una versi\u00f3n mejorada del anterior modelo Janus.<\/p>\n\n\n\n<p>En la mitolog\u00eda romana, Jano es un dios guardi\u00e1n de dos caras que simboliza la contradicci\u00f3n y la transici\u00f3n. Tiene dos caras, lo que tambi\u00e9n sugiere que el modelo Janus puede entender y generar im\u00e1genes, lo que resulta muy apropiado. Entonces, \u00bfqu\u00e9 es exactamente lo que ha actualizado PRO?<\/p>\n\n\n\n<p>Janus, como peque\u00f1o modelo de 1.3B, se parece m\u00e1s a una versi\u00f3n preliminar que a una versi\u00f3n oficial. Explora la comprensi\u00f3n y generaci\u00f3n multimodal unificada, pero tiene muchos problemas, como efectos de generaci\u00f3n de im\u00e1genes inestables, grandes desviaciones respecto a las instrucciones del usuario y detalles inadecuados.<\/p>\n\n\n\n<p>La versi\u00f3n Pro optimiza la estrategia de entrenamiento, aumenta el conjunto de datos de entrenamiento y proporciona un modelo m\u00e1s grande (7B) para elegir, al tiempo que proporciona un modelo 1B.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_architecture\"><\/span>Arquitectura modelo<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p><a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Jaus-Pro y Janus<\/a> son id\u00e9nticos en cuanto a la arquitectura del modelo. (\u00a1S\u00f3lo 1,3B! Janus unifica la comprensi\u00f3n y la generaci\u00f3n multimodal).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"571\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006.png\" alt=\"\" class=\"wp-image-851\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-300x159.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-1024x541.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-768x406.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/60356ab0-3c6e-4017-9eba-7ee44e0a1006-18x10.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>El principio b\u00e1sico del dise\u00f1o es desacoplar la codificaci\u00f3n visual para facilitar la comprensi\u00f3n y la generaci\u00f3n multimodales. Janus-Pro codifica la imagen\/texto original por separado, extrae caracter\u00edsticas de alta dimensi\u00f3n y las procesa mediante un transformador autorregresivo unificado.<\/p>\n\n\n\n<p>La comprensi\u00f3n de im\u00e1genes multimodales utiliza SigLIP para codificar las caracter\u00edsticas de la imagen (codificador azul en la figura anterior), y la tarea de generaci\u00f3n utiliza el tokenizador VQ para discretizar la imagen (codificador amarillo en la figura anterior). Por \u00faltimo, todas las secuencias de caracter\u00edsticas se introducen en el LLM para su procesamiento.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Training_strategy\"><\/span>Estrategia de formaci\u00f3n<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>En cuanto a la estrategia de entrenamiento, Janus-Pro ha introducido m\u00e1s mejoras. La antigua versi\u00f3n de Janus utilizaba una estrategia de entrenamiento en tres etapas, en la que la Etapa I entrena el adaptador de entrada y el cabezal de generaci\u00f3n de im\u00e1genes para la comprensi\u00f3n y generaci\u00f3n de im\u00e1genes, la Etapa II realiza un pre-entrenamiento unificado, y la Etapa III afina el codificador de comprensi\u00f3n sobre esta base. (La estrategia de entrenamiento de Janus se muestra en la siguiente figura).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"381\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a.png\" alt=\"\" class=\"wp-image-849\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-300x106.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-1024x361.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-768x271.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/dbf6954f-1a18-4572-a452-ec995c8af71a-18x6.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>Sin embargo, esta estrategia utiliza el m\u00e9todo PixArt para dividir el entrenamiento de generaci\u00f3n de texto a imagen en la Etapa II, lo que se traduce en una baja eficiencia computacional.<\/p>\n\n\n\n<p>Para ello, ampliamos el tiempo de entrenamiento de la Etapa I y a\u00f1adimos el entrenamiento con datos de ImageNet, de modo que el modelo pueda modelar eficazmente las dependencias de los p\u00edxeles con par\u00e1metros LLM fijos. En la Etapa II, descartamos los datos de ImageNet y utilizamos directamente datos de pares texto-imagen para entrenar, lo que mejora la eficiencia del entrenamiento. Adem\u00e1s, ajustamos la proporci\u00f3n de datos en la Etapa III (datos multimodales:s\u00f3lo texto:gr\u00e1ficos visuales-sem\u00e1nticos de 7:3:10 a 5:1:4), mejorando la comprensi\u00f3n multimodal y manteniendo al mismo tiempo la capacidad de generaci\u00f3n visual.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Training_data_scaling\"><\/span>Escalado de datos de entrenamiento<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro tambi\u00e9n escala los datos de entrenamiento de Janus en t\u00e9rminos de comprensi\u00f3n multimodal y generaci\u00f3n visual.<\/p>\n\n\n\n<p>Comprensi\u00f3n multimodal: Los datos de preentrenamiento de la Etapa II se basan en DeepSeek-VL2 e incluyen unos 90 millones de muestras nuevas, incluidos datos de pies de im\u00e1genes (como YFCC) y datos de comprensi\u00f3n de tablas, gr\u00e1ficos y documentos (como Docmatix).<\/p>\n\n\n\n<p>La fase III de ajuste fino supervisado introduce adem\u00e1s la comprensi\u00f3n MEME, datos de di\u00e1logos chinos, etc., para mejorar el rendimiento del modelo en el procesamiento multitarea y las capacidades de di\u00e1logo.<\/p>\n\n\n\n<p>Generaci\u00f3n visual: Las versiones anteriores utilizaban datos reales de baja calidad y mucho ruido, lo que afectaba a la estabilidad y la est\u00e9tica de las im\u00e1genes generadas por texto.<\/p>\n\n\n\n<p>Janus-Pro introduce unos 72 millones de datos est\u00e9ticos sint\u00e9ticos, con lo que la proporci\u00f3n entre datos reales y sint\u00e9ticos es de 1:1. Los experimentos han demostrado que los datos sint\u00e9ticos aceleran la convergencia del modelo y mejoran significativamente la estabilidad y la calidad est\u00e9tica de las im\u00e1genes generadas.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_scaling\"><\/span>Escalado de modelos<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus Pro ampl\u00eda el tama\u00f1o del modelo a 7B, mientras que la versi\u00f3n anterior de Janus utilizaba 1,5B DeepSeek-LLM para verificar la eficacia del desacoplamiento de la codificaci\u00f3n visual. Los experimentos muestran que un LLM m\u00e1s grande acelera significativamente la convergencia de la comprensi\u00f3n multimodal y la generaci\u00f3n visual, lo que verifica a\u00fan m\u00e1s la fuerte escalabilidad del m\u00e9todo.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"864\" height=\"352\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b.png\" alt=\"\" class=\"wp-image-848\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b.png 864w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-300x122.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-768x313.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/a19590e2-1805-493d-85e3-09c9b8e2274b-18x7.png 18w\" sizes=\"auto, (max-width: 864px) 100vw, 864px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"536\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba.png\" alt=\"\" class=\"wp-image-852\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-300x149.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-1024x508.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-768x381.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/c78ed17c-6e07-43ef-bfda-ae287f597bba-18x9.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<p>El experimento utiliza DeepSeek-LLM (1,5B y 7B, soportando una secuencia m\u00e1xima de 4096) como modelo ling\u00fc\u00edstico b\u00e1sico. Para la tarea de comprensi\u00f3n multimodal, se utiliza SigLIP-Large-Patch16-384 como codificador visual, el tama\u00f1o del diccionario del codificador es 16384, el m\u00faltiplo de reducci\u00f3n de muestreo de la imagen es 16, y tanto el adaptador de comprensi\u00f3n como el de generaci\u00f3n son MLP de dos capas.<\/p>\n\n\n\n<p>El entrenamiento de la fase II utiliza una estrategia de parada temprana de 270K, todas las im\u00e1genes se ajustan uniformemente a una resoluci\u00f3n de 384\u00d7384 y se utiliza el empaquetado de secuencias para mejorar la eficiencia del entrenamiento . Janus-Pro se entrena y eval\u00faa con HAI-LLM. Las versiones 1.5B\/7B se entrenaron en 16\/32 nodos (8\u00d7Nvidia A100 40GB por nodo) durante 9\/14 d\u00edas respectivamente.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_evaluation\"><\/span>Evaluaci\u00f3n de modelos<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro se evalu\u00f3 por separado en comprensi\u00f3n y generaci\u00f3n multimodal. En general, la comprensi\u00f3n puede ser ligeramente d\u00e9bil, pero se considera excelente entre los modelos de c\u00f3digo abierto del mismo tama\u00f1o (supongo que est\u00e1 limitada en gran medida por la resoluci\u00f3n de entrada fija y las capacidades de OCR).<\/p>\n\n\n\n<p>Janus-Pro-7B obtuvo una puntuaci\u00f3n de 79,2 en la prueba comparativa MMBench, que se acerca al nivel de los modelos de c\u00f3digo abierto de primer nivel (el mismo tama\u00f1o de InternVL2.5 y Qwen2-VL ronda los 82 puntos). No obstante, supone una buena mejora con respecto a la generaci\u00f3n anterior de Janus.<\/p>\n\n\n\n<p>En cuanto a la generaci\u00f3n de im\u00e1genes, la mejora respecto a la generaci\u00f3n anterior es a\u00fan m\u00e1s significativa, y se considera un nivel excelente entre los modelos de c\u00f3digo abierto. La puntuaci\u00f3n de Janus-Pro en la prueba de referencia GenEval (0,80) tambi\u00e9n supera a modelos como DALL-E 3 (0,67) y Stable Diffusion 3 Medium (0,74).<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"827\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349.png\" alt=\"\" class=\"wp-image-853\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-300x230.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-1024x784.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-768x588.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/47aa92e1-b474-4874-956e-db210da9d349-16x12.png 16w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image\"><img loading=\"lazy\" decoding=\"async\" width=\"1080\" height=\"744\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55.png\" alt=\"\" class=\"wp-image-855\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55.png 1080w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-300x207.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-1024x705.png 1024w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-768x529.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/02\/38de369b-7f1f-4159-83a7-5f411e816d55-18x12.png 18w\" sizes=\"auto, (max-width: 1080px) 100vw, 1080px\" \/><\/figure>","protected":false},"excerpt":{"rendered":"<p>En v\u00edsperas del Festival de Primavera, se lanz\u00f3 el modelo DeepSeek-R1. Con su arquitectura RL pura, ha aprendido de las grandes innovaciones de CoT, y supera a ChatGPT en matem\u00e1ticas, c\u00f3digo y razonamiento l\u00f3gico. Adem\u00e1s, los pesos de su modelo de c\u00f3digo abierto, los bajos costes de formaci\u00f3n y los precios baratos de la API han hecho de DeepSeek un \u00e9xito en Internet, incluso...<\/p>","protected":false},"author":2,"featured_media":704,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-847","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/847","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/comments?post=847"}],"version-history":[{"count":1,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/847\/revisions"}],"predecessor-version":[{"id":856,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/posts\/847\/revisions\/856"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media\/704"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/media?parent=847"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/categories?post=847"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/es\/wp-json\/wp\/v2\/tags?post=847"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}