{"id":698,"date":"2025-01-29T11:13:31","date_gmt":"2025-01-29T11:13:31","guid":{"rendered":"https:\/\/janusai.pro\/?p=698"},"modified":"2025-01-29T11:14:26","modified_gmt":"2025-01-29T11:14:26","slug":"janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it","status":"publish","type":"post","link":"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/","title":{"rendered":"Janus Pro DeepSeek: Un'immersione profonda nella tecnologia e nell'applicazione del pi\u00f9 recente modello di intelligenza artificiale per esplorare la potenza innovativa che lo sottende"},"content":{"rendered":"<div style=\"margin-top: 0px; margin-bottom: 0px;\" class=\"sharethis-inline-share-buttons\" ><\/div>\n<p>Il modello open source a basso costo e ad alte prestazioni di deepseek \u00e8 diventato virale. Un gran numero di nuovi utenti si \u00e8 registrato sul sito web di deepseek, causando ripetutamente il crash del sito.<\/p>\n\n\n\n<p>Con il rapido sviluppo della tecnologia dell'intelligenza artificiale, i modelli linguistici di grandi dimensioni (LLM) stanno cambiando ogni aspetto del nostro lavoro e della nostra vita.<\/p>\n\n\n\n<p>Ma ha anche incontrato molte difficolt\u00e0 e sfide nel corso degli ultimi anni. In questo campo, DeepSeek si distingue per la sua tecnologia innovativa e le sue prestazioni eccezionali.<\/p>\n\n\n\n<p>Faremo un'immersione profonda in Janus Pro DeepSeek, l'ultimo modello di AI e l'ultimo modello multimodale open source di DeepSeek. Scopriremo le sue caratteristiche tecniche, la storia dello sviluppo e il valore pratico delle applicazioni.<\/p>\n\n\n\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_72 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Indice dei contenuti<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Allinea la tabella dei contenuti\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewbox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewbox=\"0 0 24 24\" version=\"1.2\" baseprofile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#What_is_Janus_Pro_DeepSeek\" title=\"Che cos&#039;\u00e8 Janus Pro DeepSeek?\">Che cos'\u00e8 Janus Pro DeepSeek?<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Development_of_Janus_Pro_DeepSeek\" title=\"Sviluppo di Janus Pro DeepSeek\">Sviluppo di Janus Pro DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Establishment_and_development\" title=\"Creazione e sviluppo\">Creazione e sviluppo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Technical_breakthroughs_and_product_iterations\" title=\"Innovazioni tecniche e iterazioni di prodotto\">Innovazioni tecniche e iterazioni di prodotto<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeeks_core_technology\" title=\"Janus Pro La tecnologia di base di DeepSeek\">Janus Pro La tecnologia di base di DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Visual_coding_decoupling\" title=\"Disaccoppiamento della codifica visiva\">Disaccoppiamento della codifica visiva<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-7\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Unified_Transformer_architecture\" title=\"Architettura del trasformatore unificato\">Architettura del trasformatore unificato<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-8\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Optimized_training_strategy\" title=\"Strategia di formazione ottimizzata\">Strategia di formazione ottimizzata<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-9\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Expanded_training_data\" title=\"Dati di formazione ampliati\">Dati di formazione ampliati<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-10\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Innovative_visual_encoder\" title=\"Innovativo codificatore visivo\">Innovativo codificatore visivo<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-11\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#High-performance_generative_module\" title=\"Modulo generativo ad alte prestazioni\">Modulo generativo ad alte prestazioni<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-12\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Infrastructure_innovations\" title=\"Innovazioni infrastrutturali\">Innovazioni infrastrutturali<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-13\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multi-modal_understanding_and_generation_capabilities\" title=\"Capacit\u00e0 di comprensione e generazione multimodale\">Capacit\u00e0 di comprensione e generazione multimodale<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-14\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Janus_Pro_DeepSeek_performance\" title=\"Prestazioni di Janus Pro DeepSeek\">Prestazioni di Janus Pro DeepSeek<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-15\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Multimodal_understanding_performance\" title=\"Prestazioni di comprensione multimodale\">Prestazioni di comprensione multimodale<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-16\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_command_tracking\" title=\"Tracciamento dei comandi da testo a immagine\">Tracciamento dei comandi da testo a immagine<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-17\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Text-to-image_generation_performance\" title=\"Prestazioni della generazione testo-immagine\">Prestazioni della generazione testo-immagine<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-18\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Model_architecture_and_training\" title=\"Architettura del modello e formazione\">Architettura del modello e formazione<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-19\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Scalability_and_deployment\" title=\"Scalabilit\u00e0 e distribuzione\">Scalabilit\u00e0 e distribuzione<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-20\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Practical_application_scenarios_of_Janus_Pro_DeepSeek\" title=\"Scenari di applicazione pratica di Janus Pro DeepSeek\">Scenari di applicazione pratica di Janus Pro DeepSeek<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-21\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\" title=\"Come faccio a scegliere la versione di Janus Pro DeepSeek pi\u00f9 adatta a me?\">Come faccio a scegliere la versione di Janus Pro DeepSeek pi\u00f9 adatta a me?<\/a><ul class='ez-toc-list-level-3' ><li class='ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-22\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Applicable_scenarios\" title=\"Scenari applicabili\">Scenari applicabili<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-23\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Deployment_requirements\" title=\"Requisiti per la distribuzione\">Requisiti per la distribuzione<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-24\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Summary\" title=\"Sintesi\">Sintesi<\/a><\/li><\/ul><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-25\" href=\"https:\/\/janusai.pro\/it\/janus-pro-deepseek-deep-dive-into-the-technology-and-application-of-the-latest-ai-model-explore-the-innovative-power-behind-it\/#Community_support_and_resources\" title=\"Supporto e risorse della comunit\u00e0\">Supporto e risorse della comunit\u00e0<\/a><\/li><\/ul><\/nav><\/div>\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"What_is_Janus_Pro_DeepSeek\"><\/span>Che cosa \u00e8 <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a>?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"998\" height=\"793\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png\" alt=\"\" class=\"wp-image-699\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1.png 998w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-300x238.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-768x610.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-1-15x12.png 15w\" sizes=\"auto, (max-width: 998px) 100vw, 998px\" \/><\/figure>\n\n\n\n<p>Janus Pro \u00e8 un modello di intelligenza artificiale multimodale open-source rilasciato dal team DeepSeek, utilizzato principalmente per la comprensione e la generazione di immagini.<\/p>\n\n\n\n<p>Funzioni principali<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Comprensione e generazione multimodale<\/strong>: Janus Pro \u00e8 in grado di elaborare contemporaneamente testo e immagini, comprendendo il contenuto dell'immagine e generando immagini in base alla descrizione del testo.<\/li>\n\n\n\n<li><strong>Modello open source e su larga scala<\/strong>: \u00c8 disponibile in due dimensioni di parametro, 1B e 7B, ed \u00e8 open source e disponibile in commercio.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Development_of_Janus_Pro_DeepSeek\"><\/span>Sviluppo di <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Janus Pro DeepSeek<\/a><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Establishment_and_development\"><\/span>Creazione e sviluppo<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Luglio 2023<\/strong>: DeepSeek \u00e8 stata ufficialmente fondata, con sede a Hangzhou, e si concentra sulla ricerca e lo sviluppo nel campo dell'intelligenza artificiale generale (AGI).<\/li>\n\n\n\n<li><strong>2 novembre 2023<\/strong>: Rilascio del primo modello open source di codice di grandi dimensioni DeepSeek Coder, che supporta la generazione di codice, il debug e l'analisi dei dati in diversi linguaggi di programmazione.<\/li>\n\n\n\n<li><strong>29 novembre 2023<\/strong>: Viene lanciato DeepSeek LLM, un modello di grandi dimensioni di uso generale con una scala di parametri di 67 miliardi, che comprende versioni base e chat di 7B e 67B.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Technical_breakthroughs_and_product_iterations\"><\/span>Innovazioni tecniche e iterazioni di prodotto<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>7 maggio 2024<\/strong>: Viene rilasciato DeepSeek-V2, il modello open source di esperto ibrido (MoE) di seconda generazione, con un totale di 236 miliardi di parametri e un costo di inferenza ridotto a solo 1 RMB per milione di token.<\/li>\n\n\n\n<li><strong>26 dicembre 2024<\/strong>: Viene rilasciato DeepSeek-V3, con un totale di 671 miliardi di parametri. Adotta un'architettura MoE innovativa e l'addestramento a precisione mista FP8, e il costo dell'addestramento \u00e8 di soli 5,576 milioni di dollari USA.<\/li>\n\n\n\n<li><strong>20 gennaio 2025<\/strong>: DeepSeek-R1, un modello di inferenza di nuova generazione, \u00e8 stato rilasciato, con prestazioni pari alla versione ufficiale o1 di OpenAI, ed \u00e8 open sourced.<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"953\" height=\"521\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png\" alt=\"\" class=\"wp-image-701\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3.png 953w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-300x164.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-768x420.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-3-18x10.png 18w\" sizes=\"auto, (max-width: 953px) 100vw, 953px\" \/><\/figure>\n\n\n\n<p>Il 27 gennaio, il <a href=\"https:\/\/huggingface.co\/deepseek-ai\/Janus-Pro-7B\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Modello multimodale janus pro<\/a> \u00e8 stato rilasciato ed \u00e8 stato reso open-sourced subito dopo il rilascio, in modo che un maggior numero di persone possa partecipare al processo di sviluppo di grandi modelli di IA e utilizzare e imparare la pi\u00f9 recente tecnologia di IA con risorse limitate.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeeks_core_technology\"><\/span>Janus Pro La tecnologia di base di DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1017\" height=\"586\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png\" alt=\"\" class=\"wp-image-702\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4.png 1017w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-300x173.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-768x443.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-4-18x10.png 18w\" sizes=\"auto, (max-width: 1017px) 100vw, 1017px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Visual_coding_decoupling\"><\/span>Disaccoppiamento della codifica visiva<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro utilizza la tecnologia di disaccoppiamento della codifica visiva per dividere il percorso di codifica visiva in percorsi di elaborazione indipendenti, utilizzati rispettivamente per la comprensione e la generazione multimodale. Questo progetto risolve efficacemente il problema del conflitto funzionale tra il codificatore visivo nei compiti di comprensione e generazione dei modelli multimodali tradizionali e migliora la flessibilit\u00e0 e l'adattabilit\u00e0 al compito del modello.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Unified_Transformer_architecture\"><\/span>Architettura del trasformatore unificato<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Nonostante il disaccoppiamento del percorso di codifica visiva, Janus Pro utilizza ancora un'unica architettura di trasformatori per gestire compiti multimodali. Questa architettura unificata semplifica la progettazione dei modelli e ne migliora la scalabilit\u00e0 e la capacit\u00e0 di lavorare insieme tra i vari compiti.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Optimized_training_strategy\"><\/span>Strategia di formazione ottimizzata<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro ha apportato una serie di ottimizzazioni alla strategia di formazione, tra cui<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Estendere il tempo di addestramento del dataset ImageNet per migliorare le capacit\u00e0 di comprensione delle immagini del modello.<\/li>\n\n\n\n<li>Concentrandosi sull'addestramento dei dati da testo a immagine, la capacit\u00e0 generativa del modello viene ottimizzata.<\/li>\n\n\n\n<li>La regolazione della proporzione di dati di addestramento garantisce al modello prestazioni pi\u00f9 stabili ed efficienti nei compiti multimodali.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Expanded_training_data\"><\/span>Dati di formazione ampliati<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro utilizza dati di addestramento diversi e su larga scala, tra cui dati di comprensione multimodale e dati di generazione visiva. L'espansione di questi dati non solo migliora la capacit\u00e0 di comprensione del modello, ma ne aumenta anche la qualit\u00e0 generativa.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Innovative_visual_encoder\"><\/span>Innovativo codificatore visivo<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Per i compiti di comprensione multimodale, Janus Pro utilizza SigLIP-L come codificatore visivo, che supporta input di immagini con risoluzione fino a 384\u00d7384. Questo supporto ad alta risoluzione consente al modello di catturare pi\u00f9 dettagli dell'immagine, migliorando cos\u00ec l'accuratezza della comprensione visiva.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"High-performance_generative_module\"><\/span>Modulo generativo ad alte prestazioni<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Per la generazione di immagini, Janus Pro utilizza LlamaGen Tokenizer con una velocit\u00e0 di downsampling di 16 per generare immagini pi\u00f9 dettagliate. Questo design rende le immagini generate pi\u00f9 realistiche e dettagliate.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Infrastructure_innovations\"><\/span>Innovazioni infrastrutturali<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro \u00e8 costruito sui modelli DeepSeek-LLM-1.5b e DeepSeek-LLM-7b, che gli conferiscono potenti capacit\u00e0 di elaborazione multimodale, facendolo eccellere in compiti di comprensione e generazione multimodale.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multi-modal_understanding_and_generation_capabilities\"><\/span>Capacit\u00e0 di comprensione e generazione multimodale<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Janus Pro \u00e8 in grado non solo di gestire compiti di comprensione multimodale (come la risposta a domande visive e la didascalia di immagini), ma anche di generare immagini di alta qualit\u00e0 da descrizioni testuali. Questa capacit\u00e0 lo rende eccellente in scenari multimodali.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"976\" height=\"845\" src=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png\" alt=\"\" class=\"wp-image-703\" srcset=\"https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5.png 976w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-300x260.png 300w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-768x665.png 768w, https:\/\/janusai.pro\/wp-content\/uploads\/2025\/01\/image-5-14x12.png 14w\" sizes=\"auto, (max-width: 976px) 100vw, 976px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Janus_Pro_DeepSeek_performance\"><\/span>Prestazioni di Janus Pro DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Il modello Janus-Pro di DeepSeek eccelle nei compiti di comprensione e generazione multimodale. Di seguito viene presentata un'analisi dettagliata delle sue prestazioni:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Multimodal_understanding_performance\"><\/span>Prestazioni di comprensione multimodale<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- MMBench benchmark: L'Janus-Pro-7B ha ottenuto un punteggio di 79,2 nel benchmark MMBench per la comprensione multimodale, superando i modelli multimodali unificati allo stato dell'arte, tra cui Janus (69,4), TokenFlow (68,9) e MetaMorph (75,2).<\/p>\n\n\n\n<p>- Risposta alle domande visive: L'accuratezza di risposta alle domande visive dell'Janus-Pro supera quella del GPT-4V, identificando accuratamente i dettagli nelle immagini e rispondendo alle relative domande.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_command_tracking\"><\/span>Tracciamento dei comandi da testo a immagine<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Test di benchmark GenEval: Janus-Pro-7B ha ottenuto un'accuratezza complessiva di 80% nel test GenEval, superando significativamente altri modelli come DALL-E 3 (67%) e Stable Diffusion 3 Medium (74%).<\/p>\n\n\n\n<p>Comprensione di comandi complessi: Nel test DPG-Bench, l'Janus-Pro-7B ha ottenuto un eccellente punteggio di 84,19 punti ed \u00e8 stato in grado di generare con precisione scene complesse come \"una montagna innevata con un lago blu in cima\".<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Text-to-image_generation_performance\"><\/span>Prestazioni della generazione testo-immagine<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Qualit\u00e0 e stabilit\u00e0 delle immagini: Nonostante una risoluzione di uscita di 384\u00d7384, le immagini generate da Janus-Pro-7B presentano un elevato grado di realismo e ricchezza di dettagli, soprattutto quando si elaborano scene fantasiose e creative. \u00c8 in grado di comprendere con precisione le informazioni semantiche contenute nelle parole richieste e di generare immagini logicamente ragionevoli e coerenti.<\/p>\n\n\n\n<p>- Velocit\u00e0 di generazione: Janus-Pro supporta la generazione di immagini 4K su una singola scheda, 2 volte pi\u00f9 veloce di Stable Diffusion 3.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Model_architecture_and_training\"><\/span>Architettura del modello e formazione<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>- Disaccoppiamento della codifica visiva: Janus-Pro utilizza un metodo di codifica indipendente per convertire l'input originale in caratteristiche, che vengono poi elaborate da un trasformatore autoregressivo unificato per ottenere il disaccoppiamento della codifica visiva nei compiti di comprensione e generazione multimodale.<\/p>\n\n\n\n<p>- Dati di addestramento: Janus-Pro incorpora nell'addestramento 72 milioni di immagini sintetiche di alta qualit\u00e0 per garantire un rapporto 1:1 tra dati reali e sintetici. Aggiunge inoltre circa 90 milioni di campioni di dati di addestramento per la comprensione multimodale, migliorando in modo significativo le prestazioni del modello.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Scalability_and_deployment\"><\/span>Scalabilit\u00e0 e distribuzione<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Dimensioni del modello: La serie Janus-Pro offre modelli con dimensioni dei parametri 1B e 7B, che tengono conto delle prestazioni e dei costi di calcolo e sono adatti a un maggior numero di casi d'uso.<\/p>\n\n\n\n<p>Distribuzione minima: Janus-Pro \u00e8 rilasciato sotto licenza MIT, supporta l'uso commerciale e fornisce due versioni: 1.5B (richiede 16 GB di VRAM) e 7B (richiede 24 GB di VRAM), che possono essere eseguite su GPU standard.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Practical_application_scenarios_of_Janus_Pro_DeepSeek\"><\/span>Scenari di applicazione pratica di Janus Pro DeepSeek<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>I modelli multimodali di intelligenza artificiale, in particolare quelli da testo a immagine, hanno un grande potenziale di sviluppo nel settore commerciale. Dopo un lungo periodo di sviluppo, i modelli AI testo-immagine hanno gi\u00e0 fatto grandi progressi.<\/p>\n\n\n\n<p>Nello scenario pi\u00f9 comune della pubblicit\u00e0 o della cartellonistica, i designer o gli utenti possono utilizzare Janus pro per inserire una descrizione testuale e generare rapidamente manifesti di alta qualit\u00e0. L'iterazione dei prototipi di manifesti consente di risparmiare tempo nella progettazione e di migliorare l'efficienza creativa. Questo pu\u00f2 migliorare notevolmente l'efficienza dei designer, che possono dedicare il loro tempo a cose pi\u00f9 significative.<\/p>\n\n\n\n<p>Oltre alla tradizionale cartellonistica o al design pubblicitario, nelle ambientazioni di gioco pi\u00f9 popolari al giorno d'oggi, il modello ai large pu\u00f2 anche aiutare i designer a generare scene di gioco, personaggi e oggetti in tempo reale, riducendo i costi e le difficolt\u00e0 di sviluppo e migliorando gli effetti visivi del gioco. Riteniamo che il modello ai large possa continuare a liberare il potenziale e l'immaginazione dei creatori, realizzando prodotti sempre pi\u00f9 interessanti.<\/p>\n\n\n\n<p>Oltre al campo del design, il modello multimodale avr\u00e0 un grande sviluppo anche in altri settori dell'apprendimento, dell'istruzione e nel campo professionale verticale della medicina.<\/p>\n\n\n\n<p>In futuro potremmo assistere alla nascita di altre applicazioni molto interessanti, in grado di migliorare notevolmente l'efficienza e la qualit\u00e0 della nostra vita.<\/p>\n\n\n\n<p>Nel frattempo, le caratteristiche open source di Janus-Pro (licenza MIT) e i metodi di implementazione minimi (supporta l'esecuzione su GPU standard) riducono ulteriormente la barriera all'ingresso, rendendolo ampiamente applicabile ai campi sopra citati.<\/p>\n\n\n\n<p>Ci\u00f2 consente a un maggior numero di utenti di partecipare allo sviluppo, in modo che pi\u00f9 persone possano migliorare queste funzioni e accrescere le capacit\u00e0 dell'intera comunit\u00e0.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"How_do_I_choose_the_right_version_of_Janus_Pro_DeepSeek_for_me\"><\/span>Come faccio a scegliere la versione di Janus Pro DeepSeek pi\u00f9 adatta a me?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>Janus-Pro \u00e8 open-sourced in due versioni: Janus-Pro-1B e Janus-Pro-7B. La scelta della versione dipende dalle esigenze specifiche, dalle risorse informatiche e dagli scenari applicativi. Di seguito sono riportati un confronto dettagliato e le raccomandazioni:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Applicable_scenarios\"><\/span>Scenari applicabili<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Applicazioni leggere: adatte all'uso su dispositivi mobili, nei browser o in ambienti con risorse limitate. Ci\u00f2 consente a un maggior numero di utenti di sperimentare le ultime novit\u00e0 di Janus pro.<\/p>\n\n\n\n<p>- Prototipazione rapida: \u00e8 adatta per sviluppare e testare rapidamente funzioni multimodali senza richiedere molte risorse di calcolo. Questo \u00e8 molto importante per gli appassionati di IA, che possono iterare rapidamente e scoprire i problemi incontrati nella ricerca senza richiedere molte risorse di calcolo.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Generazione di immagini di alta qualit\u00e0: \u00e8 adatto alle applicazioni che richiedono la generazione di immagini di alta qualit\u00e0 di scene complesse, come la progettazione pubblicitaria, lo sviluppo di giochi e la creazione artistica. Questo modello \u00e8 pi\u00f9 adatto a scenari di progettazione pi\u00f9 professionali, che richiedono capacit\u00e0 hardware pi\u00f9 potenti e capacit\u00e0 di calcolo pi\u00f9 elevate.<\/p>\n\n\n\n<p>- Comprensione di istruzioni complesse: adatta a scenari che richiedono l'elaborazione di istruzioni testuali complesse e la generazione di immagini accurate, come la realt\u00e0 virtuale (VR) e la realt\u00e0 aumentata (AR).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Deployment_requirements\"><\/span>Requisiti per la distribuzione<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p><strong>Janus-Pro-1B:<\/strong><\/p>\n\n\n\n<p>- Requisiti hardware: adatto all'esecuzione su dispositivi con risorse limitate, come le GPU che richiedono 16 GB di VRAM. Se avete solo una scheda grafica precedente, questa potrebbe essere pi\u00f9 adatta a voi.<\/p>\n\n\n\n<p>- Scenario applicativo: adatto all'esecuzione nel browser o alla distribuzione su dispositivi leggeri.<\/p>\n\n\n\n<p><strong>Janus-Pro-7B:<\/strong><\/p>\n\n\n\n<p>- Requisiti hardware: richiede risorse di calcolo pi\u00f9 elevate, come una GPU con 24 GB di VRAM. Questa soluzione \u00e8 pi\u00f9 adatta agli utenti con schede grafiche pi\u00f9 recenti.<\/p>\n\n\n\n<p>- Scenario applicativo: adatto all'esecuzione su GPU standard e a scenari che richiedono prestazioni elevate.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Summary\"><\/span>Sintesi<span class=\"ez-toc-section-end\"><\/span><\/h3>\n\n\n\n<p>Se lo scenario applicativo richiede un'elevata qualit\u00e0 dell'immagine e la comprensione di istruzioni complesse e si dispone di risorse di calcolo sufficienti, si consiglia l'Janus-Pro-7B.<\/p>\n\n\n\n<p>Se avete bisogno di una distribuzione leggera o di risorse informatiche limitate, vi consigliamo Janus-Pro-1B.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Community_support_and_resources\"><\/span>Supporto e risorse della comunit\u00e0<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n\n\n<p>DeepSeek offre agli sviluppatori un'ampia gamma di risorse e supporto:<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>La documentazione ufficiale fornisce descrizioni dettagliate dell'interfaccia API e guide tecniche, tra cui la messa a punto del modello, esercitazioni sulla distribuzione e altri contenuti.<\/li>\n\n\n\n<li>La comunit\u00e0 degli sviluppatori mette a disposizione forum e gruppi di discussione per facilitare lo scambio di esperienze tra gli sviluppatori. Vengono organizzate regolarmente sessioni di condivisione tecnica e hackathon.<\/li>\n\n\n\n<li>Il supporto tecnico fornisce servizi di assistenza tecnica professionale per risolvere i problemi riscontrati dagli utenti durante l'utilizzo.<\/li>\n<\/ol>","protected":false},"excerpt":{"rendered":"<p>Il modello open source a basso costo e ad alte prestazioni di deepseek \u00e8 diventato virale. Un gran numero di nuovi utenti si \u00e8 registrato sul sito web di deepseek, causando ripetutamente il crash del sito. Con il rapido sviluppo della tecnologia dell'intelligenza artificiale, i modelli linguistici di grandi dimensioni (LLM) stanno cambiando ogni aspetto del nostro lavoro e della nostra vita. Ma ha anche visto molti...<\/p>","protected":false},"author":2,"featured_media":704,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-698","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/posts\/698","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/comments?post=698"}],"version-history":[{"count":2,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/posts\/698\/revisions"}],"predecessor-version":[{"id":706,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/posts\/698\/revisions\/706"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/media\/704"}],"wp:attachment":[{"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/media?parent=698"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/categories?post=698"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/janusai.pro\/it\/wp-json\/wp\/v2\/tags?post=698"}],"curies":[{"name":"parola chiave","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}