Janus Pro AI
Janus Pro AI Egységes multimodális megértési és generálási modellek Deepseek által épített egységesített multimodális megértési és generálási modellek
Janus Pro a Janus című korábbi mű továbbfejlesztett változata. Konkrétan az Janus-Pro (1) optimalizált képzési stratégiát, (2) kibővített képzési adatokat és (3) nagyobb modellméretre való skálázást tartalmaz. Ezekkel a fejlesztésekkel, Janus-Pro jelentős előrelépést ér el mind a multimodális megértés, mind a szöveg-kép utasításkövetési képességek terén, miközben a szöveg-kép generálás stabilitását is növeli.

Deepseek Image Generator Janus Pro Ingyenes online (Janus AI)
Szöveg-kép generálás a Janus-Pro-7B(Janus AI)
Kérjük, legyen türelmes, mivel jelenleg nagy a forgalom. O(∩_∩)O, Flux modellek A képminőség jobb, mint az Janus Pro, de nem rendelkezik Multimodel megértéssel. Ha szeretné tesztelni, akkor próbálja ki a Flux itt : FLux Dev A 。Janus Pro AI ideális a szöveg és a képek közötti interakciót igénylő feladatokhoz, míg a Flux kiválóan alkalmas kiváló minőségű képek gyors előállítására. A kettő közötti választás a konkrét igényektől függ.
Multimodális megértés Janus-Pro-7B (Janus AI)
Janus Pro 1B (Janus AI) fut a böngésződben







Az Janus Pro (Janus AI) jellemzője
Egységes multimodális architektúra Az Janus Pro
Engedélyezi a kétirányú képmegértés és képgenerálás egy autoregresszív keretrendszeren keresztül, egységes Transformer-architektúrával. A rugalmasság és a teljesítmény növelése érdekében szétválasztott vizuális kódolási útvonalakkal rendelkezik.
Modellközi teljesítménybeli fölény az Janus Pro
Túlszárnyalja az olyan vezető modelleket, mint a DALL-E 3 és a Stable Diffusion a benchmarkokban (pl, GenEval pontszám 0.80 vs. DALL-E 3 0.67), kiválóan teljesítve a szöveg-kép utasításkövetési feladatokban.
Nyílt forráskódú kompatibilitás Janus AI
Ajánlatok 1B/7B paraméterváltozatok MIT licenc alatt, a gyors telepítés és testreszabás érdekében az Hugging Face és a GitHub oldalon található. Támogatja a korlátlan kereskedelmi felhasználást.
Látásfeldolgozási specifikációk Janus AI
Feldolgozza a képeket a 384×384 felbontás, integrálva a SigLIP-L látáskódoló és MLP-adapterek a funkciókinyerés és a feladatváltás hatékonyságának optimalizálása érdekében.
Költséghatékony skálázhatóság Az Janus Pro
Kombinálja a könnyű, 7B paraméteres kialakítás versenyképes árképzéssel (az OpenAI modellekkel szemben), csökkentve a számítási erőforrás-fogyasztást a kereskedelmi elfogadáshoz.
Optimalizált képzési keretrendszer Az Janus Pro
A honlapon található tőkeáttétel. kibővített adatkészletek és a stabilitás-növelő képzési technikák a kimeneti pontosság javítására, bár a finom részletek helyreállításánál (pl. OCR-feladatok) a felbontási korlátok miatt korlátozottak.
hol lehet letölteni az Janus Pro modellt By Deepseek
A Janus-t a nyilvánosság számára is elérhetővé tesszük, hogy szélesebb körű és változatosabb kutatást támogassunk mind a tudományos, mind a kereskedelmi közösségekben. Felhívjuk figyelmét, hogy e modell használatára a Janus Janusban foglalt feltételek vonatkoznak. Licenc szakasz. A kereskedelmi felhasználás ezen feltételek mellett megengedett.
letöltheti az Janus Pro-t az Huggingface oldalról
Modell | Sorozat hossza | Letöltés |
---|---|---|
Janus-1.3B | 4096 | 🤗 Ölelő arc |
JanusFlow-1.3B | 4096 | 🤗 Ölelő arc |
Janus Pro-1B | 4096 | 🤗 Ölelő arc |
Janus Pro-7B | 4096 | 🤗 Ölelő arc |
Az Janus Pro (Janus AI) erőforrásai
Github az Janus Pro-ről
Janus-sorozat: Egységes multimodális megértési és generálási modellek
Az Janus Pro papírja
Github a ComfyUI Janus Pro
ComfyUI csomópontok az Janus-Pro-hez, egy egységes multimodális megértési és generálási keretrendszerhez.
Flux képgenerátor
Flux nem rendelkezik MultiModel Understanding ,de a minőség jobb

Mi az a Janus AI és az Janus Pro?
A Janus egy újszerű autoregresszív keretrendszer, amely egyesíti a deepseek által felépített multimodális megértést és generációt. A korábbi megközelítések korlátait a vizuális kódolás külön utakra történő szétválasztásával kezeli, miközben a feldolgozáshoz egyetlen, egységes transzformátor-architektúrát használ. A szétválasztás nemcsak a vizuális kódoló megértésben és generálásban betöltött szerepe közötti konfliktust enyhíti, hanem a keretrendszer rugalmasságát is növeli.
Janus Pro papír
Ezen a héten bemutatjuk az Janus Pro-t, a Janus AI korábbi munkájának továbbfejlesztett változatát. Ez nagy teljesítményű a multimodell megértésében és generálásában. kattintson a részletek megtekintéséhez

Mi a JanusFlow (Janus AI )
JanusFlow olyan minimalista architektúrát mutat be, amely az autoregresszív nyelvi modelleket és a generatív modellezés legkorszerűbb módszerét, az egyengetett áramlást integrálja.
Blog és hírek az Janus Pro-ről (Janus AI)

Mélyreható elemzés: Milyen újításokkal rendelkezik a DeepSeek újonnan megjelent Janus-Pro?
A DeepSeek frissítette weboldalát. Szilveszter kora estéjén a DeepSeek hirtelen bejelentette a GitHubon, hogy a Janus projektterületen megnyitotta az Janus-Pro modell és a technikai jelentés forrását. Először is emeljünk ki néhány kulcsfontosságú pontot: Az iparág nehéz problémáját hivatott megoldani: a multimodális megértés és a képgenerálás egyensúlyban tartása szerint a...

Mennyire jó a DeepSeek Janus-Pro?
A tavaszi fesztivál előestéjén megjelent a DeepSeek-R1 modell. Tiszta RL-architektúrájával tanult a CoT nagyszerű innovációiból, és matematikában, kódban és logikai következtetésekben felülmúlja a ChatGPT-t. Emellett nyílt forráskódú modellsúlyai, alacsony képzési költségei és olcsó API-árai miatt a DeepSeek az egész internetet bejárta, sőt...

Az NVIDIA és a Microsoft elsőként integrálja a Deepseek-et, míg az OpenAI sürgősen 280 milliárdos új finanszírozást gyűjt.
Nyílt AI sürgős finanszírozás A DeepSeek hatásával a Szilícium-völgy túl izgalmas. Tegnap még az OpenAI és az Anthropic állt az élen, és minden lehetséges eszközzel megpróbáltak megbuktatni a versenytársakat. Egyik napról a másikra az infrastruktúra-szolgáltatók hirtelen "nagyon érdeklődővé" váltak. A Microsoft után az NVIDIA és az AWS is felgyorsította a DeepSeek modell hostingjának elindítását...
Mit beszélnek az emberek az Janus Pro-ről és a Janus AI-ról?
BREAKING: A DeepSeek hivatalosan is bejelent egy újabb nyílt forráskódú mesterséges intelligencia modellt, az Janus-Pro-7B-t.
- A Kobeissi levél (@KobeissiLetter) január 27, 2025
Ez a modell képeket generál, és több benchmarkban is veri az OpenAI DALL-E 3 és Stable Diffusion modelljét. pic.twitter.com/FSJkelcaYP
Hűha.
- Min Choi (@minchoi) január 27, 2025
A DeepSeek most dobta piacra az Janus-Pro-7B-t, egy nyílt forráskódú multimodális AI-t, amely legyőzi a DALL-E 3-at és a Stable Diffusiont.
A 🐋 lángol. 👀 pic.twitter.com/Vy9V7P2FLP
Az új Deepseek-Janus-Pro-7B frissítés őrületes! (INGYENES!) 🤯 pic.twitter.com/pVjnlpTQi9
- Julian Goldie SEO (@JulianGoldieSEO) január 28, 2025
A DeepSeek tüzet fogott! 🔥 Most adták ki az Janus Pro-t: egy multimodális LLM, amely képes vizuális megértésre és képgenerálásra! 🤯
- Xenova (@xenovacom) január 27, 2025
Az 1B modell még a böngészőben is futtatható WebGPU-n, a 🤗 Transformers.js segítségével!
Ez a legegyszerűbb módja a helyi futtatásnak: csak látogasson el egy weboldalra! pic.twitter.com/yjfS0ktqB6
A DeepSeek tehát egy nyílt forráskódú multimodális modellt dobott piacra, amely képmegértést és generálást végez "Janus-Pro-7B" néven.
- Nomaditsu (@nomaditsu) január 27, 2025
Az emberek az X-en azt mondták, hogy veri a Dalle-3-at, így meg kellett adnom neki egy pörgést.
Sajnos úgy gondolom, hogy a hype túlzás volt:
Balra: Janus-Pro-7B. Jobbra: Dalle-3 pic.twitter.com/Ienru7r8KD
Janus-Pro-7B 初见面!!!做了版 Colab 初测了下 DeepSeek 新开源的多模态统一模型
-Zho- (@ZHO_ZHO_ZHO_ZHO) január 27, 2025
1)模型直接支持中文交互(图像理解+图像生成
2)云上 L4 测试,显存需 22GB
3)图像生成速度:约15s/张
4)图像理解质量:文字和信息识别基本准确,内容理解完整清晰,局部细节有欠缺
由于 Gradio 界面比较... https://t.co/ZB3kghXIFA pic.twitter.com/idJ7HNcr79
Az Janus Pro (Janus AI) árazása
A most nyílt forráskódú
$0/mo
Gyakran ismételt kérdések a deepseek Janus AI-ról
Minden, amit tudni kell a Janus Pro és Janus AI
Janus Pro egy fejlett, egységes multimodális mesterséges intelligenciamodell, amely egyesíti a képmegértési és képgenerálási képességeket. A hagyományos modellekkel ellentétben, Janus Pro optimalizált képzési stratégiát, kibővített képzési adatokat és nagyobb modell skálázást tartalmaz, így jobb, mint a korábbi verziók. Janus AI mind a multimodális megértési, mind a szöveg-kép generálási feladatokban.
Janus Pro forradalmian új, szétválasztott vizuális kódolási rendszerrel rendelkezik, amely szétválasztja a megértési és a generálási utakat, miközben fenntartja az egységes Transformer architektúrát. Ez az innovatív megközelítés a Janus AI lehetővé teszi, hogy a modell mind a kép-szöveg, mind a szöveg-kép feladatokat hatékonyabban dolgozza fel, mint a hagyományos egyutas rendszerek.
A benchmark tesztek szerint, Janus Pro felülmúlja az olyan vezető modelleket, mint a DALL-E 3 és a Stable Diffusion. A Janus Pro modell 0,80-as GenEval pontszámot ért el a DALL-E 3 0,67-es értékével szemben, ami a szöveg-kép utasításkövetési feladatokban nyújtott kiváló teljesítményt bizonyítja.
Janus Pro két fő változatban érhető el: Janus Pro-7B (7 milliárd paraméter) és Janus Pro-1B (1,5 milliárd paraméter). Mindkét változat része a Janus AI ökoszisztémát, és nyílt forráskódúak az MIT licenc alatt, így mind a kutatási, mind a kereskedelmi alkalmazások számára elérhetővé válnak.
Janus Pro és a tágabb értelemben vett Janus AI keretrendszert kereskedelmi felhasználásra tervezték MIT licencükkel, amely korlátlan módosítást és telepítést tesz lehetővé. A modell hatékony architektúrája és az alternatívákhoz képest versenyképes árazása vonzó választássá teszi a mesterséges intelligencia megoldásokat bevezető vállalkozások számára.