Az Janus Pro jellemzője
Egységes multimodális architektúra Az Janus Pro
Engedélyezi a kétirányú képmegértés és képgenerálás egy autoregresszív keretrendszeren keresztül, egységes Transformer-architektúrával. A rugalmasság és a teljesítmény növelése érdekében szétválasztott vizuális kódolási útvonalakkal rendelkezik.
Modellközi teljesítménybeli fölény az Janus Pro
Túlszárnyalja az olyan vezető modelleket, mint a DALL-E 3 és a Stable Diffusion a benchmarkokban (pl, GenEval pontszám 0.80 vs. DALL-E 3 0.67), kiválóan teljesítve a szöveg-kép utasításkövetési feladatokban.
Nyílt forráskódú kompatibilitás Janus AI
Ajánlatok 1B/7B paraméterváltozatok MIT licenc alatt, a gyors telepítés és testreszabás érdekében az Hugging Face és a GitHub oldalon található. Támogatja a korlátlan kereskedelmi felhasználást.
Látásfeldolgozási specifikációk Janus AI
Feldolgozza a képeket a 384×384 felbontás, integrálva a SigLIP-L látáskódoló és MLP-adapterek a funkciókinyerés és a feladatváltás hatékonyságának optimalizálása érdekében.
Költséghatékony skálázhatóság Az Janus Pro
Kombinálja a könnyű, 7B paraméteres kialakítás versenyképes árképzéssel (az OpenAI modellekkel szemben), csökkentve a számítási erőforrás-fogyasztást a kereskedelmi elfogadáshoz.
Optimalizált képzési keretrendszer Az Janus Pro
A honlapon található tőkeáttétel. kibővített adatkészletek és a stabilitás-növelő képzési technikák a kimeneti pontosság javítására, bár a finom részletek helyreállításánál (pl. OCR-feladatok) a felbontási korlátok miatt korlátozottak.





