Janus Pro 的特點
統一多模式架構 Janus Pro 的
啟用雙向 影像理解與產生 透過具有統一 Transformer 架構的自回歸框架。具有解耦視覺編碼路徑的功能,可提高彈性和效能。
跨機型性能優勢 的 Janus Pro
在基準測試中優於 DALL-E 3 和 Stable Diffusion 等領先機型(例如、 GenEval 得分 0.80 對比《DALL-E 3》的 0.67),在文本到圖像的指令跟蹤任務中表現優異。
開放原始碼相容性 的 Janus AI
優惠 1B/7B 參數變異 採用 MIT 授權,託管於 Hugging Face 與 GitHub,以便快速部署與客製化。支援不受限制的商業使用。
視覺處理規格 的 Janus AI
以下列速度處理影像 384×384 解析度,整合 SigLIP-L 視訊編碼器 和 MLP 適配器,以優化特徵萃取和任務切換效率。
具成本效益的擴充性 Janus Pro 的
組合 輕量級 7B 參數設計 具有競爭力的價格(相對於 OpenAI 模型),減少商業採用的計算資源消耗。
最佳化訓練架構 Janus Pro 的
槓桿 擴展資料集 和穩定性增強訓練技術,以提高輸出精確度,儘管在細節恢復(例如 OCR 任務)中受到解析度的限制。





