功能 - JanusAI.Pro

Janus Pro 的特點

啟用雙向 影像理解與產生 透過具有統一 Transformer 架構的自回歸框架。具有解耦視覺編碼路徑的功能，可提高彈性和效能。

在基準測試中優於 DALL-E 3 和 Stable Diffusion 等領先機型（例如、 GenEval 得分 0.80 對比《DALL-E 3》的 0.67)，在文本到圖像的指令跟蹤任務中表現優異。

優惠 1B/7B 參數變異 採用 MIT 授權，託管於 Hugging Face 與 GitHub，以便快速部署與客製化。支援不受限制的商業使用。

以下列速度處理影像 384×384 解析度，整合 SigLIP-L 視訊編碼器 和 MLP 適配器，以優化特徵萃取和任務切換效率。

組合 輕量級 7B 參數設計 具有競爭力的價格（相對於 OpenAI 模型），減少商業採用的計算資源消耗。

槓桿 擴展資料集 和穩定性增強訓練技術，以提高輸出精確度，儘管在細節恢復（例如 OCR 任務）中受到解析度的限制。