Fitur Janus Pro
Arsitektur Multimoda Terpadu Dari Janus Pro
Mengaktifkan dua arah pemahaman dan pembuatan gambar melalui kerangka kerja autoregresif dengan arsitektur Transformer terpadu. Dilengkapi dengan jalur pengkodean visual yang terpisah untuk meningkatkan fleksibilitas dan performa.
Keunggulan Kinerja Lintas Model dari Janus Pro
Mengungguli model-model terkemuka seperti DALL-E 3 dan Stable Diffusion dalam tolok ukur (mis, Skor GenEval 0,80 vs 0,67 dari DALL-E 3), unggul dalam tugas mengikuti instruksi teks-ke-gambar.
Kompatibilitas Sumber Terbuka dari Janus AI
Penawaran Varian parameter 1B/7B di bawah lisensi MIT, dihosting di Hugging Face dan GitHub untuk penyebaran dan penyesuaian yang cepat. Mendukung penggunaan komersial tanpa batas.
Spesifikasi Pemrosesan Visi dari Janus AI
Memproses gambar di Resolusi 384×384, mengintegrasikan Penyandi penglihatan SigLIP-L dan adaptor MLP untuk mengoptimalkan ekstraksi fitur dan efisiensi pengalihan tugas.
Skalabilitas yang Hemat Biaya Dari Janus Pro
Menggabungkan desain 7B-parameter yang ringan dengan harga yang kompetitif (vs model OpenAI), mengurangi konsumsi sumber daya komputasi untuk adopsi komersial.
Kerangka Kerja Pelatihan yang Dioptimalkan Dari Janus Pro
Leverage kumpulan data yang diperluas dan teknik pelatihan yang ditingkatkan stabilitasnya untuk meningkatkan akurasi output, meskipun dibatasi oleh batasan resolusi dalam pemulihan detail halus (misalnya, tugas OCR).





