خاصية Janus Pro
بنية موحدة متعددة الوسائط من Janus Pro
تمكين ثنائي الاتجاه فهم الصور وتوليدها عبر إطار عمل ذاتي الانحدار مع بنية محول موحد. يتميز بمسارات ترميز مرئية منفصلة لتعزيز المرونة والأداء.
التفوق في الأداء عبر الطرازات من Janus Pro
يتفوق في الأداء على النماذج الرائدة مثل DALL-E 3 و Stable Diffusion في المعايير (على سبيل المثال, درجة تقييم الجينات 0.80 مقابل 0.67 في DALL-E 3)، متفوقًا في مهام تتبع التعليمات من النص إلى الصورة.
التوافق مفتوح المصدر من جانوس للذكاء الاصطناعي
العروض متغيرات المعلمات 1B/7B بموجب ترخيص MIT، مستضاف على Hugging Face و GitHub للنشر والتخصيص السريع. يدعم الاستخدام التجاري غير المقيد.
مواصفات معالجة الرؤية من جانوس للذكاء الاصطناعي
معالجة الصور في دقة 384 × 384×384دمج مشفر الرؤية SigLIP-L ومحولات MLP لتحسين استخراج الميزات وكفاءة تبديل المهام.
قابلية التوسع الفعالة من حيث التكلفة من Janus Pro
يجمع بين تصميم خفيف الوزن 7B-بارامتر 7B مع تسعير تنافسي (مقابل نماذج OpenAI)، مما يقلل من استهلاك الموارد الحاسوبية للتبني التجاري.
إطار التدريب الأمثل من Janus Pro
الرافعة المالية مجموعات البيانات الموسعة وتقنيات التدريب المعززة للاستقرار لتحسين دقة الإخراج، على الرغم من أنها محدودة بسبب قيود الدقة في استعادة التفاصيل الدقيقة (مثل مهام التعرف الضوئي على الحروف).





