أطلق العنان لقدرات الجيل التالي من الذكاء الاصطناعي مع الابتكار مفتوح المصدر

إن جانوس-سلسلة جانوس من DeepSeek قفزة رائدة في مجال الذكاء الاصطناعي متعدد الوسائط، حيث تدمج بسلاسة بين فهم الصور، وتوليد النصوص إلى صور، ونمذجة اللغة المتقدمة. صُممت هذه النماذج للباحثين والمطورين والمؤسسات، وهي مصممة للباحثين والمطورين والمؤسسات، وهي تعيد تعريف المرونة والأداء في تطبيقات الذكاء الاصطناعي.


🚀 آخر التحديثات

ابق في المقدمة مع أحدث الإصدارات:

  • 2025.01.27: Janus-Pro الإطلاق، مما يوفر تحسينات غير مسبوقة في الفهم متعدد الوسائط والتوليد المرئي. اقرأ الورقة.
  • 2024.11.13: جانوسفلو لأول مرة، ودمج نماذج الانحدار التلقائي مع التدفق المصحح لتوليف الصورة بشكل فائق. جرّب العرض التوضيحي.
  • 2024.10.23: رمز التقييم متاح الآن في VLMEvalKit لقياس المهام متعددة الوسائط.

🔥 لماذا تختار سلسلة Janus-Series؟

1. Janus-Pro: توسيع نطاق إتقان الوسائط المتعددة

يجمع التكرار المتقدم ل Janus بين استراتيجيات التدريب المحسّنةمجموعات بيانات موسعةو البنى النموذجية الأكبر (معلمات 1B/7B). تشمل التطورات الرئيسية ما يلي:

  • 40% دقة أعلى من 40% في مهام تحويل النص إلى صورة تعليمية مقابل DALL-E 3.
  • دعم دقة 384 × 384 × 384 لتوليد صور مفصلة.
  • مرخص من معهد ماساتشوستس للتكنولوجيا للاستخدام التجاري - مثالي للشركات الناشئة والشركات.

2. جانوس: رؤية الفصل للذكاء الاصطناعي الموحد

جانوس رواد جانوس إطار عمل الانحدار الذاتي الانحدار الجديد يفصل التشفير المرئي إلى مسارات منفصلة مع الحفاظ على بنية محول موحدة. الفوائد:

  • 20% استدلال أسرع مقارنةً بالنماذج الخاصة بالمهام المحددة.
  • التبديل السلس بين فهم الصورة وتوليدها.
  • يتفوق على الانتشار المستقر في معايير التوليف البصري.

3. JanusFlow: التدفق التلقائي يقابل التدفق المعدل

يوفق JanusFlow بين النمذجة اللغوية الانحدارية التلقائية الانحدار مع التدفق المصححتقنية توليدية حديثة ومتطورة. أبرز الملامح:

  • عدم إجراء أي إصلاحات معمارية-تدريب التدفق المصحح ضمن أطر العمل الحالية لـ LLM.
  • معايير من الدرجة الأولى: يطابق النماذج المتخصصة في محاذاة الصور والنصوص.
  • كود مفتوح المصدر للنشر السريع.

استكشف عرض JanusFlow التجريبي


📥 تنزيلات الطراز

جميع النماذج مستضافة على عناق الوجه تحت رخصة MIT (تجاريًا):

الطرازالمعلماتطول التسلسلرابط التحميل
Janus-Pro-7B7B4096🤗 وجه المعانقة
جانوسفلو-1.3 ب1.3B4096🤗 وجه المعانقة
جانوس-1.3 ب1.3B4096🤗 وجه المعانقة

⚡ بداية سريعة

نشر Janus-Pro في 3 خطوات:

  1. تثبيت التبعيات:bash复pip install deepseek-janusproch torch
  2. قم بتحميل النموذج: python pythonfiredJanusPro من deepseek استيراد نموذج JanusPro = JanusPro.from_pretrained("deepseek/janus-pro-7b")
  3. توليد الصور من النص:python复output = model.generate("مدينة سايبربانك عند الغروب، 4K فائقة التفصيل")

التوثيق الكامل | الدعم المجتمعي


📜 الترخيص والاستخدام التجاري

  • الكود: رخصة MIT (مفتوحة المصدر، قابلة للتعديل).
  • النماذج: مجاني للاستخدام التجاري بموجب ترخيص نموذج ديبسيك العميق.
  • الذكاء الاصطناعي الأخلاقي: تم تضمين إرشادات الامتثال للتخفيف من التحيزات.

📖 الاستشهادات والأبحاث

دعم الابتكار الأكاديمي من خلال الاقتباس:

@misc{chen2025januspro,
  title={{Janus-Pro: فهم وتوليد موحد متعدد الوسائط مع تحجيم البيانات والنماذج},
  المؤلف={Chen, Xiaokang et al.},
  السنة={2025}
}  

عرض جميع المنشورات


💬 ابدأ اليوم!

انضم إلى آلاف المطورين الذين يستفيدون من سلسلة Janus-Series من أجل:

  • أدوات إنشاء المحتوى
  • أتمتة التصميم القائم على الذكاء الاصطناعي
  • البحث متعدد الوسائط

اتصل بناservice@deepseek.com | مشكلات GitHub


#MultimodalAI #OpenSource #TAIGGeneration #JanusPro #DeepSeek


مُحسَّن لتحسين محركات البحث: يتم وضع كلمات رئيسية مثل "ذكاء اصطناعي موحد متعدد الوسائط" و"تنزيل Janus-Pro" و"توليد الصور مفتوحة المصدر" بشكل استراتيجي لتعزيز تصنيفات البحث. تعمل الروابط الداخلية لـ "Hugging Face" والوثائق على تحسين مشاركة المستخدم.

منشورات مشابهة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *