Janus Pro의 특징

통합 멀티모달 아키텍처 Janus Pro 중

양방향 사용 이미지 이해 및 생성 통합 트랜스포머 아키텍처의 자동 회귀 프레임워크를 통해 지원합니다. 유연성과 성능을 향상시키기 위해 분리된 시각적 인코딩 경로를 제공합니다.

모델 간 성능 우위 Janus Pro의

벤치마크에서 DALL-E 3 및 Stable Diffusion과 같은 주요 모델보다 우수한 성능을 발휘합니다(예, GenEval 점수 0.80점 대 DALL-E 3의 0.67점), 텍스트-대-이미지 지침을 따르는 작업에 탁월합니다.

오픈 소스 호환성 야누스 AI의

오퍼 1B/7B 매개변수 변형 신속한 배포와 커스터마이징을 위해 Hugging Face와 GitHub에서 호스팅되는 MIT 라이선스에 따라 제공됩니다. 제한 없는 상업적 사용을 지원합니다.

비전 처리 사양 야누스 AI의

다음에서 이미지를 처리합니다. 384×384 해상도를 통합하여 SigLIP-L 비전 인코더 및 MLP 어댑터를 사용하여 특징 추출 및 작업 전환 효율성을 최적화합니다.

비용 효율적인 확장성 Janus Pro 중

결합 경량 7B 매개변수 설계 경쟁력 있는 가격(OpenAI 모델 대비)으로 상업적 도입을 위한 컴퓨팅 리소스 소비를 줄입니다.

최적화된 교육 프레임워크 Janus Pro 중

레버리지 확장된 데이터 세트 및 안정성이 강화된 훈련 기법을 사용하여 출력 정확도를 향상시키지만, 미세한 디테일 복원(예: OCR 작업)의 해상도 제약으로 인해 제한됩니다.

지금 바로 무료 계정을 만드세요!