DeepSeek a lancé Janus-Pro-7B, dépassant DALL-E 3 et Stable Diffusion en matière de capacités de génération d'images

La société chinoise DeepSeek a introduit son nouveau réseau de neurones multimodal, Janus-Pro-7B, conçu pour une reconnaissance et une génération d'images efficaces. Par rapport aux versions précédentes, le nouveau modèle a été considérablement amélioré : les algorithmes d'entraînement ont été optimisés, le jeu de données élargi et la taille du modèle augmentée. Ces changements ont permis au réseau de neurones d'améliorer considérablement ses performances dans les tâches liées à la génération d'images à partir de descriptions textuelles et à l'analyse d'images.

Janus-Pro-7B a surpassé des modèles bien connus comme DALL-E 3 et Stable Diffusion dans les tests GenEval et DPG-Bench. Ce réseau de neurones offre des niveaux élevés de détail et de réalisme dans la création d'images, ce qui en fait un concurrent solide face à d'autres solutions. Le modèle est déjà disponible sur la plateforme Hugging Face, et le code peut être téléchargé gratuitement depuis GitHub, permettant aux chercheurs et aux développeurs de contribuer à son développement.

Le post a été traduit Afficher l'original (EN)
0
Commentaires 0