DeepSeek dévoile Janus-Pro, un générateur d’images IA libre et puissant

DeepSeek continue son ascension fulgurante avec Janus-Pro, un générateur d’images IA open source qui prétend surpasser DALL-E 3. Qualité d’image, flexibilité et multimodalité : cette nouvelle solution chinoise va-t-elle bouleverser le paysage de l’IA générative ? Découvrez ses atouts et ses limites.

Par Zineb Mouhoubi Publié le 02/02/2025 à 16:35
Janus-Pro
DeepSeek dévoile Janus-Pro, un générateur d’images IA libre et puissant © Point GPhone

La startup chinoise DeepSeek poursuit son ascension avec le lancement de Janus-Pro, un modèle d’intelligence artificielle dédié à la génération d’images. Présenté comme une alternative à DALL-E 3 et Stable Diffusion, cet outil mise sur une approche multimodale et une accessibilité ouverte pour séduire développeurs et créateurs.

 Janus-Pro de DeepSeek : un acteur émergent dans l’IA générative

DeepSeek s’est récemment imposée comme une entreprise clé du secteur de l’intelligence artificielle avec le lancement de son modèle de langage R1. Ce chatbot ultra-performant a connu un succès rapide, notamment aux États-Unis où son application mobile a surpassé ChatGPT dans les classements de l’App Store. Fort de cette reconnaissance, DeepSeek élargit son offre avec Janus-Pro, un générateur d’images conçu pour concurrencer les outils établis comme DALL-E 3 d’OpenAI et Stable Diffusion XL.

L’arrivée de Janus-Pro s’inscrit dans un contexte où la demande pour des modèles d’IA générative toujours plus performants et accessibles est en forte croissance. Contrairement à d’autres acteurs qui limitent l’accès à leurs modèles, DeepSeek propose une licence MIT, permettant une utilisation commerciale sans restriction. Cette stratégie vise à accélérer l’adoption de son modèle par la communauté des développeurs et à encourager l’innovation.

Une approche multimodale et des performances prometteuses

Janus-Pro se distingue des autres générateurs d’images par son architecture multimodale. En plus de produire des images à partir de descriptions textuelles, le modèle peut également analyser des images existantes, ce qui ouvre des perspectives pour des applications avancées en vision par ordinateur.

Techniquement, Janus-Pro est décliné en plusieurs versions, avec des modèles allant de 1 à 7 milliards de paramètres. Selon DeepSeek, la version la plus avancée, Janus-Pro-7B, surpasse DALL-E 3 et d’autres concurrents sur des benchmarks comme GenEval et DPG-Bench. Ce résultat est d’autant plus remarquable que les modèles de DeepSeek sont optimisés pour fonctionner sur du matériel moins avancé, une contrainte imposée par les restrictions d’accès aux puces IA de dernière génération.

Cependant, quelques limites sont relevées par les premiers testeurs. La résolution maximale des images générées est actuellement restreinte à 384 x 384 pixels, ce qui pourrait freiner certaines applications. De plus, bien que le modèle affiche de bonnes performances en compréhension textuelle et en fidélité des images, certains utilisateurs estiment que la qualité graphique reste en deçà des standards actuels.

Un accès ouvert et une adoption en cours

Contrairement à d’autres modèles propriétaires, Janus-Pro est disponible en libre accès sur des plateformes comme Hugging Face, facilitant ainsi son intégration par les développeurs et chercheurs en IA. Cette accessibilité vise à encourager les expérimentations et les améliorations communautaires, un modèle similaire à celui adopté par Stable Diffusion.

DeepSeek met en avant un cadre autoregressif innovant, qui sépare les étapes de compréhension et de génération d’images pour améliorer la flexibilité et la précision du modèle. Cette approche permettrait notamment de résoudre certaines limites rencontrées par les précédentes générations de générateurs d’images.

L’impact de Janus-Pro sur le marché de l’IA générative dépendra de l’adhésion des développeurs et des créateurs de contenu, ainsi que des améliorations futures apportées au modèle. Pour l’instant, DeepSeek confirme son ambition de rivaliser avec les acteurs dominants du secteur et d’imposer sa propre vision d’une IA générative accessible et performante.

Passionnée de technologie, je décrypte l'univers des smartphones et des innovations récentes. Mon objectif est simple : partager des analyses et des conseils pour aider chacun à naviguer dans cet écosystème en constante évolution.

Aucun commentaire à «DeepSeek dévoile Janus-Pro, un générateur d’images IA libre et puissant»

Laisser un commentaire

Les Commentaires sont soumis à modération. Seuls les commentaires pertinents et étoffés seront validés. - * Champs requis