Le Blog Amazon Web Services
Comment Decathlon automatise la génération de métadonnées pour 2,5 millions d’images avec Amazon Bedrock
L’accessibilité numérique n’est plus une option mais une obligation légale en Europe. Avec l’entrée en vigueur de la Loi européenne sur l’accessibilité (European Accessibility Act), les entreprises doivent s’assurer que leurs contenus en ligne sont accessibles à tous, y compris aux personnes en situation de handicap. Pour les détaillants disposant de vastes bibliothèques d’images, cette exigence représente un défi de taille : comment enrichir des millions d’images avec des descriptions textuelles pertinentes, tout en maîtrisant les coûts ?
Avec un chiffre d’affaires de 17 milliards de dollars et une médiathèque riche de 3 millions de média, Decathlon faisait face à un défi structurel majeur : comment transformer un vaste stock d’images en un capital exploitable, alors que l’absence de métadonnées précises rendait des milliers de visuels invisibles et donc inutilisables par les équipes ?
Si l’entrée en vigueur de la Loi européenne sur l’accessibilité a imposé une échéance de conformité, Decathlon a choisi de dépasser cette contrainte légale pour en faire un levier de transformation. L’enjeu n’était plus seulement de décrire des images pour répondre à une norme, mais de résoudre la problématique coûteuse de la « découvrabilité » des médias. En s’associant à Amazon Web Services (AWS) pour déployer une solution d’IA générative via Amazon Bedrock, Decathlon a visé un double objectif : garantir l’accessibilité universelle de ses contenus tout en faisant évoluer son système de gestion d’actifs numériques pour maximiser le réemploi des visuels et optimiser le retour sur investissement de chaque production graphique.
Le défi : conformité réglementaire et efficacité opérationnelle
Pour Decathlon, cette exigence réglementaire s’est croisée avec des défis opérationnels importants dans leur écosystème de gestion d’actifs numériques.
L’absence de métadonnées rendait difficile la recherche d’images spécifiques dans la vaste bibliothèque numérique de Decathlon, entraînant une sous-utilisation des actifs visuels et un retour sur investissement réduit de la production d’images. Avant le Générateur de Métadonnées, trouver les bonnes images de produits pour les campagnes était complexe et coûteux. Maintenant, les équipes Décathlon peuvent rapidement trouver exactement ce dont elles ont besoin en recherchant des éléments spécifiques comme ‘personne courant sous la pluie’ ou ‘gros plan de la semelle d’une chaussure de randonnée’ et obtenir instantanément des résultats pertinents”.
Exemple de génération automatique de métadonnées produit avec Amazon Bedrock
Génération de métadonnées alimentée par l’Intelligence Artifcielle
En collaboration avec l’équipe Prototyping and Cloud Engineering (PACE) d’AWS, Decathlon a développé le Générateur de Métadonnées, une solution innovante alimentée par l’Intelligence Artificielle (IA) qui utilise des Grands Modèles Multimodaux pour analyser automatiquement les images et générer des métadonnées complètes.
Le Générateur de Métadonnées utilise Amazon Bedrock avec plusieurs familles de modèles d’IA, notamment Amazon Nova et les variantes d’Anthropic’s Claude, pour traiter les images via une architecture serverless évolutive. Le système génère automatiquement du texte alternatif descriptif tout en créant simultanément des balises techniques et des mots-clés qui améliorent la recherche et les performances SEO sur les plateformes numériques de Decathlon.
L’orchestration du workflow s’appuie sur Apache Airflow via Amazon Managed Workflows for Apache Airflow (MWAA) pour coordonner le processus multi-étapes. Le système gère automatiquement les images en attente, crée des lots d’inférence, soumet les traitements à Amazon Bedrock batch inference et déclenche le post-traitement par lot dès que les résultats sont disponibles. Cette approche de traitement par lots réduit les coûts de 50% par rapport au traitement en temps réel, tout en permettant de traiter 25 000 images par jour, une capacité ajustable selon les besoins.
Architecture technique et mise en œuvre des services AWS
Le Générateur de Métadonnées emploie une architecture serverless construite sur les services AWS, conçue pour gérer le traitement d’images à l’échelle de l’entreprise tout en maintenant l’efficacité des coûts et la fiabilité opérationnelle.
L’architecture est centrée autour d’Amazon Bedrock comme moteur d’inférence IA principal, utilisant les familles de modèles Amazon Nova et Anthropic Claude pour l’analyse multimodale d’images. Les composants clés incluent une infrastructure serverless complète utilisant AWS Lambda, Amazon S3 et Amazon DynamoDB, orchestrée par Apache Airflow pour la gestion des tâches, avec un cadre d’intégration API REST pour la connectivité au système.
La chaîne de prétraitement implémente la validation du format des images, ainsi qu’un redimensionnement intelligent de la taille à 300×300 pixels par image, visant à optimiser les coûts de traitement, une résolution plus élevée n’apportant pas d’amélioration significative de la qualité ou de la fiabilité des descriptions selon les expérimentations menées.
Pour garantir la pertinence des métadonnées sur un volume aussi massif, l’approche ‘taille unique’ (one size fits all) a été refusée. L’équipe a segmenté la stratégie en deux flux distincts :
- Les images ‘Pratique Sportive’ (Lifestyle) : Ici, le focus est mis sur l’action, l’émotion et l’atmosphère.
- Les images ‘Packshot’ (Produit) : Pour celles-ci, la précision est non négociable. L’IA doit identifier avec exactitude les attributs techniques, le cadrage et les angles de vue.
La gestion des prompts contextuels s’adapte automatiquement au type de contenu traité. Le support multilingue intégré (anglais et français) permet de générer des métadonnées conformes aux exigences réglementaires dans les deux langues sans configuration supplémentaire.
L’orchestration et le suivi du workflow reposent sur une coordination via Apache Airflow avec des DAGs (Directed Acyclic Graphs) multi-étapes. Le système maintient un suivi d’état dans DynamoDB avec des transitions clairement définies, permettant une traçabilité de chaque image tout au long du flux de traitement. La gestion intelligente de la capacité d’Amazon Bedrock respecte la limite de traitements concurrents en optimisant la soumission des lots pour maximiser le débit sans surcharger le service. Le monitoring Amazon CloudWatch fournit une observabilité complète avec des métriques en temps réel sur les volumes de traitement, les taux d’erreur et les performances, essentielles pour les opérations de production.
Schéma d’architecture : Générateur de Métadonnées avec Amazon Bedrock
Résultats commerciaux mesurables et performance
Le prototype du Générateur de Métadonnées a dépassé les attentes à travers plusieurs critères d’évaluation, démontrant à la fois l’excellence technique et une valeur commerciale significative. La solution a atteint des taux de validation jusqu’à 93% à travers différents évaluateurs et catégories d’images, bien au-dessus de l’objectif ajusté de 80% de précision tout en maintenant les objectifs d’efficacité des coûts.
L’implémentation a démontré une remarquable efficacité des coûts, avec des coûts de traitement allant de 1 $ pour Amazon Nova Lite à 50 $ pour Claude Sonnet 4.5 pour 25 000 images. L’architecture de traitement par lots a validé avec succès la capacité à répondre aux volumes hebdomadaires cibles de 25 000 images tout en maintenant des normes de qualité cohérentes et une fiabilité opérationnelle.
Le calcul du ROI englobe plusieurs flux de valeur qui justifient collectivement l’investissement. Outre l’évitement des pénalités de non-conformité à la Loi européenne sur l’accessibilité, la solution permet environ 1,2 million d’euros d’économies annuelles grâce à une meilleure utilisation des actifs, réduisant les coûts de photographie en double en rendant les images existantes plus découvrables et réutilisables à travers les campagnes marketing.
Conclusion
En enrichissant automatiquement sa bibliothèque d’images avec des descriptions générées par l’IA, Decathlon a non seulement répondu aux exigences d’accessibilité, mais a également débloqué des bénéfices concrets et mesurables : Les équipes peuvent désormais retrouver rapidement les visuels dont elles ont besoin grâce à des métadonnées riches et précises, augmentant ainsi leur productivité et réduisant le temps consacré à la recherche d’assets. Les descriptions générées enrichissent le contenu textuel associé aux images, améliorant la visibilité des produits Decathlon sur les moteurs de recherche et contribuant directement à la performance commerciale en ligne.
Cette fondation technique permet déjà d’explorer de nouveaux cas d’usage internes, comme l’identification de la présence de mannequins reconnaissables, elle est surtout taillée pour changer d’échelle. Decathlon dispose désormais du socle technologique nécessaire pour envisager des traitements d’une toute autre ampleur, notamment l’extension de cette automatisation à d’autres analyses d’image mais aussi à l’intégralité des millions d’images de sa Marketplace, un défi impossible à relever sans cette maîtrise de l’IA à l’échelle industrielle.