5 questions sur l'IA à un directeur technique : Oliver Grenet, Wedia

Cet article a été traduit de digitalassetmanagementnews.com

Cet article de fond fait partie d'une série rédigée par Paul Melcher, expert en technologie visuelle et fondateur du magazine en ligne Kaptur.

Dans le paysage numérique en évolution rapide d'aujourd'hui, l'intégration de l'IA générative dans les systèmes de gestion des actifs numériques transforme la façon dont nous gérons et utilisons le contenu visuel. Pour démystifier l'intersection entre l'IA et le DAM, nous lançons une série d'entretiens avec les CTO et les CPO des principales sociétés de DAM. Notre objectif est d'approfondir leurs expériences, leurs défis et leurs réussites dans la mise en œuvre de solutions d'IA génératives.

Tout au long de cette série, nous poserons les cinq mêmes questions à chaque leader, dans le but de découvrir des perspectives diverses et des approches innovantes. Nous lançons notre série avec Olivier Grenet, directeur technique chez Wedia, qui partage ses idées sur la façon dont Wedia est la pionnière en matière d'utilisation de l'IA générative pour améliorer ses capacités de DAM.

1. Wedia est l'un des premiers fournisseurs de DAM à mettre en œuvre des solutions d'IA génératives telles que le remplacement de l'arrière-plan et la recherche sémantique. Qu'est-ce qui vous a poussé à mettre en œuvre ces solutions d'IA alors que de nombreuses autres semblent hésiter ?

Chez Wedia, nous avons toujours considéré l'IA comme une technologie très pertinente pour le traitement de l'image et de la vidéo. Depuis le lancement de notre DAM, nous avons investi dans une équipe dédiée de data scientists et d'ingénieurs en IA qui travaillent en permanence sur ces sujets par le biais de POC et d'une intégration progressive à notre solution. Cette expertise nous a permis de suivre de près l'évolution des modèles liés à l'image et de traverser des phases de désillusion et de progrès.

Nos clients sont très désireux d'intégrer l'IA générative dans le DAM depuis la vulgarisation de Midjourney et d'autres modèles. Et comme nous avions eu des discussions continues avec eux sur ces sujets, l'équipe technique a immédiatement intégré cette demande dans son travail, avec des cas d'utilisation réels fournis par les clients pour aller au-delà de la phase de démonstration et répondre avec une GenAI qui répond à de vrais problèmes commerciaux.

2. Avez-vous des clients qui utilisent actuellement les solutions génératives basées sur l'IA de Wedia ? Pouvez-vous nous dire qui ils sont et comment ils utilisent ces solutions ? Si ce n'est pas le cas, pouvez-vous partager les commentaires des testeurs ?

Actuellement, nous proposons une version de test sur une branche distincte de Wedia qui intègre toutes nos avancées en matière d'IA générative. Cette version est accessible à certains de nos clients, bien que je ne puisse pas les nommer explicitement. Cependant, je peux partager les commentaires que nous avons reçus jusqu'à présent.

Tout d'abord, nous avons déployé beaucoup d'efforts pour améliorer le rendu des images. Les premiers modèles ont généré des rendus très synthétiques et presque « 3D », qui ne répondaient pas aux attentes de nos clients. Nous avons donc travaillé pour rétablir la colorimétrie et le respect des directives graphiques et photographiques de nos clients afin qu'ils correspondent le plus possible à leur identité visuelle. C'était notre premier défi majeur.

Le deuxième défi, demandé par nos clients, était de générer des images pour des besoins spécifiques plutôt que de manière générale. Nous sommes allés au-delà de la simple phase rapide en intégrant l'IA générative dans les processus métier. Par exemple, créer des versions locales d'une image à partir d'un kit « global » ou placer des produits dans des arrière-plans pré-approuvés par la marque, plutôt que de les générer de manière aléatoire à partir d'une invite.

3. Vous publiez des solutions d'IA une par une. Comment décidez-vous de la solution à publier en premier ? Quels critères utilisez-vous pour hiérarchiser ces implémentations ?

Nous avons complètement fait évoluer notre approche. Au départ, nous avons exploré tous les domaines possibles de l'IA, mais nous avons maintenant adopté une méthode beaucoup plus structurée pour décider des solutions à mettre en œuvre en premier.

Tout d'abord, nous effectuons des POC (Proof of Concept) sur les besoins commerciaux spécifiques signalés par nos clients afin de valider la faisabilité technique de la solution. Une fois la faisabilité validée, nous présentons ces POC aux clients pour les tester. Ce n'est qu'après avoir confirmé que les fonctionnalités répondent à un réel besoin commercial que nous passons à la phase de « découverte ».

Cette phase de découverte comprend une exploration approfondie de tous les domaines de recherche nécessaires, tels que l'interface utilisateur, l'expérience utilisateur et l'intégration des flux de travail. Nous créons des prototypes que nous présentons à nos clients afin de garantir que l'IA générative soit intégrée de manière intelligente et intuitive dans leurs processus métier.

4. Développez-vous des modèles d'IA en interne ou utilisez-vous des options open source ou sous licence ? Pouvez-vous expliquer pourquoi vous avez choisi cette approche, avec qui vous vous êtes associé et pourquoi ? S'agit-il d'une stratégie à long terme ?

Je vais partager quelques secrets commerciaux ici:) Nous avons adopté une méthode hybride qui combine l'utilisation de modèles propriétaires et de modèles open source.

Pour relever des défis commerciaux spécifiques, nous avons développé des modèles propriétaires. Ces modèles sont entraînés sur les bases de données internes de Wedia, et non sur les données des clients, pour résoudre des problèmes très particuliers.
Nous combinons ces modèles « internes » avec des modèles open source et commerciaux. Nous avons travaillé avec notre équipe juridique pour sélectionner avec soin les fournisseurs qui garantissent la confidentialité totale des données de nos clients. Il est essentiel pour nous que les données de nos clients ne soient jamais utilisées pour la formation de modèles généraux.

Nous avons sélectionné Anthropic en tant que fournisseur mondial d'IA. Leur modèle cloud garantit une confidentialité totale des données. En utilisant les solutions d'Anthropic, nous garantissons à nos clients que leurs données sont utilisées exclusivement pour leurs besoins, sans jamais être intégrées dans des modèles de formation généraux. De plus, Anthropic respecte les zones de localisation des données, ce qui nous permet de nous conformer aux exigences du RGPD.

5. Quelles sont les limites de l'intégration de l'IA dans un DAM ? Par exemple, certains affirment que la fourniture d'outils d'édition dans un DAM dépasse ce que devrait offrir un DAM. Quelles sont vos limites en matière d'intégration de l'IA ?

Je pense que ceux qui avancent un tel argument ne peuvent qu'envisager une intégration de base de DALL-E, Firefly ou Midjourney, sans aucune personnalisation ni valeur ajoutée. Une fois de plus, nous intégrons des outils dans le but d'activer un processus métier existant, en remplaçant une action manuelle ou externe par GenAI. C'est ce qui fera la différence sur le long terme et sa légitimité : la qualité de l'intégration dans un DAM.

À propos de Paul Melcher

Paul a plus de 20 ans d'expérience dans le secteur des technologies visuelles et est le fondateur et directeur de Melcher System LLC. Il possède également une vaste expertise en matière d'IA générative, de reconnaissance d'images et de licences de contenu. Vous pouvez découvrir les dernières actualités, technologies et tendances du secteur visuel via son magazine en ligne Captur.

Vous pouvez communiquer avec Paul via son profil LinkedIn.

Cet article de fond fait partie d'une série rédigée par Paul Melcher, expert en technologie visuelle et fondateur du magazine en ligne Kaptur.

Dans le paysage numérique en évolution rapide d'aujourd'hui, l'intégration de l'IA générative dans les systèmes de gestion des actifs numériques transforme la façon dont nous gérons et utilisons le contenu visuel. Pour démystifier l'intersection entre l'IA et le DAM, nous lançons une série d'entretiens avec les CTO et les CPO des principales sociétés de DAM. Notre objectif est d'approfondir leurs expériences, leurs défis et leurs réussites dans la mise en œuvre de solutions d'IA génératives.

Tout au long de cette série, nous poserons les cinq mêmes questions à chaque leader, dans le but de découvrir des perspectives diverses et des approches innovantes. Nous lançons notre série avec Olivier Grenet, directeur technique chez Wedia, qui partage ses idées sur la façon dont Wedia est la pionnière en matière d'utilisation de l'IA générative pour améliorer ses capacités de DAM.

1. Wedia est l'un des premiers fournisseurs de DAM à mettre en œuvre des solutions d'IA génératives telles que le remplacement de l'arrière-plan et la recherche sémantique. Qu'est-ce qui vous a poussé à mettre en œuvre ces solutions d'IA alors que de nombreuses autres semblent hésiter ?

Chez Wedia, nous avons toujours considéré l'IA comme une technologie très pertinente pour le traitement de l'image et de la vidéo. Depuis le lancement de notre DAM, nous avons investi dans une équipe dédiée de data scientists et d'ingénieurs en IA qui travaillent en permanence sur ces sujets par le biais de POC et d'une intégration progressive à notre solution. Cette expertise nous a permis de suivre de près l'évolution des modèles liés à l'image et de traverser des phases de désillusion et de progrès.

Nos clients sont très désireux d'intégrer l'IA générative dans le DAM depuis la vulgarisation de Midjourney et d'autres modèles. Et comme nous avions eu des discussions continues avec eux sur ces sujets, l'équipe technique a immédiatement intégré cette demande dans son travail, avec des cas d'utilisation réels fournis par les clients pour aller au-delà de la phase de démonstration et répondre avec une GenAI qui répond à de vrais problèmes commerciaux.

2. Avez-vous des clients qui utilisent actuellement les solutions génératives basées sur l'IA de Wedia ? Pouvez-vous nous dire qui ils sont et comment ils utilisent ces solutions ? Si ce n'est pas le cas, pouvez-vous partager les commentaires des testeurs ?

Actuellement, nous proposons une version de test sur une branche distincte de Wedia qui intègre toutes nos avancées en matière d'IA générative. Cette version est accessible à certains de nos clients, bien que je ne puisse pas les nommer explicitement. Cependant, je peux partager les commentaires que nous avons reçus jusqu'à présent.

Tout d'abord, nous avons déployé beaucoup d'efforts pour améliorer le rendu des images. Les premiers modèles ont généré des rendus très synthétiques et presque « 3D », qui ne répondaient pas aux attentes de nos clients. Nous avons donc travaillé pour rétablir la colorimétrie et le respect des directives graphiques et photographiques de nos clients afin qu'ils correspondent le plus possible à leur identité visuelle. C'était notre premier défi majeur.

Le deuxième défi, demandé par nos clients, était de générer des images pour des besoins spécifiques plutôt que de manière générale. Nous sommes allés au-delà de la simple phase rapide en intégrant l'IA générative dans les processus métier. Par exemple, créer des versions locales d'une image à partir d'un kit « global » ou placer des produits dans des arrière-plans pré-approuvés par la marque, plutôt que de les générer de manière aléatoire à partir d'une invite.

3. Vous publiez des solutions d'IA une par une. Comment décidez-vous de la solution à publier en premier ? Quels critères utilisez-vous pour hiérarchiser ces implémentations ?

Nous avons complètement fait évoluer notre approche. Au départ, nous avons exploré tous les domaines possibles de l'IA, mais nous avons maintenant adopté une méthode beaucoup plus structurée pour décider des solutions à mettre en œuvre en premier.

Tout d'abord, nous effectuons des POC (Proof of Concept) sur les besoins commerciaux spécifiques signalés par nos clients afin de valider la faisabilité technique de la solution. Une fois la faisabilité validée, nous présentons ces POC aux clients pour les tester. Ce n'est qu'après avoir confirmé que les fonctionnalités répondent à un réel besoin commercial que nous passons à la phase de « découverte ».

Cette phase de découverte comprend une exploration approfondie de tous les domaines de recherche nécessaires, tels que l'interface utilisateur, l'expérience utilisateur et l'intégration des flux de travail. Nous créons des prototypes que nous présentons à nos clients afin de garantir que l'IA générative soit intégrée de manière intelligente et intuitive dans leurs processus métier.

4. Développez-vous des modèles d'IA en interne ou utilisez-vous des options open source ou sous licence ? Pouvez-vous expliquer pourquoi vous avez choisi cette approche, avec qui vous vous êtes associé et pourquoi ? S'agit-il d'une stratégie à long terme ?

Je vais partager quelques secrets commerciaux ici:) Nous avons adopté une méthode hybride qui combine l'utilisation de modèles propriétaires et de modèles open source.

Pour relever des défis commerciaux spécifiques, nous avons développé des modèles propriétaires. Ces modèles sont entraînés sur les bases de données internes de Wedia, et non sur les données des clients, pour résoudre des problèmes très particuliers.
Nous combinons ces modèles « internes » avec des modèles open source et commerciaux. Nous avons travaillé avec notre équipe juridique pour sélectionner avec soin les fournisseurs qui garantissent la confidentialité totale des données de nos clients. Il est essentiel pour nous que les données de nos clients ne soient jamais utilisées pour la formation de modèles généraux.

Nous avons sélectionné Anthropic en tant que fournisseur mondial d'IA. Leur modèle cloud garantit une confidentialité totale des données. En utilisant les solutions d'Anthropic, nous garantissons à nos clients que leurs données sont utilisées exclusivement pour leurs besoins, sans jamais être intégrées dans des modèles de formation généraux. De plus, Anthropic respecte les zones de localisation des données, ce qui nous permet de nous conformer aux exigences du RGPD.

5. Quelles sont les limites de l'intégration de l'IA dans un DAM ? Par exemple, certains affirment que la fourniture d'outils d'édition dans un DAM dépasse ce que devrait offrir un DAM. Quelles sont vos limites en matière d'intégration de l'IA ?

Je pense que ceux qui avancent un tel argument ne peuvent qu'envisager une intégration de base de DALL-E, Firefly ou Midjourney, sans aucune personnalisation ni valeur ajoutée. Une fois de plus, nous intégrons des outils dans le but d'activer un processus métier existant, en remplaçant une action manuelle ou externe par GenAI. C'est ce qui fera la différence sur le long terme et sa légitimité : la qualité de l'intégration dans un DAM.

À propos de Paul Melcher

Paul a plus de 20 ans d'expérience dans le secteur des technologies visuelles et est le fondateur et directeur de Melcher System LLC. Il possède également une vaste expertise en matière d'IA générative, de reconnaissance d'images et de licences de contenu. Vous pouvez découvrir les dernières actualités, technologies et tendances du secteur visuel via son magazine en ligne Captur.

Vous pouvez communiquer avec Paul via son profil LinkedIn.

Profile