3 tâches de métadonnées que GenAI peut automatiser‍

Cet article a été traduit de digitalassetmanagementnews.com

Cet article de fond a été fourni par Jake Athey, vice-président de la commercialisation et des ventes pour le DAM et le PIM chez Acquia.

L'intelligence artificielle générative (GenAI) n'est pas aussi largement utilisée qu'on pourrait le supposer. Seulement 5,1 % des entreprises américaines utilisent l'IA pour produire des biens et des services, signalé L'économiste en août, contre 5,4 % plus tôt cette année. Les articles discutant de la valeur de GenAI pour les entreprises sont devenus monnaie courante dans les médias.

L'espace DAM est différent, à mon avis, car nous ne nous demandons plus depuis longtemps si l'IA a de la valeur pour nous. Elle en a une. Le balisage automatique des mots clés par IA est utilisé depuis une dizaine d'années maintenant, et les fournisseurs de DAM ont rapidement intégré des modèles de langage volumineux (LLM) à leurs plateformes après les débuts de ChatGPT en novembre 2022. La proposition de valeur de l'IA est claire : rendre les actifs plus consultables et utilisables en moins de temps et à moindre coût.

Au cours des deux dernières années, mes collègues d'Acquia et moi-même avons testé GenAI sur diverses tâches de métadonnées afin de voir ce que nous pouvions automatiser. Nous sommes particulièrement intéressés à savoir si le GPT-4 d'OpenAI peut générer des descriptions de produits, des mots clés plus utiles et du texte alternatif. Nous avons donc mené une étude et rédigé les résultats pour le Journal de gestion des médias numériques (JDMM).

Plutôt que de résumer l'ensemble de l'étude, je souhaite explorer les points à retenir : les manières dont les praticiens du DAM peuvent utiliser GenAI dès maintenant pour automatiser les flux de métadonnées.

Les trois incontournables

Trois tâches liées aux métadonnées nécessitent une quantité disproportionnée de temps humain et d'intelligence pour rendre le contenu consultable et accessible. Aujourd'hui, nous nous concentrons sur les points suivants :

  1. Étiquetage de mots clés pour la photographie de produits. Les mots clés capturent le type de produit, l'activité, le lieu, l'environnement, la démographie, les émotions, etc. Ils permettent aux utilisateurs du DAM de rechercher, de parcourir et de filtrer les ressources les mieux adaptées à leur cas d'utilisation.
  2. Descriptions des produits Cela va des one-liners aux descriptions complexes qui utilisent le style, la perspective et la narration pour vendre le produit. Ces descriptions testent la compréhension d'un actif par une IA et peuvent accélérer la rédaction des descriptions de produits en fournissant un point de départ aux rédacteurs. Ils peuvent également être insérés sous forme de texte alternatif.
  3. Texte alternatif pour plus d'accessibilité. Le texte alternatif permet aux personnes malvoyantes équipées de lecteurs d'écran de comprendre le contenu des médias visuels sur les sites Web. Chaque ressource visuelle d'un système DAM doit être associée à un texte alternatif avant d'être disponible pour le déploiement.

Parmi les autres cas d'utilisation de l'IA, citons les traductions entre les langues (faisable avant l'IA), l'extraction de texte à partir d'images, la transcription de vidéos et les résumés de PDF, de diaporamas et de documents générés par l'IA. Ce sont d'excellents moyens d'enrichir les métadonnées, mais ils ne sont pas aussi compliqués (en particulier avec un système DAM configuré pour récupérer automatiquement ces métadonnées). Le texte est vrai ou faux, il y a peu de subjectivité en jeu. Les mots-clés, les descriptions de produits et le texte alternatif sont plus nuancés.

Dans ces cas d'utilisation, les administrateurs du DAM accordent la plus grande importance à deux qualités : l'exactitude et la précision. La précision dépend de la capacité de l'IA à identifier correctement le contenu et le contexte d'une image. Dans le JDMM étude, nous l'avons évaluée sur la base d'une description du produit en une ligne. La précision consiste à déterminer si les mots clés étaient factuels, pertinents et plausibles en tant que termes de recherche. Selon la façon dont vous invitez GenAI, les résultats peuvent varier considérablement.

Être le patron de l'IA

Comment faire en sorte qu'une IA exécute les tâches répétitives mais importantes liées au DAM qui doivent être effectuées ? Cela commence par une incitation habile.

Dans notre étude pour JDMM, nous voulions que GPT-4 rédige des descriptions d'une phrase et 10 mots clés pour des produits couvrant six catégories : vélos, alimentation et boissons, articles ménagers, mobilier de bureau, chaussures et outils. Nous avions 10 images pour chaque catégorie et avons développé six instructions, ce qui a donné 360 résultats à analyser.

Voici le modèle que nous avons utilisé pour informer nos invites.

  1. Contexte : L'objectif général de l'exercice.
  2. Personnalité : Le personnage ou le rôle que joue l'IA.
  3. Tâche : Ce que l'IA est censée faire.
  4. Étapes : Le processus par lequel l'IA accomplira sa tâche.
  5. Spécifications : Directives, définitions et paramètres que l'IA doit suivre.
  6. Format : Comment la réponse doit être rendue.

Dans chaque invite, nous n'avons modifié qu'un seul de ces six éléments à puces tout en conservant les autres tels quels par rapport à une invite de base d'origine. Ensuite, nous avons comparé les performances des instructions en termes d'exactitude et de précision.

Qu'est-ce qui a le mieux fonctionné

Pour être clair, nous n'avons pas saisi les instructions et les images manuellement dans GPT-4. Mon co-auteur Jacob Williamson, développeur logiciel senior chez Acquia, a créé un profil de téléchargement automatique dans le système DAM d'Acquia pour exécuter chaque invite sur les 60 images. Parmi les six suggestions, celle-ci a obtenu les meilleurs résultats si nous établissons la moyenne des scores en termes d'exactitude et de précision.

## Contexte

Nous essayons de rendre les images de produits plus consultables dans un système de gestion des actifs numériques (DAM).

## Personnalité

Vous êtes administrateur du DAM.

## Tâche

Trouvez 10 mots-clés qui décrivent chacun un aspect différent de l'image affichée. Les mots clés peuvent faire référence à des qualités telles que le nom et le type de produit, le cadre, les actions, la saison, les caractéristiques démographiques, les émotions, etc.

## Étapes

1/ Écrivez une phrase décrivant l'image

2/ Listez 10 mots-clés qu'une personne utiliserait pour retrouver cette image via une recherche textuelle

## Spécifications

Un bon mot clé est un nom qu'un professionnel du marketing ou du commerce électronique utiliserait pour rechercher l'image d'un produit dans un système DAM. Cette image sera utilisée dans du contenu numérique tel qu'une publicité, une publication sur les réseaux sociaux, une liste de produits de commerce électronique ou une page Web.

## Format

Numérotez les mots clés de 1 à 10 dans une liste à puces.

Quelques points à signaler. Tout d'abord, il est important de désigner le personnage en tant qu' « administrateur du DAM ». Lorsque nous avons effectué des tests avec un autre titre, « spécialiste des technologies du marketing », les performances ont chuté de manière significative.

Ensuite, c'est la seule invite dans laquelle nous avons donné des exemples GPT-4 de ce à quoi les mots clés pouvaient faire référence : «... nom et type de produit, cadre, actions, saison, données démographiques, émotions, etc. » Étonnamment, cette invite a obtenu de moins bons résultats que quatre de ses cinq concurrents en termes de précision des mots clés, mais seulement de 1 % ou moins. Peut-être que GPT-4 a besoin d'exemples de produits réels, de mots clés et de descriptions bien conçus au lieu de termes généraux décrivant des types de mots clés.

Enfin, notez que nous soulignons l'objectif de cet exercice, à savoir rendre les images consultables dans un système DAM, trois fois, de trois manières différentes. C'était intentionnel. Les LLM examinent l'ordre dans lequel les informations sont présentées (ce que vous dites en premier est plus important) et, anecdotiquement, ils semblent se laisser distraire si vous ne leur rappelez pas assez souvent leur mission. À cet égard, ils sont comme des humains.

C'est aussi simple que ça ? Pas tout à fait

L'invite la plus performante, exécutée contre une version générique de GPT-4, n'était pas parfaite. Son taux de précision de 88 % signifie que 12 % des descriptions de produits qu'il a générées étaient totalement erronées ou trop imparfaites pour être utilisées pour quoi que ce soit, comme du texte alternatif. Son score de précision de 91 % signifie que 9 % des mots clés qu'il a étiquetés étaient faux, trompeurs ou inutiles pour les utilisateurs du DAM.

Avec le texte alternatif, avoir quelque chose n'est pas nécessairement mieux que ne rien avoir. Si 12 % de votre texte alternatif est faux, c'est non seulement embarrassant, mais cela ne rend pas service aux personnes handicapées. En ce qui concerne les mots clés, l'inverse peut être vrai. Si 9 % de vos mots clés sont erronés, il existe encore de nombreux mots clés qui permettront de récupérer ce que souhaite un utilisateur du DAM.

Ce qui me ramène à la valeur de GenAI dans l'administration du DAM. Bien que cela nécessite une surveillance minutieuse, l'utilisation de GenAI est plus efficace que de tout faire manuellement par peur des erreurs. De plus, les administrateurs DAM désireux de créer et de tester des invites personnalisées trouveront des moyens d'obtenir des métadonnées plus précises et plus précises. Les LLM sont étonnamment sensibles aux petits changements dans la façon dont nous communiquons avec eux et dans ce que nous leur demandons de faire.

Ne laissez pas la désillusion des médias à l'égard de GenAI vous empêcher de l'utiliser. Nous savons ce que doit faire GenAI. Il nous suffit de mettre tout en œuvre pour que cela se produise.

À propos de Jake Athey

Jake Athey est responsable du marketing numérique et des ventes chez Acquia. Sa mission est d'aider les marques à associer des stratégies intelligentes de contenu et de données à l'ensemble de l'expérience client afin d'améliorer leurs résultats commerciaux.

Vous pouvez communiquer avec Jake via son profil LinkedIn.

Cet article de fond a été fourni par Jake Athey, vice-président de la commercialisation et des ventes pour le DAM et le PIM chez Acquia.

L'intelligence artificielle générative (GenAI) n'est pas aussi largement utilisée qu'on pourrait le supposer. Seulement 5,1 % des entreprises américaines utilisent l'IA pour produire des biens et des services, signalé L'économiste en août, contre 5,4 % plus tôt cette année. Les articles discutant de la valeur de GenAI pour les entreprises sont devenus monnaie courante dans les médias.

L'espace DAM est différent, à mon avis, car nous ne nous demandons plus depuis longtemps si l'IA a de la valeur pour nous. Elle en a une. Le balisage automatique des mots clés par IA est utilisé depuis une dizaine d'années maintenant, et les fournisseurs de DAM ont rapidement intégré des modèles de langage volumineux (LLM) à leurs plateformes après les débuts de ChatGPT en novembre 2022. La proposition de valeur de l'IA est claire : rendre les actifs plus consultables et utilisables en moins de temps et à moindre coût.

Au cours des deux dernières années, mes collègues d'Acquia et moi-même avons testé GenAI sur diverses tâches de métadonnées afin de voir ce que nous pouvions automatiser. Nous sommes particulièrement intéressés à savoir si le GPT-4 d'OpenAI peut générer des descriptions de produits, des mots clés plus utiles et du texte alternatif. Nous avons donc mené une étude et rédigé les résultats pour le Journal de gestion des médias numériques (JDMM).

Plutôt que de résumer l'ensemble de l'étude, je souhaite explorer les points à retenir : les manières dont les praticiens du DAM peuvent utiliser GenAI dès maintenant pour automatiser les flux de métadonnées.

Les trois incontournables

Trois tâches liées aux métadonnées nécessitent une quantité disproportionnée de temps humain et d'intelligence pour rendre le contenu consultable et accessible. Aujourd'hui, nous nous concentrons sur les points suivants :

  1. Étiquetage de mots clés pour la photographie de produits. Les mots clés capturent le type de produit, l'activité, le lieu, l'environnement, la démographie, les émotions, etc. Ils permettent aux utilisateurs du DAM de rechercher, de parcourir et de filtrer les ressources les mieux adaptées à leur cas d'utilisation.
  2. Descriptions des produits Cela va des one-liners aux descriptions complexes qui utilisent le style, la perspective et la narration pour vendre le produit. Ces descriptions testent la compréhension d'un actif par une IA et peuvent accélérer la rédaction des descriptions de produits en fournissant un point de départ aux rédacteurs. Ils peuvent également être insérés sous forme de texte alternatif.
  3. Texte alternatif pour plus d'accessibilité. Le texte alternatif permet aux personnes malvoyantes équipées de lecteurs d'écran de comprendre le contenu des médias visuels sur les sites Web. Chaque ressource visuelle d'un système DAM doit être associée à un texte alternatif avant d'être disponible pour le déploiement.

Parmi les autres cas d'utilisation de l'IA, citons les traductions entre les langues (faisable avant l'IA), l'extraction de texte à partir d'images, la transcription de vidéos et les résumés de PDF, de diaporamas et de documents générés par l'IA. Ce sont d'excellents moyens d'enrichir les métadonnées, mais ils ne sont pas aussi compliqués (en particulier avec un système DAM configuré pour récupérer automatiquement ces métadonnées). Le texte est vrai ou faux, il y a peu de subjectivité en jeu. Les mots-clés, les descriptions de produits et le texte alternatif sont plus nuancés.

Dans ces cas d'utilisation, les administrateurs du DAM accordent la plus grande importance à deux qualités : l'exactitude et la précision. La précision dépend de la capacité de l'IA à identifier correctement le contenu et le contexte d'une image. Dans le JDMM étude, nous l'avons évaluée sur la base d'une description du produit en une ligne. La précision consiste à déterminer si les mots clés étaient factuels, pertinents et plausibles en tant que termes de recherche. Selon la façon dont vous invitez GenAI, les résultats peuvent varier considérablement.

Être le patron de l'IA

Comment faire en sorte qu'une IA exécute les tâches répétitives mais importantes liées au DAM qui doivent être effectuées ? Cela commence par une incitation habile.

Dans notre étude pour JDMM, nous voulions que GPT-4 rédige des descriptions d'une phrase et 10 mots clés pour des produits couvrant six catégories : vélos, alimentation et boissons, articles ménagers, mobilier de bureau, chaussures et outils. Nous avions 10 images pour chaque catégorie et avons développé six instructions, ce qui a donné 360 résultats à analyser.

Voici le modèle que nous avons utilisé pour informer nos invites.

  1. Contexte : L'objectif général de l'exercice.
  2. Personnalité : Le personnage ou le rôle que joue l'IA.
  3. Tâche : Ce que l'IA est censée faire.
  4. Étapes : Le processus par lequel l'IA accomplira sa tâche.
  5. Spécifications : Directives, définitions et paramètres que l'IA doit suivre.
  6. Format : Comment la réponse doit être rendue.

Dans chaque invite, nous n'avons modifié qu'un seul de ces six éléments à puces tout en conservant les autres tels quels par rapport à une invite de base d'origine. Ensuite, nous avons comparé les performances des instructions en termes d'exactitude et de précision.

Qu'est-ce qui a le mieux fonctionné

Pour être clair, nous n'avons pas saisi les instructions et les images manuellement dans GPT-4. Mon co-auteur Jacob Williamson, développeur logiciel senior chez Acquia, a créé un profil de téléchargement automatique dans le système DAM d'Acquia pour exécuter chaque invite sur les 60 images. Parmi les six suggestions, celle-ci a obtenu les meilleurs résultats si nous établissons la moyenne des scores en termes d'exactitude et de précision.

## Contexte

Nous essayons de rendre les images de produits plus consultables dans un système de gestion des actifs numériques (DAM).

## Personnalité

Vous êtes administrateur du DAM.

## Tâche

Trouvez 10 mots-clés qui décrivent chacun un aspect différent de l'image affichée. Les mots clés peuvent faire référence à des qualités telles que le nom et le type de produit, le cadre, les actions, la saison, les caractéristiques démographiques, les émotions, etc.

## Étapes

1/ Écrivez une phrase décrivant l'image

2/ Listez 10 mots-clés qu'une personne utiliserait pour retrouver cette image via une recherche textuelle

## Spécifications

Un bon mot clé est un nom qu'un professionnel du marketing ou du commerce électronique utiliserait pour rechercher l'image d'un produit dans un système DAM. Cette image sera utilisée dans du contenu numérique tel qu'une publicité, une publication sur les réseaux sociaux, une liste de produits de commerce électronique ou une page Web.

## Format

Numérotez les mots clés de 1 à 10 dans une liste à puces.

Quelques points à signaler. Tout d'abord, il est important de désigner le personnage en tant qu' « administrateur du DAM ». Lorsque nous avons effectué des tests avec un autre titre, « spécialiste des technologies du marketing », les performances ont chuté de manière significative.

Ensuite, c'est la seule invite dans laquelle nous avons donné des exemples GPT-4 de ce à quoi les mots clés pouvaient faire référence : «... nom et type de produit, cadre, actions, saison, données démographiques, émotions, etc. » Étonnamment, cette invite a obtenu de moins bons résultats que quatre de ses cinq concurrents en termes de précision des mots clés, mais seulement de 1 % ou moins. Peut-être que GPT-4 a besoin d'exemples de produits réels, de mots clés et de descriptions bien conçus au lieu de termes généraux décrivant des types de mots clés.

Enfin, notez que nous soulignons l'objectif de cet exercice, à savoir rendre les images consultables dans un système DAM, trois fois, de trois manières différentes. C'était intentionnel. Les LLM examinent l'ordre dans lequel les informations sont présentées (ce que vous dites en premier est plus important) et, anecdotiquement, ils semblent se laisser distraire si vous ne leur rappelez pas assez souvent leur mission. À cet égard, ils sont comme des humains.

C'est aussi simple que ça ? Pas tout à fait

L'invite la plus performante, exécutée contre une version générique de GPT-4, n'était pas parfaite. Son taux de précision de 88 % signifie que 12 % des descriptions de produits qu'il a générées étaient totalement erronées ou trop imparfaites pour être utilisées pour quoi que ce soit, comme du texte alternatif. Son score de précision de 91 % signifie que 9 % des mots clés qu'il a étiquetés étaient faux, trompeurs ou inutiles pour les utilisateurs du DAM.

Avec le texte alternatif, avoir quelque chose n'est pas nécessairement mieux que ne rien avoir. Si 12 % de votre texte alternatif est faux, c'est non seulement embarrassant, mais cela ne rend pas service aux personnes handicapées. En ce qui concerne les mots clés, l'inverse peut être vrai. Si 9 % de vos mots clés sont erronés, il existe encore de nombreux mots clés qui permettront de récupérer ce que souhaite un utilisateur du DAM.

Ce qui me ramène à la valeur de GenAI dans l'administration du DAM. Bien que cela nécessite une surveillance minutieuse, l'utilisation de GenAI est plus efficace que de tout faire manuellement par peur des erreurs. De plus, les administrateurs DAM désireux de créer et de tester des invites personnalisées trouveront des moyens d'obtenir des métadonnées plus précises et plus précises. Les LLM sont étonnamment sensibles aux petits changements dans la façon dont nous communiquons avec eux et dans ce que nous leur demandons de faire.

Ne laissez pas la désillusion des médias à l'égard de GenAI vous empêcher de l'utiliser. Nous savons ce que doit faire GenAI. Il nous suffit de mettre tout en œuvre pour que cela se produise.

À propos de Jake Athey

Jake Athey est responsable du marketing numérique et des ventes chez Acquia. Sa mission est d'aider les marques à associer des stratégies intelligentes de contenu et de données à l'ensemble de l'expérience client afin d'améliorer leurs résultats commerciaux.

Vous pouvez communiquer avec Jake via son profil LinkedIn.

Profile