[IA] Une Machine Learning pour vos contenus

En février dernier, une étude éditée par Econsultancy – the 2018 Digital Trends Report dévoilait que la gestion de contenus et l’expérience client (CX) étaient les deux grandes priorités digitales de 2018. Cette étude a été menée auprès près de 13000 spécialistes du marketing, de la création et des technologies digitales. Elle nous apprend que les sociétés les plus performantes étaient aussi celles qui étaient les plus intéressées pour utiliser l’intelligence artificielle dans leur marketing.

 

L’IA n’est pas une nouvelle mode, elle existe depuis plus de 50 ans. Elle fait parler d’elle ces dernières années grâce aux progrès fulgurants faits en matière d’apprentissage automatique. Elle apparaît dans tous les maillons de la chaîne de valeur des contenus : de l’idéation à la gestion des contenus, en passant par la création et la production. Voyons de plus près trois de ses applications.

 

1 – L’IA, le ghostwriter de la Content Factory ?

 

Le Monde avec Syllabs, The Washington Post avec Héliograf, the Associated Press avec Automated Insights, l’AFP et bien d’autres ont admis avoir recours à l’intelligence artificielle. Pour faire quoi ? Rédiger une partie de leurs articles ou dépêches ! Mais comment est-ce possible ?

Le Natural Language Generation (NLG) ou la génération automatique de textes (GAT) en français “vise à exprimer sous une forme textuelle, syntaxiquement et sémantiquement correcte, une représentation formelle d’un contenu”. En gros, le logiciel est capable de créer des contenus textuels en construisant des phrases dont la syntaxe et la sémantique sont correctes. Et comment ça fonctionne ?

TYPING
TYPING

Une fois paramétrés, les logiciels de NLG utilisent les données brutes non linguistiques (chiffres par exemple)  pour produire des textes courts, simples, informatifs et factuels. Des textes comme les bulletins météo, les rapports d’entreprises, les résultats boursiers et sportifs, les résultats des scrutins électoraux ou des annonces immobilières peuvent être écrits par ces logiciels.

Leur valeur ajoutée tient à la fois au volume impressionnant de données qu’ils peuvent traiter et à leur vitesse d’exécution. Autre avantage : la probabilité d’une faute de frappe sur un chiffre est…nulle. Par ailleurs, les journaux et les entreprises font appel à ces solutions de génération automatique pour soulager leur Content Factory (journalistes, rédacteurs) d’un travail rébarbatif et permettre à ces derniers de consacrer leur temps aux investigations et reportages sur le terrain. 

Ainsi la limite des NLG réside dans deux missions que la machine ne peut réaliser : celle d’écrire avec style et celle d’enquêter (pour produire un scoop ou un Prix Pulitzer). L’essence même du journaliste. 

 

2 – Le Machine Learning ou le mythe de Hélénos pour un marketing prédictif

 

Prédire l’avenir est l’un des plus grands fantasmes de l’homme. Car connaître l’avenir, c’est pouvoir le contrôler, le modeler et avoir un avantage certain sur ses pairs/concurrents.

La mythologie grecque relate comment le don de divination a été donné à deux enfants jumeaux, Cassandre et Hélénos. En grandissant, chacun exprimait ce don chacun à sa manière. 

Les paroles oraculaires de Cassandre lui venaient des Dieux qui lui murmuraient l’avenir. En cela, elle ne possédait aucun talent divin(atoire). Elle ne proférait que des événements funestes pour Troie et était considérée comme une incorrigible alarmiste. Hélénos quant à lui détenait le vrai don de prescience. Son talent était d’étudier le comportement, comprendre les occurrences, identifier les signes annonciateurs et les interpréter pour prédire l’avenir. C’est ainsi que, grâce à sa connaissance des usages et du caractère des Troyens, Hélénos instruisit les Grecs des actions à mener pour défaire les Troyens. Il suggéra notamment à Ulysse -dont il était le prisonnier- la construction d’un grand cheval de bois pour pénétrer dans la ville assiégée. Les Grecs, consciencieux et déterminés, suivirent tous les conseils prophétiques de Hélénos. Les Troyens, confiants et arrogants, avaient ignoré les augures de Cassandre.

Image du Cheval de Troie extraite du film “Troy” réalisé par Wolfgang Petersen (2004)

L’IA suit la même méthodologie de prédiction que celle de Hélénos. Collecter, croiser, segmenter, analyser les données pour en dégager des tendances, comprendre des comportements et des usages et les extrapoler. L’objectif est de proposer des contenus avec une plus grande probabilité de plaire à une audience déterminée.

Mais l’apport majeur de l’IA par rapport à l’homme réside évidemment dans sa puissance. Sa capacité prodigieuse à traiter une volumétrie gigantesque de données lui permet de détecter des insights que l’homme ne voit pas. Car face à la croissance exponentielle du nombre de contenus, à la multiplication des supports et des canaux de distribution, à l’émergence de nouveaux marchés (et donc de cultures, langues…), l’homme n’a pas les moyens d’être omnicanal, omnipotent, omniprésent. Il abandonne ce territoire aux algorithmes pour se consacrer à des tâches plus valorisantes et éminemment intellectuelles.

 

3- Pertinence et Précision : hot dog or not hot dog, that’s the question

 

Pour illustrer un article, beaucoup de rédacteurs ont recours à UNPLASH, une plateforme qui héberge des millions d’images libres de droit. La popularité de ce site (près de 12 millions de visiteurs uniques par mois tout de même !) s’explique par la mise à disposition d’images gratuites, de grande qualité technique et esthétique, calibrées pour le web, téléchargeables en un instant et sans création de compte. Là où le bât blesse est la faible pertinence des mots-clé. Pour saisir l’importance d’un étiquetage pertinent, procédons comme un rédacteur. Il est à la recherche d’une image pour enrichir son contenu, dont le sujet est la satisfaction de ses clients. Il va sur le site d’UNPLASH et saisit ses deux mots-clé : client et satisfaction. Le choix de ces deux mots n’est pas anodin : ils ont la même signification en français et en anglais. Le résultat est plutôt décevant, jugez par vous-mêmes :

Unplash
UNPLASH – Satisfaction Client

Après quelques images de personnes souriantes ou en train de se serrer la main, on atterrit vite sur des photos dont le rapport avec la satisfaction client est loin d’être évident. Y a t-il une IA dans l’avion ? Le résultat ne varie guère avec un seul mot-clé (satisfaction).

Résultat : soit le rédacteur perd son (précieux) temps à trouver LA bonne photo, soit il va voir ailleurs si l’herbe est plus verte. Il y a mieux comme expérience utilisateur !

 

La reconnaissance de forme est aussi fondamentale dans la recherche de pertinence et de précision. Pour bien le comprendre, on peut se référer à un épisode de la brillante série Silicon ValleyDans cet épisode, l’un des protagonistes, Jian Yang (un clandestin chinois, ça a son importance), fait une démonstration de son application SeeFood :

La désillusion unanime qui s’en suit est à la hauteur des espoirs. L’application SeeFood fonctionne sur la reconnaissance binaire : soit c’est un hot dog, soit ce n’est pas un hot dog. Hot dog or not hot,  telle est la question ! 

Pour que la reconnaissance soit plus performante, un des codeurs suggère d’entraîner le système par l’apprentissage. Il faudrait pour cela écumer la toile pour récupérer un nombre conséquent d’images et les qualifier. Cette méthode suppose une somme colossale de travail laborieux et ennuyeux que même un clandestin chinois refuse d’effectuer.

 

Pour suppléer l’homme, le Deep Learning ou l’apprentissage plus profond est la solution pour permettre une indexation certes automatique (premier bénéfice) mais aussi plus précise et pertinente (deuxième bénéfice). En reproduisant le système neuronal humain,  il scanne des milliards de contenus (photos, vidéos, textes), répertorie, segmente, analyse, ou encore retranscrit des documents audio grâce à la reconnaissance vocale. Il s’occupe aussi de des métadonnées, ces données qui décrivent d’autres données, comme le nom de l’auteur, la date et le lieu de création et de modification, la taille du fichier, son format etc…

Les algorithmes enrichissent ainsi le thésaurus, améliorent donc la recherche, la localisation et le référencement des contenus. Ils participent ainsi à une meilleure expérience utilisateur et une meilleure visibilité des contenus, et par conséquence à une meilleure performance.

 

 

Laisser un commentaire