RETOUR SUR LE PETIT-DÉJEUNER DU COMMERCE 4.0 DE LA CHAIRE PROSPECTIVE DU COMMERCE DANS LA SOCIÉTÉ 4.0 ORGANISÉ LE 7 MAI

Chaire Prospective du Commerce dans la société 4.0

Le Petit-Déjeuner du Commerce 4.0. s’est déroulé avec la participation du Professeur Pascal Lardellier, Professeur à l’Université de Bourgogne, de Maud Funaro, directrice stratégique et innovation chez E.Leclerc, et de François Loviton, directeur Retail Google. Les débats étaient animés par le Professeur Olivier Badot, ancien doyen à la recherche de ESCP et Directeur scientifique de la Chaire E.Leclerc/ESCP, et du Professeur Adeline Ochs, Coordinatrice générale de la Chaire E. Leclerc/ESCP. 

Le voice commerce (v-commerce) est en plein essor via les assistants vocaux ; et les distributeurs et marques sont de plus en plus nombreux à proposer leurs services par ce medium. Ce commerce conversationnel transforme la manière de consommer, d’acheter, mais aussi l’expérience client et la relation aux marques. L’objectif de ce petit-déjeuner est de comprendre comment ce commerce conversationnel modifie la dynamique des échanges à la fois du point de vue des consommateurs et de celles des commerçants et de porter un regard anthropologique sur le sujet. 

Le "voice commerce", de la vue à la voix

Le Professeur Pascal Lardellier, anthropologue de la consommation, définit la notion de commerce vocal comme l’ensemble des "formes de commerce par lesquelles l’achat s’effectue par le biais d’une commande vocale". Il s’utilise aussi bien dans "des contextes de mobilité (via le smartphone ou dans l’automobile) que dans des contextes sédentaires, à la maison, via par exemple Amazon Echo ou Google Home", ajoute le Professeur. 
Un nouvel usage qui a déjà fait ses preuves et qui ne compte pas en rester là selon les statistiques : aux Etats-Unis, quelques 2 milliards de commandes ont été passées en 2017 et de façon très exponentielle, on peut s’attendre à plus de 40 milliards de commandes vocales enregistrées pour 2022. "Des chiffres qui justifient de près l’intérêt porté par les distributeurs et le commerce à ce sujet", justifie le Professeur Pascal Lardellier. Toujours en prédictif, demain, ce seront environ 40% des consommateurs qui utiliseront des assistants vocaux plutôt qu’un site web classique ou une application mobile, et 31% qui lui préféreront son intermédiaire plutôt que de se rendre physiquement dans un magasin. Des intermédiaires historiquement institués et jusque-là incontournables vont donc être les témoins d’un changement de paradigme radical, évoluant de la vue (packaging, publicité) à la voix. 
Le Professeur ajoute au sujet de ce changement : "demain, c’est une véritable guerre homérique dans le référencement qui va avoir lieu. Le consommateur va demander plutôt que taper sur un ordinateur dans un moteur de recherche et de ce fait, il ne pourra lui être remonté que quelques rares références, voire une seule, alors qu’il dispose d’un large panel de références possibles sur internet". 

Pour une utilisation généralisée et simplifiée 

Le Professeur Pascal Lardellier évoque également un avantage de taille lié au développement et à l’installation du commerce conversationnel dans nos habitudes de vie et d’achat : la réduction de la fracture numérique : "une fracture qui est d’abord générationnelle et cognitive : des personnes qui n’ont pas les capacités cognitives ou qui ne s’autorisent pas à utiliser les nouvelles technologies pourront demain, grâce à la commande vocale, les utiliser". En effet, le côté intuitif et ludique inhérents à ces nouveaux dispositifs rend dispensable le background cognitif auparavant nécessaire à la compréhension et à une utilisation efficace de ces technologies. 
Un gain d’efficacité et de simplification qui va, sous peu, induire une conversation quasi ininterrompue avec les objets de voice-commerce : "on parle à Siri comme à une amie ou à une confidente", annonce le Professeur, un constat finalement proche d’une situation déjà en évolution : "nous vivons dans une société d’individualisme connectée ; nous sommes bien de plus en plus communiquant, et de moins en moins rencontrant", constate-t-il.   
Un retour aux théories anthropologiques 

Le Professeur évoque un lien troublant entre ce que nous vivons aujourd’hui au sein de la société 4.0, et la théorie dite du "hau", développée au début du XXème siècle par l’anthropologue français Marcel Mauss. En son sein, il y voit la société, les institutions, les relations entre les Hommes liées par une forme de lien invisible, intangible et puissant. Ce lien, c’est le cycle du donné, du reçu et du rendu", explique le Professeur Pascal Lardellier. En effet, l’anthropologue remarque finalement que "les gens passent leur temps à donner, des objets, des cadeaux, des présents, de l’attention, et se rend compte qu’il y a toujours un moment où l’objet revient" poursuit-il. Selon Marcel Mauss, il semblerait alors que l’objet soit comme animé par un esprit. 
Cet esprit, c’est le "hau", qui les anime et va leur permettre de ne pas être inertes, mais bel et bien dotés d’un esprit et d’une force qui consiste à ce que même posé, nous allons nous saisir de l’objet, l’utiliser puis le rendre, d’une façon ou d’une autre. Par cette animation des objets, "l assure la cohésion des sociétés via la circulation des objets". Or, au sein de la société 4.0, l’informatique des objets tient une place importante : ils communiquent, prennent nos commandes et requêtes dans la gestion quotidienne de nos activités et développent ainsi un esprit qui les rend de plus en plus autonomes à certains égards. "Nous ne sommes plus dans une animation de la société mais bien dans une animisation du monde : la croyance selon laquelle les objets, la nature, sont animés par un esprit et développent donc une capacité d’action et de réaction." Cet esprit, incarné par l’informatique ubiquitaire, peut aussi se manifester sous forme de voix (Siri, Echo), et va pouvoir agir, interagir et nous écouter. 
En passant leurs requêtes à travers eux, les utilisateurs deviennent doués de "pensée magique", qui consiste à considérer que le simple fait de penser les choses nous amène à les voir. "C’est le réel qui se couche face à notre désir" déclare le Professeur Pascal Lardellier. En d’autres mots, c’est la réalité qui se transforme dès lors qu’elle est énoncée, une situation dans laquelle la parole devient donc performative. 

Les innovations des centres E. Leclerc en matière de  "voice-commerce" 

Les différents usages observés 

"L’assistant vocal c’est une technologie d’intelligence artificielle qui permet d’interagir en langage naturel, qui va comprendre les intentions et les verbes d’action énoncés", commente Maud Funaro, et permettre ainsi de répondre aux différentes requêtes vocales des utilisateurs. Que l’accès à cette technologie soit rendu possible via le biais d’une interface embarquée dans le smartphone ou via une enceinte vocale, Maud Funaro rend compte de trois usages majeurs relatifs à ces dispositifs : 
1)    la recherche d’information ;
2)    les divertissements ;
3)    la recherche de services, marchands et non-marchands, avec notamment les applications proposées par des marques (on parle d’Actions pour Google et de Skills sur Alexa) et donc compatibles avec des achats effectués via la commande vocale. 
"Le commerce vocal n’est pas seulement utilisé pour finaliser une transaction, il peut être utilisé à toutes les étapes de la démarche de consommation, sur toute la chaîne d’actions, de l’amont (la recherche du produit) à l’achat", précise Maud Funaro. Ainsi, on constate un taux d’adoption très élevé chez les utilisateurs, malgré une mise sur le marché très récente de ces dispositifs. 

Pourquoi un tel engouement ? 

En vente en France depuis 2018, comment expliquer l’enthousiasme des consommateurs pour le voice-commerce ? La directrice stratégie et innovation de E. Leclerc nous donne les quatre éléments de réponse suivants : 
1) une interaction en langage naturel avec l’interface : pour la première fois, le consommateur n’a pas à s’adapter à l’interface du marchand, c’est l’interface qui s’adapte à elle ;
2) les éléments de langage énumérés sont compris et enregistrés : le consommateur n’a pas besoin de répéter ce qui a été dit avant pour mener à bien une requête complète ;
3) la possibilité de faire « sans les mains » et donc pouvoir gagner du temps et/ou effectuer d’autres activités en même temps que passer une commande ; 
4) l’accès à un "tunnel délinéarisé" : lors d’une commande émise via une interface visuelle, par exemple pour un yaourt à la fraise , il faudrait procéder comme suit : accéder à l’onglet "produit frais", puis "crèmerie", puis "yaourt", puis "fruits", puis "fraise". Accompagné d’un assistant vocal, les différents critères de sélection sont immédiatement pris en compte pour délivrer une proposition de produit final. 
Un parcours d’achat qui semble facilité mais qui fait face aussi à trois freins, énumérés par Maud Funaro :
1)    comprendre la réponse formulée par l’assistant vocal : pour une référence donnée l’assistant vocal énumère de nombreuses caractéristiques liées au produit, et risque de "perdre" le consommateur ;
2)    se faire comprendre de l’assistant vocal : il arrive que la détection du verbe d’action soit erronée et rend la requête difficile à soumettre ;
3)    faire accepter aux consommateurs le paiement via l’assistant vocal : un sujet de "réassurance" important selon Maud Funaro, qui rappelle que quelques années en arrière encore, les consommateurs avaient peu confiance dans le paiement en ligne : "C’est pareil mais pour le vocal maintenant ; associer l’assistant vocal à un device visuel est un des moyens qui permettra sûrement d’opérer cette réassurance du consommateur". 

Un défi pour E. Leclerc

Comme de nombreuses autres enseignes, les centres E. Leclerc ont fait le choix de d’adopter la technologie des assistants vocaux dans le secteur de l’alimentaire, un secteur qui n’est "pas le plus simple car il représente plus de références dans le panier moyen d’un consommateur, contrairement au secteur du non-alimentaire", précise Maud Funaro
Au mois d’août 2018, E.Leclerc sortait sa première version d’un « mémo course, une liste générique de course à laquelle on peut accéder sur le site Internet E.Leclerc Drive ou sur l’application d’assistant de course », explique-t-elle. Puis, à l’automne 2019, sortira une version plus aboutie de l’application via le Google Assistant : le consommateur pourra ajouter, retirer, ou supprimer un produit de la liste préexistante par la voix et venir ainsi modifier une liste créée via le canal visuel. Le second objectif visé est de taille : ajouter cette fois-ci de vraies références produits à son panier et non plus des noms génériques. Pour ce faire, l’algorithme d’intelligence artificielle utilisera un historique d’achat, s’il existe, ou alors effectuera une recherche catalogue pour converger le plus rapidement possible vers la bonne référence. Si toutefois le parcours devait être encore trop long et complexe, une « short list » pourra être proposée au consommateur via un parcours visuel lors de la finalisation du parcours d’achat. 
Le voice-commerce a démultiplies défis à relever liés aux nombreux perfectionnements à concevoir pour l’algorithme : la sémantique des mots, les nombreuses caractéristiques produits à arbitrer et énumérer, la gestion d’un catalogue large et en constante évolution. "Pour en faire un usage optimal, on constate un impératif d’imbrication avec les autres canaux pour une réelle expérience cross-canal. Le commerce conversationnel ne libèrera complètement son potentiel qu’avec l’arrivée des devices visuels » termine Maud Funaro, "il y a des étapes qui sont plus simples à passer, plus intuitives par la voix, mais pas toutes." Un avis que partage François Loviton, directeur Retail chez Google. 

Pour une désintermédiation partielle

"Le voice commerce comme point ultime de la désintermédiation ? Non, c’est un nouveau média qui vient en complément de l’expérience que chacun a et donc le métier de commerçant va perdurer, c’est simplement le mode d’interaction que celui-ci a avec son client qui va changer", précise-t-il. De la vue à la voix, la situation semble plus nuancée pour le directeur retail de Google qui présage un monde dans lequel "tous les médias se mélangent, sans que l’un ne remplace l’autre". 
Le voice-commerce, "ce n’est pas seulement une réponse apportée  au fait que nous passions plus de temps sur Internet mais bien parce que notre comportement a changé, on n’est plus les mêmes", déclare François Loviton. "On est tout d’abord plus curieux", ajoute-t-il, car grâce à un accès à Internet de plus en plus simplifié, le consommateur continue à aller chercher de l’information qu’il n’allait pas chercher avant. Le consommateur devient également de plus en plus impatient et supporte moins bien l’attente, qu’il se situe en magasin physique ou devant son ordinateur. Le consommateur est aussi de plus en plus exigent, en termes de qualité, de traçabilité des produits, et de qualité de l’information. "Face à ces nouvelles attentes, ce qu’on a permis aux clients d’avoir avec les assistants, c’est non plus d’accéder seulement à de l’information, mais d’accéder à de l’action. Et on ne parle pas ici de voice directement, ajoute-t-il, le voice devient simplement un média supplémentaire auquel je peux faire appel pour interagir avec Internet et l’assistant". 

Complémentarité voix et visuel, tournée vers l’action

1.    "La voix, c’est l’action", affirme François Loviton. Pour illustrer ses dires, le directeur Retail de Google précise que les requêtes lancées sur l’Assistant sont quarante fois plus orientées vers l’Action que le Search. 
2.    "Le comportement que l’on a vis-à-vis de ces assistants est très différent en termes de communication". En effet, les utilisateurs s’adressent à eux comme à des personnes : "naturellement, quand on est face à un objet abstrait, le cerveau humain va essayer de retrouver une forme familière, humaine, dans ces objets", explique François Loviton. Et finalement, n’est-ce pas la même chose avec la voix ? A son écoute, l’humain projette un comportement humain et adapte son comportement comme tel. 
3.    "Un nombre de possibilités pour s’exprimer infini" : par exemple, pour fixer une alarme (morning clock) sur Google Home, l’assistant a enregistré plus de 5000 phrases possibles. Via Google Home, il est mesuré qu’un utilisateur a 200 fois plus de requêtes de type conversationnel que de requêtes Search de même type. 
"L’association de devices qui mélangent la voix et l’écran. Un learning extrêmement important car on se rend compte que le bon mix sera surement cette complémentarité entre la voix et l’écran" poursuit François Loviton. Il s’agit de  "simplifier l’accès à l’information par la voix" et redonner praticité à l’utilisateur par l’intermédiaire d’une interface visuelle.
 

 

Revivez les échanges grâce à la playlist :

Pour en savoir plus sur la Chaire Rendez-vous sur:

Campuses