Alexa : quand l'assistant vocal sert à affiner les résultats de requête via une écoute des employés d'Amazon !

L'ère de la domotique et de l'assistanat connecté n'inclut pas que des avantages pour l'utilisateur : preuve en est, dernièrement, avec Bloomberg, qui révèle que des employés du WebMarchand Américain ont pour tâche d'écouter les propriétaires des appareils embarquant Alexa, pour mieux appréhender les requêtes et demandes orales...

 

 

"Nous ne retenons qu'un échantillon restreint d'enregistrements vocaux d'Alexa afin d'améliorer l'expérience client. Par exemple, ces informations nous aident à former nos systèmes de reconnaissance de la parole et de la compréhension du langage naturel, ce qui permet à Alexa de mieux comprendre vos demandes et de veiller à ce que le service fonctionne pour tout le monde [...] Nous appliquons des mesures de protection techniques et opérationnelles strictes et appliquons une politique de tolérance zéro en cas d’abus de notre système. Les employés n’ont pas directement accès aux informations permettant d’identifier la personne ou le compte dans le cadre de ce flux de travail. Toutes les informations sont traitées avec une grande confidentialité et nous utilisons une authentification multi-facteurs pour limiter l'accès, le cryptage des services et des audits de notre environnement de contrôle pour protéger l'ensemble", affirme un porte-parole d'Amazon.

Toujours selon les investigations de Bloomberg, ces employés, à la manière probablement d'une équipe de renseignement, écoute en moyenne pendant 9 heures par jour quelques 1000 enregistrements audios. Selon certains employés, l'écoute glanerait au passage - fatalement - l'ensemble d'une écoute (autre que les requêtes liées strictement à l'usage d'un Amazon Echo, par exemple), comme la vie quotidienne d'un foyer, quitte à entendre des cris de détresse d'enfants ce qui, ici, commence à poser problème, puisque la loi (presque dans tout les pays et très certainement aux États-Unis) impose, en cas de maltraitance ou de signaux de détresse pour un adulte, un enfant, d'appeler les secours ou le numéro spécialisé (en France, le 119)... Une assistance à non personne en danger ou potentiellement en danger dont certains employés feraient naturellement abstraction, préférant en parler entre eux dans les salles de détente, de pause...

 

 

(Source : Ruthe.de)

 

Quid de la concurrence pourra t-on, alors, rétorquer ? Amazon n'est pas le seul à abuser impunément de ces pratiques douteuses et non éthiques puisqu'en Mai 2018, la Quadrature du Net alarmait sur les méthodes de travail appliquées par Microsoft pour son assistant vocal Cortana, selon les propos d'une employée qui "dressait" l'Intelligence Artificielle pour mieux optimiser son système : en clair, si l'IA s’avérera probablement plus intelligente que l'humain, à la base, comme toute chose sur Terre, elle a besoin d'apprendre les bases à travers quelque chose ou quelqu'un (ici, une employée de Microsoft). La Quadrature explique que ces personnes sont recrutées depuis des plate-formes de télétravail ou micro-travail et sont payées à l'heure, un peu comme un intérimaire qui effectue une missions pour un laps de temps défini (hors prorogation(s)) "Les transcripteurs se connectaient, et écoutaient un par un les enregistrements. Les pistes étaient généralement très courtes, entre 3 et 15 secondes en moyenne (mais pouvaient parfois durer plusieurs minutes). En fonction des projets sur lesquels on travaillait, on devait réaliser entre 120 et 170 transcriptions/heure. Plusieurs milliers de pistes étaient déposées quotidiennement sur notre plate-forme [...] Selon moi, ce n’était pas bien sécurisé, surtout quand on considère le fait qu’on avait aussi beaucoup d’enregistrements provenant d’enfants. Mais il faut comprendre que ce genre de traitement de données est de toute façon impossible à sécuriser entièrement".

L'assistant vocal d'Apple, Siri, se calerait sur le même modèle d'apprentissage que ses concurrents tout comme l'assistant de Google, Home, via des informations (avec un identifiant, certes, "aléatoire") stockées pendant un certain temps et, comme pour Alexa, un accès - côté employé - à des bouts de pistes vocales. Google affirmerait, cependant, que chez eux, ces pistes sont déformées par défaut et qu'il n'y a aucun identifiant assigné par piste ou groupe de piste vocal... A suivre !

 

Source : Bloomberg - 11 Avril 2019 - Les employés d'Amazon écoutent ce que recueille Alexa pour optimiser l'IA.