Page 16 - Mégadonnées, apprentissage automatique, protection des usagers et confidentialité
P. 16
visant à informer les usagers de la manière dont leurs sables du non-respect des lois relatives à la protec-
données personnelles seront recueillies, utilisées et tion des usagers et à la confidentialité des données.
communiquées à des parties tierces, et à quelles fins, Elle examine i) les droits des usagers à accéder aux
ainsi que sur les exigences relatives à l'obtention de données à caractère personnel les concernant, à
leur consentement, nécessaire pour légitimer l'utili- rectifier les erreurs qu'elles contiennent et à deman-
sation des données personnelles. der leur effacement (section 7.1); ii) le manque de
La section 1 porte quant à elle sur la phase d'enga- transparence lié à l'obtention d'explications sur les
gement, qui concerne les restrictions, les exigences résultats complexes des modèles d'apprentissage
et la responsabilité liées à l'utilisation des données à automatique (section 7.2); iii) le droit de contes-
caractère personnel par les entreprises, notamment ter les décisions et d'obtenir une intervention
s'agissant de la précision des modèles d'apprentis- humaine (section 7.3); et iv) la difficulté de démon-
sage automatique (section 6.1), du traitement partial trer un préjudice (section 7.4).
et discriminatoire des données (section 6.2), de la La section 8 examine certaines mesures pratiques
violation des données et de la réidentification (sec- que les entreprises pourraient prendre pour réduire
tion 6.3), ainsi que de la communication des données les risques face aux incertitudes juridiques et régle-
à des parties tierces (section 1.1). mentaires. Le présent document se clôt sur la sec-
La section 7 s'intéresse à la phase de post-enga- tion 0, qui dresse une courte liste d'aspects à amé-
gement et aux moyens dont disposent les usagers liorer dans ce domaine, qu'il s'agisse de l'élaboration
pour tenir les opérateurs de mégadonnées et des de principes déontologiques, de normes ou de pro-
systèmes d'apprentissage automatique respon- cédures.
2 COMPRENDRE LES MÉGADONNÉES, LA PROTECTION DES USAGERS ET LA CONFIDENTIALI-
TÉ DES DONNÉES
2�1 Que sont les mégadonnées et l'apprentissage Les mégadonnées reposent sur un traitement
automatique? informatique impliquant des volumes élevés et plu-
L'intelligence artificielle implique des techniques sieurs variétés de types de données interconnectées
qui cherchent à imiter certains aspects de la cogni-
tion humaine ou animale au moyen d'ordinateurs. Figure 1 – Apprentissage automatique, xkcd.com
L'apprentissage automatique, une forme d'intelli-
gence artificielle, désigne la capacité d'un système
à améliorer ses performances, en dégageant des
formes ou des motifs à partir de grands ensembles
de données, et ce, à plusieurs niveaux d'analyse (on
parle souvent d'apprentissage profond) .
24
Les algorithmes d'apprentissage automatique
bâtissent un modèle à partir de données d'appren-
tissage, c'est-à-dire d'exemples passés, afin de faire
des prédictions ou de prendre des décisions, plutôt
que de suivre uniquement une logique préprogram-
mée. Les réseaux neuronaux analysent les données
à travers de nombreuses couches de matériel et
de logiciel . Chaque couche produit sa propre
25
représentation des données et partage ce qu'elle a
"appris" avec la couche suivante. L'apprentissage
automatique est un apprentissage par l'exemple: on
utilise les données d'apprentissage pour entraîner
le modèle à se comporter d'une certaine manière .
26
Cette technique n'est pas nouvelle, mais grâce aux
mégadonnées, elle a trouvé de nombreuses utilisa-
tions concrètes .
27
14 Mégadonnées, apprentissage automatique, protection des usagers et confidentialité