Page 19 - Mégadonnées, apprentissage automatique, protection des usagers et confidentialité
P. 19
relier les données d'utilisation d'un smartphone à • données provenant des médias sociaux;
celles d'un ordinateur et d'une tablette, par exemple. • données interentreprises acquises auprès des
Avec le développement de l'Internet des objets, les parties prenantes de la chaîne d'approvisionne-
données provenant des appareils qu'une personne ment;
utilise au travail, chez elle ou sur son corps seront de • données sur l'agriculture (par exemple, les ali-
plus en plus interconnectées. En raison de ce large ments provenant de la production de maïs);
éventail de sources de données interconnectées, il • données provenant des points de vente;
est possible de suivre les déplacements d'un utilisa- • données sur les prescriptions pharmaceutiques.
teur grâce à des applications de cartographie, à l'his-
torique de son navigateur et de ses recherches, à ce La connectivité croissante des appareils offre aux
qu'il "aime" et qui il "aime" sur les réseaux sociaux, fournisseurs de services financiers la possibilité d'uti-
aux vidéos ou à la musique qu'il a visionnées ou liser certaines données. Par exemple, les voitures
écoutée en streaming, à l'historique de ses achats, au d'aujourd'hui disposent d'une puissance de calcul
contenu de ses articles de blog et de ses commen- considérable, utilisent un codage avancé et traitent
taires publiés en ligne, et bien plus encore. Des entre- d'énormes volumes de données . Avant d'octroyer
35
prises telles que Branch, Tala et Jumo ont dévelop- un prêt, les prêteurs exigent de plus en plus souvent
pé d'importantes activités de crédit numérique en des emprunteurs, en particulier des emprunteurs
Afrique en s'appuyant sur ces données alternatives. à haut risque, qu'ils consentent à l'installation de
dispositifs de suivi dans leur voiture (dispositifs d'in-
Types de données générales terruption de démarrage, par exemple). Les dispo-
Il existe de nombreuses autres sources de données sitifs d'interruption de démarrage ont l'avantage de
relatives aux personnes qui peuvent être combinées contribuer à l'application des droits de reprise de
pour les besoins d'opérations ayant recours aux possession, car ils permettent au prêteur de désacti-
mégadonnées. Ces données peuvent être recueillies ver un véhicule si l'emprunteur ne rembourse pas son
auprès des commerces de détail où une personne prêt. Dans le même temps, ces dispositifs de suivi
effectue des achats ou des sociétés de cartes de recueillent des données sur les activités courantes
crédit utilisées pour les transactions, ou bien à partir et les lieux visités au quotidien, permettant ainsi de
de dispositifs de détection Bluetooth installés dans déterminer l'adresse du domicile et du lieu de travail,
les magasins (collecte de données passive), de si la personne conduit toujours pour se rendre à son
photos de personnes prises par caméra, de plaques lieu de travail habituel (ce qui permet donc égale-
d'immatriculation de voitures enregistrées par camé- ment de déduire sa situation professionnelle), où la
ra, d'informations sur les médicaments recueillies personne aime faire des achats ou se divertir, et tout
lors d'achats de produits pharmaceutiques, ainsi que écart par rapport aux habitudes, ce qui peut indi-
d'enregistrements effectués par des jouets dotés quer des changements de préférences. Les disposi-
d'un microphone ou d'une caméra, pour ne citer que tifs de suivi peuvent également fournir des données
quelques sources. Un conseiller auprès d'investis- sur le comportement des personnes au volant, qui
seurs actifs sur le marché des mégadonnées recense indiquent leur niveau de compétence, voire même
les sources suivantes de données alternatives dispo- parfois un état émotionnel ou psychologique parti-
nibles sur le marché actuel : culier (par exemple, des accélérations répétées et
34
inhabituellement rapides, ou un freinage inhabituel-
• données provenant d'agrégateurs financiers; lement brusque).
• données de cartes de crédit; Aujourd'hui, déduire des informations sur les indi-
• données géospatiales et de localisation; vidus constitue un marché important. La manière
• ensembles de données recueillies sur Internet; dont elles sont générées et utilisées est abordée dans
• données sur l'utilisation des applications; la section suivante. De manière générale, la relation
• données des douanes américaines relatives aux entre l'intelligence artificielle et les mégadonnées est
expéditions; "bidirectionnelle". Les mégadonnées s'appuient sur
• données sur les dépenses publicitaires; l'intelligence artificielle et l'apprentissage automa-
• données mises à disposition sur des API; tique pour extraire de la valeur de grands ensembles
• données de localisation/circulation piétonnière de données, et l'apprentissage automatique repose
provenant de capteurs et de routeurs; sur un volume énorme de données .
36
Mégadonnées, apprentissage automatique, protection des usagers et confidentialité 17