Page 19 - Mégadonnées, apprentissage automatique, protection des usagers et confidentialité
P. 19

relier les données d'utilisation d'un smartphone à   •   données provenant des médias sociaux;
            celles d'un ordinateur et d'une tablette, par exemple.   •   données interentreprises acquises auprès des
            Avec le développement de l'Internet des objets, les   parties prenantes de la chaîne d'approvisionne-
            données provenant des appareils qu'une personne       ment;
            utilise au travail, chez elle ou sur son corps seront de   •   données sur l'agriculture (par exemple, les ali-
            plus en plus interconnectées. En raison de ce large   ments provenant de la production de maïs);
            éventail de sources de données interconnectées, il   •   données provenant des points de vente;
            est possible de suivre les déplacements d'un utilisa-  •   données sur les prescriptions pharmaceutiques.
            teur grâce à des applications de cartographie, à l'his-
            torique de son navigateur et de ses recherches, à ce   La connectivité croissante des appareils offre aux
            qu'il "aime" et qui il "aime" sur les réseaux sociaux,   fournisseurs de services financiers la possibilité d'uti-
            aux  vidéos  ou  à  la  musique  qu'il  a  visionnées  ou   liser certaines données. Par exemple, les voitures
            écoutée en streaming, à l'historique de ses achats, au   d'aujourd'hui disposent d'une puissance de calcul
            contenu de ses articles de blog et de ses commen-  considérable, utilisent un codage avancé et traitent
            taires publiés en ligne, et bien plus encore. Des entre-  d'énormes volumes de données . Avant d'octroyer
                                                                                           35
            prises telles que Branch, Tala et Jumo ont dévelop-  un prêt, les prêteurs exigent de plus en plus souvent
            pé d'importantes activités de crédit numérique en   des emprunteurs, en particulier des emprunteurs
            Afrique en s'appuyant sur ces données alternatives.  à haut risque, qu'ils consentent à l'installation de
                                                               dispositifs de suivi dans leur voiture (dispositifs d'in-
            Types de données générales                         terruption  de  démarrage,  par  exemple).  Les  dispo-
            Il existe de nombreuses autres sources de données   sitifs d'interruption de démarrage ont l'avantage de
            relatives aux personnes qui peuvent être combinées   contribuer à l'application des droits de reprise de
            pour les besoins d'opérations ayant recours aux    possession, car ils permettent au prêteur de désacti-
            mégadonnées. Ces données peuvent être recueillies   ver un véhicule si l'emprunteur ne rembourse pas son
            auprès des commerces de détail où une personne     prêt. Dans le même temps, ces dispositifs de suivi
            effectue des achats ou des sociétés de cartes de   recueillent des données sur les activités courantes
            crédit utilisées pour les transactions, ou bien à partir   et les lieux visités au quotidien, permettant ainsi de
            de dispositifs de détection Bluetooth installés dans   déterminer l'adresse du domicile et du lieu de travail,
            les magasins (collecte de  données  passive), de   si la personne conduit toujours pour se rendre à son
            photos de personnes prises par caméra, de plaques   lieu de travail habituel (ce qui permet donc égale-
            d'immatriculation de voitures enregistrées par camé-  ment de déduire sa situation professionnelle), où la
            ra, d'informations sur les médicaments recueillies   personne aime faire des achats ou se divertir, et tout
            lors d'achats de produits pharmaceutiques, ainsi que   écart par rapport aux habitudes, ce qui peut indi-
            d'enregistrements effectués par des jouets dotés   quer des changements de préférences. Les disposi-
            d'un microphone ou d'une caméra, pour ne citer que   tifs de suivi peuvent également fournir des données
            quelques sources. Un conseiller auprès d'investis-  sur le comportement des personnes au volant, qui
            seurs actifs sur le marché des mégadonnées recense   indiquent  leur  niveau  de  compétence,  voire  même
            les sources suivantes de données alternatives dispo-  parfois un état émotionnel ou psychologique parti-
            nibles sur le marché actuel :                      culier (par exemple, des accélérations répétées et
                                    34
                                                               inhabituellement rapides, ou un freinage inhabituel-
            •   données provenant d'agrégateurs financiers;    lement brusque).
            •   données de cartes de crédit;                     Aujourd'hui, déduire des informations sur les indi-
            •   données géospatiales et de localisation;       vidus constitue un marché important. La manière
            •   ensembles de données recueillies sur Internet;  dont elles sont générées et utilisées est abordée dans
            •   données sur l'utilisation des applications;    la section suivante. De manière générale, la relation
            •   données des douanes américaines relatives aux   entre l'intelligence artificielle et les mégadonnées est
                expéditions;                                   "bidirectionnelle". Les mégadonnées s'appuient sur
            •   données sur les dépenses publicitaires;        l'intelligence artificielle et l'apprentissage automa-
            •   données mises à disposition sur des API;       tique pour extraire de la valeur de grands ensembles
            •   données de localisation/circulation piétonnière   de données, et l'apprentissage automatique repose
                provenant de capteurs et de routeurs;          sur un volume énorme de données .
                                                                                             36





                                             Mégadonnées, apprentissage automatique, protection des usagers et confidentialité  17
   14   15   16   17   18   19   20   21   22   23   24