Des données de meilleure qualité pour l'IA – Une tâche possible
UN-CCSA/ CNUCED/UIT/ Colombie, Norvège, Royaume-Uni
Session 239
Les grands modèles de langage et l'IA générative façonnent de plus en plus la manière dont les connaissances sont utilisées et partagées, mais leur fiabilité dépend de la qualité et de la provenance des données d'entraînement. À mesure que l'IA s'étend à la gouvernance, aux services publics et aux marchés, l'identification de sources fiables et bien documentées est devenue une priorité mondiale.
Les statistiques officielles constituent un bien public essentiel : produites selon des normes professionnelles, des méthodologies transparentes et sous contrôle public, elles s’appuient sur des données administratives, des enquêtes et des données privées. Elles fournissent des données de référence indispensables à la validation, au calibrage et à l’évaluation comparative des résultats de l’IA. Face à l’augmentation du volume et à l’hétérogénéité de la qualité des données, les ensembles de données statistiques faisant autorité contribuent à vérifier les résultats et à garantir leur cohérence avec les données probantes établies.
La combinaison de données diverses pour l'IA soulève des défis en matière d'assurance qualité, de métadonnées, de représentativité, de biais, de propriété intellectuelle et de protection de la vie privée. Les processus WSIS+20 et GDC mettent l'accent sur des approches partagées pour des écosystèmes numériques sûrs, inclusifs et interopérables.
Cette session examinera comment les communautés statistiques et géospatiales, les entreprises privées, les ONG et des initiatives telles que le programme « Financement du développement » sur l’avenir des données et l’Observatoire des données de confiance peuvent collaborer pour améliorer les données au service de l’IA. Elle explorera les principes d’identification, de conservation et de partage des ensembles de données et des métadonnées de haute qualité. Des experts des instituts nationaux de statistique, des organisations internationales, du monde universitaire et du secteur privé discuteront du rôle des données publiques et privées, des bonnes pratiques de documentation des ensembles de données adaptés à l’IA, des innovations en matière d’IA appliquée aux données et des possibilités de coopération pour garantir que la prochaine génération d’IA repose sur des données fiables, responsables et bénéfiques à l’échelle mondiale.
-
C1. Le rôle des gouvernements et de toutes les parties prenantes dans la promotion des TIC pour le développement
-
C2. L'infrastructure de l'information et de la communication
-
C6. Créer un environnement propice
-
C11. Coopération internationale et régionale
-
Objectif 17: Renforcer les moyens du partenariat mondial pour le développement durable et le revitaliser
- Objectif 1 : Combler toutes les fractures numériques et accélérer les progrès vers la réalisation des Objectifs de développement durable
- Objectif 2 : Élargir l'inclusion et les bénéfices de l'économie numérique pour tous