Anne-Sophie Charest, Professeure agrégée
Pavillon Alexandre-Vachon, local 1061B
T. (418) 656-2131, poste 2950
F. (418) 656-5902
anne-sophie.charest@mat.ulaval.ca
Champs d'intérêts

  • Confidentialité de données statistiques
  • Modélisation de données d'enquête

  • Traitement de données manquantes
Recherche

Confidentialité de données statistiques

Quand des agences statistiques collectent des données sur des individus ou des entreprises, elles promettent habituellement aux répondants que ces données seront utilisées de façon confidentielle. Il faut donc faire attention à la façon dont ces données sont partagées avec des chercheurs de l'extérieur. Certaines données ne pourront jamais être partagées, alors que d'autres seront modifiées avant leur publication à l'aide de différentes méthodes statistiques pour protéger la confidentialité.

Je travaille sur la création de jeux de données synthétiques qui conservent les propriétés statistiques du vrai jeu de données (et peuvent donc être utilisés sans problème par les chercheurs) mais ne permettent pas d'identifier un individu ou d'en apprendre trop sur ses charactéristiques. Je m'intéresse en particulier à l'utilisation du critère de confidentialité différentielle, qui mesure de façon très formelle la guarantie de confidentialité offerte par certaines méthodes de partage de données et résultats statistiques.

Voir mon article dans le Journal of Privacy and Statistics.

Analyses de données d'enquêtes

Les données d'enquêtes sont habituellement analysées sous le paradigme de l'approche de randomisation. L'inférence est plus complexe si on désire ajuster un modèle aux données d'enquête tout en tenant compte de la randomisation.

Dans un article co-écrit avec Jean-François Beaumont, nous étudions l'estimation de la variance des paramètres de modèles ajustés avec des données d'enquêtes et montrons que les méthodes généralement utilisées sous-estiment grandement cette variance. Nous proposons également une méthode bootstrap pour estimer correctement la variance des estimateurs.

Autres

Je m'intéresse également au traitement des données manquantes pour l'inférence, en particulier avec la méthode d'imputation multiple. Voir par exemple cet article sur l'imputation multiple pour l'enquête NHANES.

J'ai aussi co-écrit un article sur l'estimation du nombre de cyclone tropicaux dans les 150 dernières années à partir de données partielles recueillies par observations terrestres, bateaux, avions et satellites. Nous utilisons l'analyse baysienne pour étudier l'impact de différentes hypothèses concernant la qualité des données sur les conclusions à propos du changement du nombre de cyclones depuis 1851.  

Formation
Cours
Retour à la liste