Anne-Sophie Charest, professeure agrégée
Pavillon Alexandre-Vachon, local 1061B
T. 418 656-2131 poste 2950
F. 418 656-5902
anne-sophie.charest@mat.ulaval.ca
Champs d'intérêts
  • Confidentialité de données statistiques
  • Modélisation de données d'enquête
  • Traitement de données manquantes

Enseignement

À l'automne 2012, je vais enseigner le cours Régression

(STT-2100).

Voir le portail des

cours pour le site web du cours.

Recherche

Confidentialité de données statistiques

Quand des agences statistiques collectent des données sur des individus ou des entreprises, elles promettent habituellement aux répondants que ces données seront utilisées de façon confidentielle. Il faut donc faire attention à la façon dont ces données sont partagées avec des chercheurs de l'extérieur. Certaines données ne pourront jamais être partagées, alors que d'autres seront modifiées avant leur publication à l'aide de différentes méthodes statistiques pour protéger la confidentialité.

Je travaille sur la création de jeux de données synthétiques qui conservent les propriétés statistiques du vrai jeu de données (et peuvent donc être utilisés sans problème par les chercheurs) mais ne permettent pas d'identifier un individu ou d'en apprendre trop sur ses charactéristiques. Je m'intéresse en particulier à l'utilisation du critère de confidentialité différentielle, qui mesure de façon très formelle la guarantie de confidentialité offerte par certaines méthodes de partage de données et résultats statistiques.

Voir mon article dans le Journal of Privacy and Statistics.

Analyses de données d'enquêtes

Les données d'enquêtes sont habituellement analysées sous le paradigme de l'approche de randomisation. L'inférence est plus complexe si on désire ajuster un modèle aux données d'enquête tout en tenant compte de la randomisation.

Dans un article co-écrit avec Jean-François Beaumont, nous étudions l'estimation de la variance des paramètres de modèles ajustés avec des données d'enquêtes et montrons que les méthodes généralement utilisées sous-estiment grandement cette variance. Nous proposons également une méthode bootstrap pour estimer correctement la variance des estimateurs.

Autres

Je m'intéresse également au traitement des données manquantes pour l'inférence, en particulier avec la méthode d'imputation multiple. Voir par exemple cet article sur l'imputation multiple pour l'enquête NHANES.

J'ai aussi co-écrit un article sur l'estimation du nombre de cyclone tropicaux dans les 150 dernières années à partir de données partielles recueillies par observations terrestres, bateaux, avions et satellites. Nous utilisons l'analyse baysienne pour étudier l'impact de différentes hypothèses concernant la qualité des données sur les conclusions à propos du changement du nombre de cyclones depuis 1851.  

Supervision d'étudiants aux cycles supérieurs

Je suis à la recherche d'étudiants pour travailler avec moi, entre autres sur la confidentialité de jeux de données synthétiques.

Contactez moi si vous voulez discuter des possibilités.

Formation et expériences professionnelles

Je suis originaire de la ville de Québec et je suis très contente d'y revenir après avoir passé quelques années à l'extérieur pour les études. J'ai obtenu un baccalauréat en statistiques de l'Université McGill en 2007, et en 2012 un doctorat en statistiques de l'Université Carnegie Mellon, à Pittsburgh, en Pennsylvanie.

Mon sujet de thèse concerne la confidentialité de données statistiques, mais je suis aussi intéressée par l'analyse de données d'enquêtes, le traitement de données manquantes et l'approche d'inférence bayesienne. (plus de détails dans la section recherche)

 

  • B. Sc. (statistique), McGill University
  • M. Sc. (statistique), Carnegie Mellon University
  • Ph. D. (statistique), Carnegie Mellon University  
 
Retour à la liste