
- >Recherche
- >Études doctorales et HDR
- >Soutenir sa thèse
- >Les soutenances
- >Tomasz SKALSKI
Soutenance de thèse de Monsieur Tomasz SKALSKI
Le 13 octobre 2023 de 12:15 à 15:15
13h15 | POLITECHNIKA WROCLAWSKA (WUST) | WROCLAW | POLOGNE
Sujet : Geometric and Combinatorial Aspects of Statistical Models
Directeur de thèse : Monsieur Piotr GRACZYK
RÉSUMÉ
Cette thèse traite des applications de la combinatoire et de la géométrie discrète aux statistiques modernes. La première application porte sur l’une des approches fréquemment utilisées pour faire face au volume croissant des données, à savoir l’utilisation de méthodes de régression linéaire pénalisée. Dans le but de retrouver la structure que possède le vecteur des coefficients de régression, nous commençons notre discussion par l’estimateur SLOPE (Sorted l1 Penalized Estimator), qui a été proposé il y a presque dix ans. En particulier, nous examinons la notion de schéma SLOPE, qui conserve l’information sur le support, le signe et le classement des coefficients de régression. En particulier, il préserve les groupes de coefficients ayant la même valeur absolue. Dans le chapitre 3, nous fournissons les conditions, sous lesquelles SLOPE récupère l’ensemble des variables pertinentes et des groupes lorsque la matrice de planification est orthogonale. Nous déduisons également de nouveaux résultats sur la forte consistance de l’estimateur SLOPE et de son schéma. Le chapitre 4 étend la discussion sur l’estimateur SLOPE à une classe générale de matrices de planification fixes. Nous fournissons la condition d’irreprésentabilité du SLOPE, qui est nécessaire et suffisante pour le recouvrement du schéma dans le cadre non-bruité et nous illustrons cette propriété géométriquement. Dans un deuxième temps, nous considérons le cas asymptotique lorsque le nombre de variables explicatives tend vers l’infini et que l’erreur est incrémentale. Dans le chapitre 5, nous étudions la classe plus large des estimateurs pénalisés, appelés les jauges polyédriques. Elle permet d’utiliser les notions issues de la géométrie des polyèdres pour généraliser la notion du schéma et les résultats sur sa récupération. Le chapitre 6 s’articule autour de l’existence de l’estimateur du maximum de vraisemblance (MLE) pour les familles exponentielles discrètes. Nous donnons sa nouvelle caractérisation basée sur la notion d’ensemble d’unicité. Par la suite, nous inspectons la taille des échantillons indépendants identiquement distribués qui est nécessaire pour assurer son existence avec une grande probabilité. Pour cela, nous utilisons les notions issues de l’analyse des hypercubes discrets et appliquons nos résultats dans l’environnement des graphes aléatoires. Le dernier des chapitres relie la théorie des schémas graphiques en statistique avec la notion de matrices laplaciennes de graphes et de processus de Wiener discrétisés. La thèse est basée sur trois articles déjà publiés et deux prépublications, qui sont disponibles en ligne.