Manuscrit de thèse

2025-05-16

Auteurs:   Alexandre Louvet

Résumé

Les données de grande dimension sont courantes dans des domaines tels que la génomique, le traitement d'images et l'analyse des réseaux sociaux. Elles posent des défis importants en matière d'analyse computationnelle et statistique. L'augmentation de la taille des ensembles de données dans ces différents domaines accroît le besoin d'outils efficaces d'approximation des données. Même si la dimension des données peut être grande, leur dimension intrinsèque, c’est-à-dire la dimension minimale de l’information qu’elles contiennent, peut être réduite. Cela est représenté à travers des concepts tels que la dimension VC, que nous discutons dans ce travail. Nous concentrons notre étude sur la recherche d’algorithmes efficaces pour de grands ensembles de données de dimension intrinsèque fixe.

Dans cette thèse, nous présentons des algorithmes pour calculer des structures fondamentales de la réduction combinatoire des données : \(\varepsilon\)-approximations, \(\delta\)-recouvrements, colorations à faible discrépance et partitions à faibles croisements. En particulier, nous étudions les trois problèmes suivants.

Dans la première partie, nous présentons un nouveau jeu à deux joueurs et montrons l'existence d'une stratégie quasi-optimale en utilisant le célèbre algorithme de discrépance de Lovett-Meka. Nous présentons ensuite un algorithme à poids multiplicatifs pour calculer une famille de colorations à faible discrépance moyenne, utilisant la valeur de notre jeu dans son analyse.

Dans la deuxième partie, nous présentons un nouvel algorithme de partition à faibles croisements pour les systèmes d'ensembles généraux. Il s'agit de la première instance d'un algorithme pratiquement rapide pour calculer des partitions à faibles croisements de systèmes d'ensembles généraux, les résultats précédents utilisant étant limités aux systèmes engendrés par des demi-espaces en dimension faible.

Enfin, nous présentons de nouveaux algorithmes pour calculer des \(\delta\)-recouvrements quasi minimaux de systèmes d'ensembles de dimension VC finie. Ces algorithmes sont les premiers algorithmes non triviaux permettant d'obtenir des \(\delta\)-recouvrements de taille minimale. Nous en présentons des applications à la coloration à faible discrépance et à l'\(\varepsilon\)-approximation, en dérivant des algorithmes plus rapides atteignant la discrépance optimale pour les systèmes d'ensembles de dimension VC finie : \(O(n^{1 / 2-1 / (2d)})\).

Manuscrit

Repose sur les publications suivantes

Autres publications

Jury

NameAffiliationRole
Frédérique BassinoUniversité Sorbonne Paris NordExaminatrice
Victor-Emmanuel BrunelÉcole Nationale de la Statistique et de l'Administration EconomiqueDirecteur
Sergio CabelloUniversity of LjubljanaRapporteur
Mónika CsikósUniversité Paris CitéExaminatrice
Yan GérardUniversité Clermont AuvergneExaminateur
Guillaume LecuéÉcole Supérieure des Sciences Economiques et CommercialesExaminateur
Nabil MustafaUniversité Sorbonne Paris NordDirecteur
János PachRényi Institute of MathematicsExaminateur
Jeff M. PhillipsUniversity of UtahRapporteur