Titre : Métrologie de l'Internet du futur : nouvelles métriques et méthodes de mesures de la qualité de la navigation Web
Mots-clés : Métrologie, Navigation Web, Protocoles
Composition du jury :
- M. Toufik AHMEDProfesseur ENSEIRB
- M. Pedro CASASChercheur senior Austrian Institute of Technology
- M. Olivier FOURMAUXMaître de conférences Sorbonne Université
- M. Raouf BOUTABAProfesseur Université de Waterloo
- Mme Cristel PELSSERProfesseur Université de Strasbourg (ICube)
- M. Bertrand MATHIEUChercheur senior Orange Labs
- Mme Sandrine VATONProfesseur IMT Atlantique
Figure: Distribution de contenus lors de la navigation Web
Résumé :
La navigation Web est l'un des principaux services de l’Internet où un large éventail d'acteurs est impliqué et évolue de manière constante. Les nouveaux protocoles de l’Internet, les réseaux de diffusion de contenu (CDN) ou encore les évolutions des différents navigateurs Web sont destinés à améliorer les temps de chargement des pages. Pour mieux comprendre la Qualité d'Expérience (QoE) perçue par les utilisateurs, il est donc essentiel d’identifier comment le contenu des pages est constitué et délivré et de fournir une métrique de QoE pertinente. Dans cette thèse, nous avons conçu un nouvel outil, Web View, destiné à effectuer des sessions de navigation Web automatisées et mesurant de nombreuses informations liées à l’écosystème du Web. Nous avons aussi défini une nouvelle métrique Web, le Time for Full Visual Rendering (TFVR). À partir de plus de 18 trillions de mesures effectuées pendant 2,5 ans sur les 10,000 sites Web les plus visités (selon la classification Alexa), nous avons utilisé des techniques statistiques pour identifier les paramètres clés qualifiant et quantifiant la qualité de la navigation Web. Cet ensemble de facteurs a été confirmé par un processus d'apprentissage automatique, donnant en sortie un ensemble de règles pour prédire les temps de chargement des pages Web. Pour les pages Web où des fluctuations dans les temps de chargement sont fréquentes, nous avons utilisé des modèles de chaines de Markov cachées suivant un processus de Dirichlet hiérarchique (HDP-HMM) pour enrichir notre modèle et ainsi augmenter le taux de prédiction correspondant. L'évaluation de notre modèle basé sur un arbre de décision sur des sites Web jamais mesurés montre que nous pouvons prédire correctement la qualité de la navigation Web. Ces travaux visent ainsi à permettre aux opérateurs de réseaux et aux fournisseurs de services d’augmenter la Qualité de Service (QoS) offerte à leurs clients.
Soutenance le vendredi 15 mai 2020 à 14h00 en visio-conférence
(dispositions exceptionnelles durant la crise sanitaire liée au Covid19)
par Pascale MÉNARD