Antoine SAVERIMOUTOU soutient sa thèse de doctorat

Titre : Métrologie de l'Internet du futur : nouvelles métriques et méthodes  de mesures de la qualité de la navigation Web

Mots-clés : Métrologie, Navigation Web, Protocoles

Texte

Composition du jury :

- M. Toufik AHMEDProfesseur ENSEIRB
- M. Pedro CASASChercheur senior Austrian Institute of Technology
- M. Olivier FOURMAUXMaître de conférences Sorbonne Université
- M. Raouf BOUTABAProfesseur Université de Waterloo
- Mme Cristel PELSSERProfesseur Université de Strasbourg (ICube)
- M. Bertrand MATHIEUChercheur senior Orange Labs
- Mme Sandrine VATONProfesseur IMT Atlantique

Distribution de contenus lors de la navigation Web

Figure: Distribution de contenus lors de la navigation Web


Résumé :
La navigation Web est l'un des principaux services de l’Internet où un large éventail d'acteurs est impliqué et évolue de manière constante. Les nouveaux protocoles de l’Internet, les réseaux de diffusion de contenu (CDN)  ou  encore  les  évolutions  des  différents  navigateurs  Web  sont  destinés  à  améliorer  les  temps  de chargement des pages. Pour mieux comprendre la Qualité d'Expérience (QoE) perçue par les utilisateurs, il est donc essentiel d’identifier comment le contenu des pages est constitué et délivré et de fournir une métrique de QoE pertinente. Dans cette thèse, nous avons conçu un nouvel outil, Web View, destiné à effectuer des sessions de navigation Web automatisées et mesurant de nombreuses informations liées à l’écosystème du Web. Nous avons aussi défini une nouvelle métrique Web, le Time for Full Visual Rendering (TFVR). À partir de plus de 18 trillions de mesures effectuées pendant 2,5 ans sur les 10,000 sites Web les plus visités (selon la  classification Alexa),  nous  avons  utilisé  des  techniques  statistiques  pour  identifier  les  paramètres  clés qualifiant et quantifiant la qualité de la navigation Web. Cet ensemble de facteurs a été confirmé par un processus d'apprentissage automatique, donnant en sortie un ensemble de règles pour prédire les temps de chargement des pages Web. Pour les pages Web où des fluctuations dans les temps de chargement sont fréquentes, nous avons utilisé des modèles de chaines de Markov cachées suivant un processus de Dirichlet hiérarchique (HDP-HMM) pour enrichir notre modèle et ainsi augmenter le taux de prédiction correspondant. L'évaluation de notre modèle basé sur un arbre de décision sur des sites Web jamais mesurés montre que nous pouvons prédire correctement la qualité de la navigation Web. Ces travaux visent ainsi à permettre aux opérateurs de réseaux et aux fournisseurs de services d’augmenter la Qualité de Service (QoS) offerte à leurs clients.
 
Soutenance le vendredi 15 mai 2020 à 14h00 en visio-conférence
(dispositions exceptionnelles durant la crise sanitaire liée au Covid19)

Publié le 11.05.2020

par Pascale MÉNARD