Yann BUSNEL

Poste

Responsable de département

Département

Département Systèmes Réseaux, Cybersécurité et Droit du numérique

Localisation

Rennes

Coordonnées :

Tél.

+33 2 99 12 70 50

Secrétariat

Sandrine FROUIN
02 99 12 70 54

Courrier

Campus de Rennes
2, rue de la Châtaigneraie
CS 17607
35 576 Cesson Sévigné Cedex
Biographie

Je suis Professeur d'université chez IMT Atlantique, Bretagne-Pays de la Loire (ex-Telecom Bretagne and Ecole des Mines de Nantes). Depuis le 1er janvier 2017, je suis responsable du département SRCD (Systèmes Réseaux, Cybersécurité et Droit du numérique) du Campus de Rennes. 

Suite à mon Doctorat d'informatique à l'Université de Rennes (France) en novembre 2008,  j'ai passé un an à l'Université "La Sapienza" de Rome, Italie (2008-2009). Puis, j'ai été Maître de Conférences à l'Université de Nantes, dans le département Informatique de l'UFR Sciences et Techniques (2009-2014). Par la suite, j'ai été enseignant-chercheur à l'ENSAI (Ecole Nationale de la Statistique et de l'Analyse de l'Information), où j'étais responsable du département informatique (2014-2016). J'ai finalement obtenu mon Habilitation à diriger les recherches (HDR) d'informatique à l'École Normale Supérieure de Rennes (France) en décembre 2016. 

Mes travaux de recherche portent principalement sur le traitement de grandes masses de données dans le modèle flux (Data stream over Big Data) et sur les modèles de systèmes répartis communicants, à grande échelle.

 

 

Projets en cours

 

Projets passés

  • Responsable d'un lot du projet DeSceNt, financé par le LabEx CominLabs (ANR-10-LABX-07-01) : http://www.descent.cominlabs.ueb.eu/fr (2013-2016)
  • Microsoft Research Azure Award (2015-2016) : Robust and efficient analytics of massive input streams
  • UE FP7 SM4All (2008-2011)
  • UE FP7 CoMiFin (2008-2011)
  • Réseau d'excellence européen ReSIST (2006-2009)
  • Equipe associée EpiNet (2006-2008)
  • ANR SVP (2005-2008)

 

 

 

Encadrement doctoral

  • Richard Westerlynck (Février 2017 - *) : Analyse répartie et extraction de tendances à grande échelle pour les données massives en santé
  • Vasile Cazacu (Février 2017 - *) : Calcul distribué pour la fouille de données cliniques
  • Alassane Samba (Janvier 2015 - *) : Technologies Big Data et modèles prédictifs pour la QoS des réseaux
  • Nicolò Rivetti (Novembre 2013 - Septembre 2016) : Traitement de flux de données à large échelle
  • Nagham Alhadad (Octobre 2010 - Juin 2014) : Systèmes communautaires centrés sur l’utilisateur

 

Responsabilités

Jurys de thèse

  • Examinateur lors de la soutenance de Nicoló Rivetti (Université de Nantes), le 30/09/2016.
  • Examinateur lors de la soutenance de Nagham Alhadad (Université de Nantes), le 20/06/2014.
  • Rapporteur du manuscrit de Adriano Cerocchi (Università la Sapienza di Roma), le 15/10/2012.
  • Examinateur lors de la soutenance de Herverson Riveiro (Inria Rennes), le 12/10/2012.

 

Responsabilités collectives

  • J’ai été recruté en tant que Responsable du département « Systèmes Réseaux, Cybersécurité et Droit du numérique » chez IMT Atlantique (2017–*).
  • J’ai été nommé membre du Comité de Direction d’IMT Atlantique (2017–*).
  • J’ai été nommé membre du Comité de Pilotage du pôle ResCom du GDR CNRS RSD (2017–*).
  • J’ai été nommé membre du Comité de Sélection et de Validation (CSV) du Pôle de compétitivité Images&Réseaux (2017–*).
  • J’ai été nommé membre du Comité de Perfectionnement du Master Informatique de l'Université de Nantes (2017–*).
  • J’ai été nommé membre du Comité de Pilotage de la Chaire PRACom de l'IMT Atlantique (2017–*).
  • J'ai été nommé en tant que responsable du département informatique de l'Ensai, Rennes (2014-2016).
  • J'ai été nommé en tant que co-responsable du Master internationnal "Big Data" de l'Ensai, Rennes (2014-2016).
  • J'ai été nommé en tant que responsable de la filière de 3e année "Statistique et inégnierie des données" de l'Ensai, Rennes (2014-2015).
  • J'ai été nommé président de la commission STIC au Conseil Universitaire des Relations Internationales (CURI) de l'Université de Nantes (2013-2014).
  • J'ai été élu en tant que membre du conseil de département informatique de l'Université de Nantes (2012-2014).
  • J'ai été responsable des relations internationales du Département Informatique de l'Université de Nantes (2010-2012).
  • J'ai été membre du comité de sélection du poste de maître de conférences, ouvert au concours 2011, à PolyTech Nantes.
  • J'ai été élu en tant que membre du conseil de laboratoire de l'IRISA, dans le collège Doctorant (2006-2008).
  • J'ai été nommé en tant que membre du conseil de département Informatique et Télécommunication de l'ENS Cachan - Bretagne (2004-2006).
  • J'ai été nommé délégué national du C.I.E.S Grand Ouest (Centre d'Initiation à l'Enseignement Supérieur). J'ai participé alors à la mission d'étude sur le devenir du CIES, menée par l'IGAENR pour le Ministère.

 

 

Thématiques

  • Modélisation et traitement statistique des flux de données à grande échelle
  • Modèles et applications de systèmes communicants répartis à très grande échelle (Protocoles de population, protocoles épidémiques, auto-organisation, ...)

 

Comités

Comités d'organisation
  • 17th International Conference on Ad Hoc Networks and Wireless (AdHoc-Now 2018), in Saint-Malo, France, in July 2018 (Publicity Chair) ;
  • 19e édition des Rencontres Francophones sur l’Algorithmique des Télécommunications (AlgoTel 2017), à Quiberon, en Mai 2017 ;
  • 18th International Conference on Principles of Distributed Systems (OPODIS 2015), in Rennes, France, en Décembre 2015 (Co-président du comité d'organisation) ;
  • 11th European Dependable Computing Conference (EDCC 2015), à Paris, France, en Septembre 2015 (Président du Forum Etudiant) ;
  • 6th Workshop on Theoretical Aspects of Dynamic Distributed Systems (TADDS 2014) dans le cadre de PODC 2014, à Paris, France, en Juillet 2014 (Co-président du comité d'organisation) ;
  • 16e édition des Rencontres Francophones sur l’Algorithmique des Télécommunications (AlgoTel 2014), à l'Ile de Ré, en Juin 2014 ;
  • 5th Workshop on Theoretical Aspects of Dynamic Distributed Systems (TADDS 2013) dans le cadre de DISC 2013, à Jerusalem, Israel, en Octobre 2013 (Co-président du comité d'organisation) ;
  • 15e édition des Rencontres Francophones sur l’Algorithmique des Télécommunications (AlgoTel 2013), à Pornic, en Mai 2013 (Président du comité d'organisation) ;
  • 4th Workshop on Theoretical Aspects of Dynamic Distributed Systems (TADDS 2012) dans le cadre de OPODIS 2012, à Rome, Italy, en Decembre 2012 (Co-président du comité d'organisation) ;
  • 1st Workshop on Dynamicity (DYNAM 2011) dans le cadre de OPODIS 2011, à Toulouse, France, en Decembre 2011 (Co-président du comité d'organisation) ;
  • 10e édition des Rencontres Francophones sur l’Algorithmique des Télécommunications (AlgoTel 2008), à Saint-Malo, en Mai 2008 ;
  • 13th European Conference on Parallel and Distributed Computing (Euro-Par 2007), à Rennes, France, en Août 2007 (Submission chair) ;
  • 1er Forum Docteurs et Entreprises, à Rennes, en 2006 ;
  • 3e Manifestation des Jeunes Chercheurs francophones dans les domaines des STIC (MajecSTIC 2005), à Rennes, en 2005.

 

Comités de programme
  • NCA 2018 : 17th IEEE International Symposium on Network Computing and Applications;
  • AdHoc-Now 2018 : 17th International Conference on Ad Hoc Networks and Wireless;
  • NCA 2017 : 16th IEEE International Symposium on Network Computing and Applications;
  • CoRes 2017 : 1ères Rencontres Francophones sur la Conception de Protocoles, l’Évaluation de Performance et l’Expérimentation des Réseaux de Communication;
  • NCA 2016 : 15th IEEE International Symposium on Network Computing and Applications;
  • CoRes 2016 : 1ères Rencontres Francophones sur la Conception de Protocoles, l’Évaluation de Performance et l’Expérimentation des Réseaux de Communication;
  • Student Forum @ EDCC 2015 : 11th European Dependable Computing Conference (Président du Comité de Programme);
  • NCA 2015 : 14th IEEE International Symposium on Network Computing and Applications (Président du Comité de Programme);
  • IEEE GlobeCom 2015 : IEEE Global Communications Conference ;
  • AlgoTel 2015 : 17es Rencontres Francophones sur l'Algorithmique des Télécommunications;
  • TADDS 2014 : 6th Workshop on Theoretical Aspects of Dynamic Distributed Systems, co-localisé avec PODC 2014. (Président du Comité de Programme)
  • AlgoTel 2014 : 16es Rencontres Francophones sur l'Algorithmique des Télécommunications;
  • TADDS 2013 : 5th Workshop on Theoretical Aspects of Dynamic Distributed Systems, co-localisé avec DISC 2013. (Président du Comité de Programme)
  • NCA 2013 : 12th IEEE International Symposium on Network Computing and Applications;
  • PDP 2013 : 21th Euromicro International Conference on Parallel, Distributed and Network-Based Processing;
  • TADDS 2012 : 4th Workshop on Theoretical Aspects of Dynamic Distributed Systems, co-localisé avec OPODIS 2012. (Président du Comité de Programme)
  • DYNAM 2012 : 1st Workshop on Dynamicity, co-localisé avec OPODIS 2011. (Président du Comité de Programme)
  • PDP 2012 : 20th Euromicro International Conference on Parallel, Distributed and Network-Based Processing;
  • iThings 2012 : 2012 IEEE International Conference on Internet of Things;
  • IWTMP2PS 2012: 3rd International Workshop on Trust Management in P2P Systems;
  • CyberTrust 2012: International Workshop on Trust and Privacy in Cyberspace;
  • CSE 2011: 14th IEEE International Conference on Computational Science and Engineering;
  • IWTMP2PS 2011: 2nd International Workshop on Trust Management in P2P Systems;
  • AlgoTel 2011 : 13es Rencontres Francophones sur l'Algorithmique des Télécommunications;
  • CFSE 2011: 8e Conférence Française en Systèmes d'Exploitation.
  • IWTMP2PS 2010: 1st International Workshop on Trust Management in P2P Systems;

 

Relecteur externe
  • Journaux internationaux : IEEE Transactions on Parallel and Distributed Systems, IEEE Transactions on Dependable and Secure Computing, Elveiser Computer Networks, ACM Mobile Network and Applications, Elveiser Peer-to-Peer Networking and Applications ;
  • Conférences internationales : DaWaK 2017, DISC 2016, DSN 2016, EDCC 2015, CIAA 2012, MSOP2P 2011, PDP 2011, IWTMP2PS 2010, EDBT 2010, OPODIS 2009, ICDCS 2009, P2P 2008, DISC 2008, Euro-Par 2008, ICDCS 2008, NPC 2007, ANIA 2007, ICPP 2006, Euro-Par 2006, IPTPS 2006 et Euro-Par 2005 ;
  • Conférences nationales : SYMPA 2011, BDA 2011, AlgoTel 2008 et AlgoTel 2006

 

Exposés

 

Séminaires invités

  • How to generate uniform Samples on large-scale data streams
    Séminaire invité au SMURF Workshop: Survey Methods and their use in Related Fields, Institute of Statistics, University of Neuchâtel, Août 2018
  • Comment créer un cloud social sécurisé pour ses données ? Le projet SocioPlug !
    Séminaire invité à la 23e Technoférence du Pôle Images&Réseaux, Nantes, France, Décembre 2017.
  • Analyse et traitement de flux de données à large échelle
    Séminaire invité aux Journées ARC du GRD MACS 2017, Paris, France, Mai 2017.
  • Analyse et traitement de flux de données à large échelle
    Séminaire invité aux Journées non thématiques RESCOM 2017, Nice, France, Janvier 2017.
  • Big Data Stream Analytics
    Cycle de séminaires en qualité de Professeur Invité à l'Indian Institute of Technology, Indore, India, Octobre 2016.
  • Comment générer des échantillons uniformes sur des grandes masses de données?
    Séminaire invité au 9e Colloque Francophone sur les sondages, Gatineau, Canada, Octobre 2016.
  • Efficient stream analysis and its applica1on to big data processing
    Séminaire invité à Huawei Technologies, France Research Center, Boulogne, France, Octobre 2016.
  • Big Data for Security and Safety
    Cycle de séminaires en qualité de Professeur Invité à la Sapienza Università di Roma, Rome, Italy, Avril 2016.
  • Putting Health Data into Big Data
    Séminaire invité à Data Sciences Symposium, 40 ans de l'IRISA, Rennes, France, Novembre 2015.
  • Dependable Issues Resolved with Distributed Streams
    Séminaire invité à LIP6, Paris, France, Octobre 2015.
  • Rapide panorama du Big Data : 
quel intérêt pour le renseignement ?
    Séminaire invité à Seminaire DGA : Traitement de l’information multimodale et « Big Data », Arcueil, France, Octobre 2015
  • Uniform Sampling and Deviation Estimation between Distributed Data Streams. 
    Séminaire invité au Brown bag seminar de l'Ensai. Bruz, France, Janvier 2015.
  • Le projet SocioPlug (fédération de Raspberry Pi) et présentation de l'approche de sécurisation par flux de données. 
    Séminaire invité au Séminaire au vert du LINA. Pornichet, France, Mai 2014.
  • Large-scale data stream analysis. 
    Séminaire invité à l'Ensai, Rennes, France, Février 2014.
  • Analyse de flux de données à grande échelle. 
    Séminaire invité au LaBRI, Bordeaux, France, Décembre 2013.
  • Retour d'expérience sur la formation ISN dans l'académie de Nantes
    Séminaire invité au congrès de la SIF 2013, Sophia-Antipolis, France, Février 2013.
  • De l'essence à la diversité des protocoles épidémiques. 
    Séminaire invité au Séminaire au vert du LINA. Ile de Berder, France, Octobre 2010.
  • Large-scale information system: moving theory into practice. 
    Séminaire invité au Brown Bag Seminar au LINA. Nantes, France, Janvier 2010.
  • How to track deterministically moving objects using a binary sensor network. 
    Séminaire invité à Telecom Bretagne. Rennes, France, Avril 2009.
  • How to track deterministically moving objects using a binary sensor network. 
    Séminaire invité à "la Sapienza" - Università di Roma. Rome, Italie, Décembre 2008.
  • SOLIST: A Lightweight Multi-Overlay Structure for Wireless Sensor Networks. 
    Séminaire invité à "la Sapienza" - Università di Roma. Rome, Italie, Novembre 2007.
  • Verification in distributed system protocols. 
    Séminaire invité au SITE - University of Ottawa, Ottawa, ON, Canada, Août 2004.

Communications en conférence

  • Finding Top-k Most Frequent Items in Distributed Streams in the Time-Sliding Window Model.
    Exposé technique à la conférence DSN 2018, Luxembourg, Juin 2018
  • Ordonnancement dynamique pour un équilibrage de charge quasi-optimal dans les systèmes de traitement de flux. 
    Exposé technique à la conférence AlgoTel 2017, Quiberon, France, Juin 2017
  • Online Scheduling for Shuffle Grouping in Distributed Stream Processing Systems. 
    Exposé technique à la conférence Middleware 2016, Trento, Italie, Décembre 2016
  • Estimer la corrélation 
à la volée entre flux massifs est possible 
avec très peu de mémoire.
    Exposé technique à AlgoTel 2015, Beaune, France, Juin 2015.
  • Distributed Large-Scale Data Stream Analysis. 
    Tutoriel à la conférence OPODIS, Cortina d'Ampezzo, Italie, Décembre 2014.
  • Service d’échantillonnage uniforme résiliant aux comportments malveillants
    Exposé technique à AlgoTel 2014, Ile de Ré, France, Juin 2014.
  • Nothing can compare with a population, besides agents. 
    Exposé technique à la conférence ICT, Lisbonne, Portugal, Mai 2014.
  • Analyse de flux de données à grande échelle. 
    Tutoriel à la conférence ComPAS, Neuchatel, Suisse, Avril 2014.
  • An Information Divergence Estimation over Data Streams. 
    Exposé technique à IEEE NCA 2012, Cambridge, MA, USA, Août 2012.
  • AnKLe: détection automatique d'attaques par divergence d'information
    Exposé technique à AlgoTel 2012, La Grande Motte, France, Juin 2012.
  • Characterizing the Adversarial Power in Uniform and Ergodic Node Sampling
    Exposé technique à AlMoDEP @ DISC 2011. Roma, Italia, Septembre 2011.
  • Uniform and Ergodic Sampling in Unstructured Peer-to-Peer Systems with Malicious Nodes.
    Exposé technique à OPODIS'10. Tozeur, Tunisie, Décembre 2010.
  • Trust your Social Network According to Satisfaction, Reputation and Privacy.
    Exposé technique à WRAS @ PODC'10. Zurich, Suisse, Juillet 2010.
  • Towards Connectivity Management, using Social Networking.
    Exposé technique à SNDS @ PODC'10. Zurich, Suisse, Juillet 2010.
  • Dynamic Computation of Population Protocols.
    Exposé technique à ICT'10, Doha, Qatar, Avril 2010.
  • A Formal Characterization of Uniform Peer Sampling based on View Shuffling.
    Exposé technique à WRAS @ PDCAT'09. Hiroshima, Japon, Decembre 2009.
  • On Gossip and Populations.
    Exposé technique à SIROCCO'09. Piran, Slovenie, Mai 2009.
  • SOLIST or How to Look for a Needle in a Haystack
    Exposé technique à WiMob'08. Avignon, France, Octobre 2008.
  • On the deterministic tracking of moving objects with a binary sensor network.
    Exposé technique à DCOSS '08, Ile Santorin, Grèce, Juin 2008.
  • Suivi et identification de trajectoires sur un réseau de capteurs binaires.
    Exposé technique à AlgoTel'08, Saint-Malo, France, Mai 2008.
  • Solist : Structure multi-couche P2P à faible consommation pour les réseaux de capteurs sans-fil.
    Exposé technique à CFSE'6, Fribourg, Suisse, Février 2008.
  • GCP: Gossip-based code propagation for large-scale mobile wireless sensor network.
    Exposé technique à Autonomics'07, Rome, Italie, Octobre 2007.
  • SOLIST: Self-Organized Large-scale Inventory STructure with Wireless Sensor Networks.
    Exposé technique au 2nd Authoring Workshop of EuroSys'07, Lisbonne, Portugal, Mars 2007.
  • ProxSem: Interest-based proximity measure to improve search efficiency in p2p systems.
    Exposé technique à ECUMN'07, Toulouse, France, Février 2007.
  • ProxSem : Mesure de proximité sémantique pour les systèmes de partage de fichiers pair-à-pair.
    Exposé technique à CFSE'5, Perpignan, France, Octobre 2006.
  • Prise en compte d'aspects sémantiques dans la construction d'un réseau pair-à-pair.
    Exposé technique à MajecSTIC'05, Rennes, France, Novembre 2005.

 

Depuis mes premières interventions d’enseignement, j’ai eu l’opportunité d’enseigner pour une large palette de formations et de niveaux : L1, L2, L3, M1, M2 (Recherche et Professionnel), Miage, Classe Préparatoire aux Grandes écoles, Cursus Préparatoire au concours de l’agréga- tion (filière Economie-Droit-Gestion), Diplôme d’ingénieur en Informatique, Formation conti- nue des professeurs de lycée. J’ai assuré des cours magistraux pour des promotions de 15 à 300 étudiants, des travaux dirigés et pratiques pour des groupes de 6 à 40 étudiants. L’intégralité de mes enseignements dans le supérieur représente donc, à ce jour, près de 2600 h équivalent- TD.

La liste des établissements au sein desquels j’ai effectué une charge d’enseignement est la suivante, classée par nombre d’heures effectives :

  • Université de Nantes, Département Informatique (∼ 1200 h équivalent TD) ;
  • Ecole Nationale de la Statistique et de l’Analyse de l’Information (∼ 310 h équivalent TD) ;
  • Lycée Chateaubriand, Rennes (∼ 192 h équivalent TD) ;
  • Ecole Normale Supérieure de Rennes (∼ 200 h équivalent TD) ;
  • Université de Rennes 1, Département Informatique (∼ 125 h équivalent TD) ;
  • Rectorat de l’Académie de Nantes (∼ 120 h équivalent TD) ;
  • IMT Atlantique (ex-Télécom Bretagne) (∼ 80 h équivalent TD) ;
  • Université de Rennes 1, Département Mathématique (∼ 40 h équivalent TD) ;
  • Ecole Normale Supérieure de Cachan (∼ 38 h équivalent TD). 

 

 

Tableaux récapitulatifs des enseignements : thématique

Thématique Heures
Architectures distribuées à grande échelle 143 h CM + 209 h TD/TP
Programmation (Java, Javascript, C, Caml, Pascal, etc.) 74 h CM + 640 h TD/TP
Algorithmique 72,33 h CM + 158 h TD/TP
Bases de données et masses de données 61 h CM + 111 h TD/TP
Modélisation UML 30 h CM + 24 h TD/TP
Réseaux / Système 50 h CM + 75 h TD/TP
Encadrement / Méthodologie / Outils de base 30 h CM + 144 h TD/TP

 

Livres et actes de conférences

[B6]      Yann Busnel, Dimiter Avresky. Proceedings of the 14th IEEE International Symposium on Network Computing and Applications (IEEE NCA15). Septembre 28-30th, 2015. Boston, MA, USA.

[B5]      Yann Busnel. Proceedings of Student Forum @ the 11th European Dependable Computing Conference (EDCC 2015). Septembre 10th, 2015. Paris, France.

[B4]      Nicolas Nisse, Franck Rousseau and Yann Busnel. Actes de la 15èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications (AlgoTel 2013). Mai 28-31th, 2013. Pornic, France.

[B3]      Lélia Blin and Yann Busnel. Proceedings of the 4th International Workshop on Theoretical Aspects of Dynamic Distributed Systems (TADDS 2102). Collocated with OPODIS 2012, Décembre 17, 2012. Roma, Italy. 

[B2]      Lélia Blin and Yann Busnel. Proceedings of the 1st International Workshop on Dynamicity. Collocated with OPODIS 2011, Décembre 12, 2011. Toulouse, France.

[B1]      Yann Busnel. Auto-organisation et collaboration pour réseaux de capteurs. Editions Universitaires Européennes, 172 p., Juin 2010. ISBN : 978-613-1-51456-2. (Publication de la Thèse de Doctorat)
 

Revues internationales avec comité de lecture

[J9]      Emmanuelle Anceaume, Yann Busnel. Lightweight Metric Computation for Distributed Massive Data Streams. Dans Transactions on Large-Scale Data- and Knowledge-Centered Systems (TLDKS), LNCS, Springer, 10430(33):1-39, 2017.  (IF : 1.0)

[J8]      Emmanuelle Anceaume, Yann Busnel, Ernst Schulte-Geers, Bruno Sericola. Optimization results for a generalized coupon collector problem. Dans Journal of Applied Probability (JAP), Applied Probability Trust, Sheffield, UK, 53(2), Juin 2016. (IF : 1.11)

[J7]      Nagham Alhadad, Patricia Serrano Alvarado, Yann Busnel, Philippe Lamarre. System Modeling and Trust Evaluation of Distributed Systems. Dans Journal on Large-Scale Data-and Knowledge-Centered Systems (TLDKS), LNCS, Springer, 9430(22):33-74, Novembre 2015. (IF : 1.0)

[J6]      Emmanuelle Anceaume, Yann Busnel, Bruno Sericola. New results on a generalized coupon collector problem using Markov chains. Dans Journal of Applied Probability (JAP), Applied Probability Trust, Sheffield, UK, 52(2), Juin 2015. (IF : 1.11) 

[J5]      Emmanuelle Anceaume, Yann Busnel. A Distributed Information Divergence Estimation over Data Streams. Dans IEEE Transactions on Parallel and Distributed Systems (TPDS), IEEE, USA, 25(2):478-487, Février 2014. (IF : 1.796) 

[J4]      Emmanuelle Anceaume, Yann Busnel, Sébastien Gambs. On the Power of the Adversary to Solve the Node Sampling Problem. Dans Transactions on Large-Scale Data- and Knowledge-Centered Systems (TLDKS), LNCS, Springer, 8290(11):102-126, Décembre 2013. (IF : 1.0)

[J3]      Yann Busnel, Roberto Beraldi, Roberto Baldoni. On the Uniformity of Peer Sampling based on View Shuffling. Journal of Parallel and Distributed Computing (JPDC), Elsevier, 71(8):1165-1176, Août 2011. (IF : 1.148)

[J2]      Yann Busnel, Leonardo Querzoni, Roberto Baldoni, Marin Bertier, Anne-Marie Kermarrec. Analysis of Deterministic Tracking of Multiple Objects using a Binary Sensor Network. ACM Transactions on Sensor Networks, 8(1), 2011. (IF : 1.938)

[J1]      Hakim Weatherspoon, Hugo Miranda, Konrad Iwanicki, Ali Ghodsi, Yann Busnel. Gossiping Over Storage Systems Is Practical. ACM Operating System Review, 41(5):75-81, Octobre 2007.

Revues nationales de vulgarisation

[JN2]      Yann Busnel. Le modèle de pair à pair profite aux réseaux de capteurs très étendus. Interstices : Découvrir la recherche en informatique, Mai 2007. 

[JN1]      Yann Busnel. Système d'information pair-à-pair pour les réseaux de capteurs larges échelles. La lettre de la Fondation Michel Métivier, 5:3-5, Octobre 2006.
 

Conférences internationales avec comité de lecture

[C30]      Guillaume Bouzillé, Richard Westerlynck, Gautier Defossez, Dalel Bouslimig, Sahar Bayat, Christine Riou, Yann Busnel, Clara Le Guillou, Jean-Michel Cauvin, Christian Jacquelinet, Patrick Pladys, Emmanuel Oger, Eric Stindel, Pierre Ingrand, Gouenou Coatrieux, Marc Cuggia. Sharing health big data for research - A design by use cases : the INSHARE platform approach. Dans 16th World Congress on Medical and Health Informatics (MedInfo2017), Hangz- hou, Chine, Août 2017.

[C29]      Nicolò Rivetti, Yann Busnel, Avigdor Gal. FlinkMan: Anomaly Detection in Manufacturing Equipment with Apache Flink: Grand Challenge. Dans 11th ACM International Conference on Distributed Event-Based Systems (DEBS 2017), Barcelone, Espagne, Juin 2017. 

[C28]      Alassane Samba, Yann Busnel, Alberto Blanc, Philippe Dooze, Gwendal Simon. Instantaneous Throughput Prediction in Cellular Networks: Which Information Is Needed? Dans 2017 IFIP/IEEE International Symposium on Integrated Network Management (IM 2017), Lisbonne, Portugal, Mai 2017. 

[C27]      Nicolò Rivetti, Emmanuelle Anceaume, Yann Busnel, Leonardo Querzoni, Bruno Sericola. Online Scheduling for Shuffle Grouping in Distributed Stream Processing Systems. Dans 17th ACM/IFIP/USENIX 13th International Conference on Middleware (Middleware 2016), Trento, Italie, Décembre 2016. 

[C26]      Nicolò Rivetti, Yann Busnel, Leonardo Querzoni. Load-Aware Shedding in Stream Processing Systems. Dans 10th ACM International Conference on Distributed Event-Based Systems (DEBS 2016), Ivine, CA, USA, Juin 2016. 

[C25]      Nicolo Rivetti, Yann Busnel and Achour Mostefaoui. Efficiently Summarizing Data Streams over Sliding Windows. Dans 14th IEEE International Symposium on Network Computing and Applications (IEEE NCA15), Boston, MA, USA, Septembre 2015. 

[C24]      Yves Mocquard, Emmanuelle Anceaume, James Aspnes, Yann Busnel and Bruno Sericola. Counting with Population Protocols. Dans 14th IEEE International Symposium on Network Computing and Applications (IEEE NCA15), Boston, MA, USA, Septembre 2015. 

[C23]      Emmanuelle Anceaume, Yann Busnel, Paul Lajoie-Mazenc and Géraldine Texier. Reputation in Inter-Domain QoS Routing is Mandatory. Dans 14th IEEE International Symposium on Network Computing and Applications (IEEE NCA15), Boston, MA, USA, Septembre 2015. 

[C22]      Emmanuelle Anceaume, Yann Busnel, Nicolò Rivetti, Bruno Sericola. Identifying Global Icebergs in Distributed Streams. Dans 34th Symposium on Reliable Distributed Systems (SRDS 2015), Montreal, Quebec, Canada, Septembre 2015. 

[C21]      Emmanuelle Anceaume, Yann Busnel, Nicolò Rivetti. Estimating the Frequency of Data Items in Massive Distributed Streams . Dans IEEE 4th Symposium on Network Cloud Computing and Applications (NCCA 2015), Munich, Allemagne, Juin 2015. 

[C20]      Emmanuelle Anceaume, Yann Busnel, Leonardo Querzoni, Nicolò Rivetti, Bruno Sericola. Efficient key grouping for near-optimal load balancing in stream processing systems . Dans 9th ACM International Conference on Distributed Event-Based Systems (DEBS 2015), Oslo, Norvège, Juin, 2015. 

[C19]      Nagham Alhadad, Yann Busnel, Patricia Serrano-Alvarado, Philippe Lamarre. Trust Evaluation of a System for an Activity with Subjective Logic. Dans 11th International Conference on Trust, Privacy & Security in Digital Business (TrustBus 2014), Munich, Germany, Septembre 1 - 5, 2014. 

[C18]      Emmanuelle Anceaume, Yann Busnel, Erwan Le Merrer, Romaric Ludinard, Jean-Louis Marchand, Bruno Sericola. Anomaly Characterization in Large Scale Networks. Dans the 44rd Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN 2014), Atlanta, GE, USA, Juin 2014. 

[C17]      Emmanuelle Anceaume, Yann Busnel. Deviation Estimation between Distributed Data Streams. Dans the 10th European Dependable Computing Conference (EDCC 2014), Newcastle upon Tyne, UK, Mai 2014.

[C16]      Yann Busnel. Nothing Can Compare with a Population, Besides Agents. Dans the 21th IEEE International Conference on Telecommunications (ICT 2014), Lisboa, Portugal, Mai 2014.

[C15]      Emmanuelle Anceaume, Yann Busnel. Sketch *-metric: Comparing Data Streams via Sketching. Dans the 12th IEEE International Symposium on Network Computing and Applications (IEEE NCA 2013), Cambridge, MA, USA, Août 2013. (TA : 28,2 %)

[C14]      Nagham Alhadad, Patricia Serrano-Alvarado, Yann Busnel, Philippe Lamarre. Trust Evaluation of a System for an Activity. Dans 10th International Conference on Trust, Privacy & Security in Digital Business (TrustBus 2013), Prague, Czech Republic, Août 2013. (TA : 34 %)

[C13]      Yann Busnel, Nuno Cruz, Denis Gillet, Adrian Holzer and Hugo Miranda. Reinventing Mobile Community Computing and Communication. Dans 12th IEEE International Conference on Ubiquitous Computing and Communications (IEEE IUCC 2013), Melbourne, Australia, Juillet 2013. (TA : 20,3 %)

[C12]      Emmanuelle Anceaume, Yann Busnel, Bruno Sericola. Uniform Node Sampling Service Robust against Collusions of Malicious Nodes. Dans the 43rd Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN 2013), Budapest, Hungary, Juin 2013. (TA : 19,6 %) 

[C11]      Emmanuelle Anceaume, Yann Busnel. An Information Divergence Estimation over Data Streams. Dans the 11th IEEE International Symposium on Network Computing and Applications (IEEE NCA 2012), Cambridge, MA, USA, Août 2012. (TA : 29,5 %)

[C10]      Nagham Alhadad, Philippe Lamarre, Yann Busnel, Patricia Serrano-Alvarado, Marco Biazzini, Christophe Sibertin-Blanc. SocioPath: Bridging the Gap between Digital and Social Worlds. Dans 23rd International Conference on Database and Expert Systems Applications (DEXA 2012), Vienna, Austria, Septembre 3-7, 2012. (TA : 27,4 %)

[C9]      Emmanuelle Anceaume, Yann Busnel, Sébastien Gambs. AnKLe: Detecting Attacks in Large Scale Systems via Information Divergence. Dans the 9th European Dependable Computing Conference (EDCC 2012), Sibiu, Romania, Mai 2012. (TA : 34,6 %)

[C8]      Emmanuelle Anceaume, Yann Busnel, Sébastien Gambs. Uniform and Ergodic Sampling in Unstructured Peer-to-Peer Systems with Malicious Nodes. Dans the 14th International Conference On Principles Of Distributed Systems (OPODIS 2010), Tozeur, Tunisie, Decembre 2010. (TA : 26,6 %)

[C7]      Marin Bertier, Yann Busnel, Anne-Marie Kermarrec. Dynamic Computation of Population Protocols. Dans the 17th IEEE International Conference on Telecommunications - Ad-hoc and Sensor Communications track (ICT 2010), Doha, Qatar, Avril 2010. (TA : 50 %)

[C6]      Silvia Bonomi, Yann Busnel, Roberto Baldoni, Ravi Prakash. FAROES: Fairness And Reliability using Overlay Expenseless Set-out for duty-cycle optimization in WSN. Dans the 22th ISCA International Conference on Parallel and Distributed Computing and Communication Systems (PDCCS '09), Louisville, KY, USA, Septembre 2009. (TA : 35 %) 

[C5]      Marin Bertier, Yann Busnel, Anne-Marie Kermarrec. On Gossip and Populations. Dans the 16th International Colloquium on Structural Information and Communication Complexity (SIROCCO '09), Piran, Slovenie, Mai 2009. (TA : 42 %)

[C4]      Yann Busnel, Marin Bertier, Anne-Marie Kermarrec. SOLIST or How To Look For a Needle in a Haystack? In the 4th IEEE International Conference on Wireless and Mobile Computing, Networking and Communications (WiMob'2008), Avignon, France, Octobre 2008. (TA : 23 %) 

[C3]      Yann Busnel, Leonardo Querzoni, Roberto Baldoni, Marin Bertier, Anne-Marie Kermarrec. On the deterministic tracking of moving objects with a binary sensor network. Dans 4th IEEE International Conference on Distributed Computing in Sensor Systems (DCOSS '08), Ile Santorin, Grèce, Juin 2008. (TA : 25 %) 

[C2]      Yann Busnel, Marin Bertier, Eric Fleury, Anne-Marie Kermarrec. GCP: Gossip-based Code Propagation for Large-scale Mobile Wireless Sensor Networks. Dans The First International Conference on Autonomic Computing and Communication Systems (Autonomics'07), Rome, Italie, Octobre 2007. (TA : 35 %) 

[C1]      Yann Busnel, Anne-Marie Kermarrec. ProxSem: Interest-based Proximity Measure to Improve Search Efficiency in P2P Systems. Dans 4th European Conference on Universal Multiservice Networks (ECUMN'2007), Toulouse, France, Février 2007. (TA : 45 %)

Workshop internationaux avec comité de lecture

[W4]      Emmanuelle Anceaume, Yann Busnel, Sébastien Gambs. Characterizing the Adversarial Power in Uniform and Ergodic Node Sampling. Dans the 1st International Workshop on Algorithms and Models for Distributed Event Processing (AlMoDEP '11) collocated with DISC 2011, Roma, Italy, Septembre 2011.

[W3]      Yann Busnel, Patricia Serrano-Alvarado, Philippe Lamarre. Trust your Social Network According to Satisfaction, Reputation and Privacy. Dans the 3rd ACM Workshop on Reliability, Availability and Security (WRAS 2010), Zurich, Suisse, Juillet 2010. 

[W2]      Yann Busnel, Roberto Beraldi, Roberto Baldoni. A Formal Characterization of Uniform Peer Sampling based on View Shuffling. Dans the 2nd IEEE Workshop on Reliability, Availability and Security (WRAS 2009), Hiroshima, Japon, Decembre 2009. 

[W1]      Yann Busnel. SOLIST: Self-Organized Large-scale Inventory STructure with Wireless Sensor Networks. Dans the 2nd Authoring Workshop colocated with EuroSys 2007, Lisbonne, Portugal, Mars 2007.
 

Conférences nationales avec comité de lecture

[CN18]      Nicolo Rivetti, Yann Busnel et Leonardo Querzoni. Délestage avisé dans les systèmes de traitement de flux. Dans the 19ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '17), Quiberon, France, Juin 2017.

[CN17]      Nicolo Rivetti, Emmanuelle Anceaume, Yann Busnel, Leonardo Querzoni et Bruno Sericola. Ordonnancement dynamique pour un équilibrage de charge quasi-optimal dans les systèmes de traitement de flux. Dans the 19ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '17), Quiberon, France, Juin 2017.

[CN16]      Nicolo Rivetti, Leonardo Querzoni, Emmanuelle Anceaume, Yann Busnel et Bruno Sericola. Groupement de clés efficace pour un équilibrage de charge quasi-optimal dans les systèmes de traitement de flux. Dans the 18ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '16), Bayonne, France, Mai 2016.

[CN15]      Emmanuelle Anceaume, Yann Busnel, Nicolo Rivetti et Bruno Sericola. Identifier des icebergs parmi des flux de données distribués. Dans the 18ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '16), Bayonne, France, Mai 2016.

[CN14]      Nicolo Rivetti, Yann Busnel et Achour Mostéfaoui. Résumer efficacement des flux de données massifs en fenêtre glissante. Dans the 18ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '16), Bayonne, France, Mai 2016.

[CN13]      Alassane Samba, Yann Busnel, Alberto Blanc, Philippe Dooze, Gwendal Simon. Throughput Prediction in Cellular Networks: Experiments and Preliminary Results. Dans 1ères Rencontres Francophones sur la Conception de Protocoles, l’Évaluation de Performance et l’Expérimentation des Réseaux de Communication (CoRes '16), Bayonne, France, Mai 2016.

[CN12]      Emmanuelle Anceaume, Yann Busnel. Estimer la corrélation à la volée entre flux massifs est possible avec très peu de mémoire. Dans the 17ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '15), Beaune, France, Juin 2015.

[CN11]      Romaric Ludinard, Emmanuelle Anceaume, Yann Busnel, Erwan Le Merrer, Jean-Louis Marchand, Bruno Sericola, Gilles Straub. Anomaly Characterization Problems. Dans the 16ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '14), Ile de Ré, France, Juin 2014.

[CN10]      Emmanuelle Anceaume, Yann Busnel, Bruno Sericola. Service d'échantillonage uniforme résiliant aux comportments malveillants. Dans the 16ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '14), Ile de Ré, France, Juin 2014. 

[CN9]      Nagham Alhadad, Philippe Lamarre, Patricia Serrano-Alvarado, Yann Busnel. Trust Approach Based on User's Activities. Dans Atelier Protection de la Vie Privée (APVP 2012), Ile de Groix, France, Juin 2012. 

[CN8]      Emmanuelle Anceaume, Yann Busnel, Sebastien Gambs. AnKLe: détection automatique d'attaques par divergence d'information. Dans the 14ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel 2012), La Grande Motte, France, Juin 2012.

[CN7]      Nagham Alhadad, Philippe Lamarre, Patricia Serrano-Alvarado, Yann Busnel, Marco Biazzini. SocioPath: In Whom You Trust? In 27e conférence francophone de Bases de Données Avancées (BDA 2011), Rabat, Maroc, Octobre 2011. 

[CN6]      Nagham Alhadad, Philippe Lamarre, Patricia Serrano-Alvarado, Yann Busnel, Marco Biazzini. SocioPath: in whom you trust? In Atelier Protection de la Vie Privée (APVP 2011), Soreze, France, Juin 2011. 

[CN5]      Yann Busnel, Roberto Beraldi, Roberto Baldoni. Uniformité d'un échantillonnage épidémique. Dans the 12ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '10), Belle Dune, France, Juin 2010.

[CN4]      Yann Busnel, Marin Bertier, Anne-Marie Kermarrec. Rumeurs, populations et communautés : équivalence uniquement sociologique ? In the 12ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel '10), Belle Dune, France, Juin 2010.

[CN3]      Yann Busnel, Leonardo Querzoni, Roberto Baldoni, Marin Bertier, Anne-Marie Kermarrec. Suivi et identification de trajectoires sur un réseau de capteurs binaires. Dans the 10ème Rencontres Francophones sur les Aspects Algorithmiques de Télécommunications (AlgoTel'08), Saint-Malo, France, Mai 2008. 

[CN2]      Yann Busnel, Marin Bertier, Anne-Marie Kermarrec. SOLIST : Structure multi-couche pair-a-pair à faible consommation pour les réseaux de capteurs sans-fil. Dans the 6e Conférence Française en Systèmes d'Exploitation (CFSE'6), Fribourg, Suisse, Février 2008. 

[CN1]      Yann Busnel, Anne-Marie Kermarrec. PROXSEM : Mesure de proximité sémantique pour les systèmes de partage de fichiers pair-à-pair. Dans the 5e Conférence Française en Systèmes d'Exploitation (CFSE'5), Perpignan, France, Octobre 2006.

Sessions poster avec comité de lecture


[P3]      Yann Busnel, Marin Bertier, Eric Fleury, Anne-Marie Kermarrec. GCP: Gossip-based Code Propagation for Large-scale Mobile Wireless Sensor Network. Poster Session of the 2nd conference of the European Chapter of ACM SIGOPS (EuroSys 2007), Lisbonne, Portugal, Mars 2007. 

[P2]      Yann Busnel. ProxSem: Interest-based Proximity Measure to Improve Search Efficiency in P2P Systems. Poster Session of the 1nd conference of the European Chapter of ACM SIGOPS (EuroSys 2006), Leuven, Belgique, Avril 2006. 

[P1]      Yann Busnel. Prise en compte d'aspects sémantiques dans la construction d'un réseau pair-à-pair. Session Poster de la 3e MAnifestation des JEunes Chercheur francophones dans les domaines des STIC (MajecSTIC'05), Rennes, France, Novembre 2005.

Thèses et rapports

[HDR]      Yann Busnel. Analyse et traitement de flux de données à large échelle. HDR de l’École Normale Supérieure de Rennes, Bruz, France, Décembre 2016. 

[PhD]      Yann Busnel. Systèmes d'information collaboratifs et auto-organisants pour réseaux de capteurs large-échelle : << De la théorie à la pratique >>. Thèse de l'Université de Rennes 1, Rennes, France, Novembre 2008. 

[Master]      Yann Busnel. Prise en compte de la proximité sémantique dans la restructuration de réseau logique pair à pair. Rapport de Master. École Normale Supérieure de Cachan - Antenne de Bretagne / Université de Rennes 1, Rennes, France, Juin 2005.

 

Publications HAL
Communication dans un congrès
Anceaume Emmanuelle, Busnel Yann, Cazacu Vasile
Finding Top-k Most Frequent Items in Distributed Streams in the Time-Sliding Window Model
48rd Annual IEEE/IFIP Interna- tional Conference on Dependable Systems and Networks (DSN 2018), Jun 2018, Luxembourg, Luxembourg
Bibtext :
@inproceedings{anceaume:hal-01839930,
TITLE = {{Finding Top-k Most Frequent Items in Distributed Streams in the Time-Sliding Window Model}},
AUTHOR = {Anceaume, Emmanuelle and Busnel, Yann and Cazacu, Vasile},
URL = {https://hal-imt-atlantique.archives-ouvertes.fr/hal-01839930},
BOOKTITLE = {{48rd Annual IEEE/IFIP Interna- tional Conference on Dependable Systems and Networks (DSN 2018)}},
ADDRESS = {Luxembourg, Luxembourg},
YEAR = {2018},
MONTH = Jun,
PDF = {https://hal-imt-atlantique.archives-ouvertes.fr/hal-01839930/file/finding-top-k.pdf},
HAL_ID = {hal-01839930},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Paper
%F Oral
%T Finding Top-k Most Frequent Items in Distributed Streams in the Time-Sliding Window Model
%+ Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE)
%+ Centre National de la Recherche Scientifique (CNRS)
%+ Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
%+ Département Systèmes Réseaux, Cybersécurité et Droit du numérique (SRCD)
%A Anceaume, Emmanuelle
%A Busnel, Yann
%A Cazacu, Vasile
%Z Projet BigClin financé par le LabEx CominLabs
%< avec comité de lecture
%B 48rd Annual IEEE/IFIP Interna- tional Conference on Dependable Systems and Networks (DSN 2018)
%C Luxembourg, Luxembourg
%8 2018-06
%D 2018
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Information Theory [cs.IT]Conference papers
%G English
%2 https://hal-imt-atlantique.archives-ouvertes.fr/hal-01839930/document
%2 https://hal-imt-atlantique.archives-ouvertes.fr/hal-01839930/file/finding-top-k.pdf
%L hal-01839930
%U https://hal-imt-atlantique.archives-ouvertes.fr/hal-01839930
%~ IMT-ATLANTIQUE
%~ CNRS
%~ UNIV-UBS
%~ INRIA-RENNES
%~ INSTITUT-TELECOM
%~ IRISA_SET
%~ UNIV-RENNES1
%~ IMTA_SRCD
%~ INRIA_TEST
%~ INRIA2
%~ UR1-HAL
%~ CENTRALESUPELEC
%~ IRISA
%~ INRIA
%~ SUP_CIDRE
%~ TEST-UR-CSS
%~ UNIV-RENNES
%~ INRIA-RENGRE
%~ IRISA-DIONYSOS-IMTA
Pré-publication, Document de travail
Anceaume Emmanuelle, Busnel Yann
Byzantine-tolerant Uniform Node Sampling Service
2017
Bibtext :
@unpublished{anceaume:hal-01634363,
TITLE = {{Byzantine-tolerant Uniform Node Sampling Service}},
AUTHOR = {Anceaume, Emmanuelle and Busnel, Yann},
URL = {https://hal.archives-ouvertes.fr/hal-01634363},
NOTE = {working paper or preprint},
YEAR = {2017},
MONTH = Nov,
HAL_ID = {hal-01634363},
HAL_VERSION = {v1},
}
Endnote :
%0 Unpublished work
%T Byzantine-tolerant Uniform Node Sampling Service
%+ Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE)
%+ Ecole Nationale de la Statistique et de l'Analyse de l'Information (ENSAI)
%A Anceaume, Emmanuelle
%A Busnel, Yann
%8 2017-11-14
%D 2017
%Z Computer Science [cs]
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]Preprints, Working Papers, ...
%X We consider the problem of achieving uniform node sampling in large scale systems in presence of Byzantine nodes. The uniform node sampling service offers to applications using it a single simple primitive that returns, upon invocation, the identifier of a random node that belongs to the system. We first propose an omniscient strategy that processes on the fly an unbounded and arbitrarily biased input stream made of node identifiers exchanged within the system, and outputs a stream that preserves the uniformity property. Informally, uniformity states that any node in the system should have the same probability to appear in the sample of any correct node of the system. We show through a Markov chain analysis that this property holds despite any arbitrary bias introduced by the adversary. We then propose a strategy based on a sketch data structure that is capable of approximating the omniscient strategy without requiring any prior knowledge on the composition of the input stream. We show through both theoretical analysis and extensive simulations that this " knowledge-free " strategy accurately approximates the omniscient one. We evaluate the resilience of the knowledge-free strategy by studying two representative attacks (flooding and targeted attacks). We quantify the minimum number of identifiers that Byzantine nodes must insert in the input stream to prevent uniformity. Finally, we propose a new construction that processes each input stream with sketches put in series that allows to both increase the accuracy of a single sketch and decrease the time to converge to a uniform output stream. To our knowledge, such a work has never been proposed before.
%G English
%L hal-01634363
%U https://hal.archives-ouvertes.fr/hal-01634363
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ GENES
%~ ENSAI
%~ UNIV-RENNES1
%~ INRIA_TEST
%~ INRIA
%~ IRISA
%~ INRIA2017
%~ SUP_CIDRE
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ UR1-UFR-ISTIC
%~ CENTRALESUPELEC-SACLAY
%~ UNIV-PARIS-SACLAY
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ CENTRALESUPELEC-SACLAY-VP
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ CENTRALESUPELEC
%~ INRIA2017-PREPRINT
Communication dans un congrès
Bouzillé Guillaume, Westerlynck Richard, Defossez Gautier, Bouslimi Dalel, Bayat Sahar, Riou Christine, Busnel Yann, Le Guillou Clara, Cauvin Jean-Michel, Jacquelinet Christian, Pladys Patrick, Oger Emmanuel, Stindel Eric, Ingrand Pierre, Coatrieux Gouenou, Cuggia Marc
Sharing health big data for research - A design by use cases: the INSHARE platform approach
The 16th World Congress on Medical and Health Informatics (MedInfo2017) , Aug 2017, Hangzhou, China. 2017, The 16th World Congress on Medical and Health Informatics (MedInfo2017) 〈http://medinfo2017.medmeeting.org/en〉
Bibtext :
@inproceedings{bouzille:hal-01535703,
TITLE = {{Sharing health big data for research - A design by use cases: the INSHARE platform approach}},
AUTHOR = {Bouzill{\'e}, Guillaume and Westerlynck, Richard and Defossez, Gautier and BOUSLIMI, Dalel and Bayat, Sahar and Riou, Christine and Busnel, Yann and Le Guillou, Clara and Cauvin, Jean-Michel and Jacquelinet, Christian and Pladys, Patrick and Oger, Emmanuel and Stindel, Eric and Ingrand, Pierre and Coatrieux, Gouenou and Cuggia, Marc},
URL = {https://hal.archives-ouvertes.fr/hal-01535703},
BOOKTITLE = {{The 16th World Congress on Medical and Health Informatics (MedInfo2017) }},
ADDRESS = {Hangzhou, China},
SERIES = {The 16th World Congress on Medical and Health Informatics (MedInfo2017) },
YEAR = {2017},
MONTH = Aug,
KEYWORDS = {Data sharing ; Information Storage and Retrieval ; Registries/statistics \& numerical data},
PDF = {https://hal.archives-ouvertes.fr/hal-01535703/file/or_submission_281_6_1.pdf},
HAL_ID = {hal-01535703},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Sharing health big data for research - A design by use cases: the INSHARE platform approach
%+ Laboratoire Traitement du Signal et de l'Image (LTSI)
%+ Département Systèmes Réseaux, Cybersécurité et Droit du numérique (SRCD)
%+ Unité d'épidémiologie, biostatistique et registre général des cancers de Poitou-Charentes
%+ Laboratoire de Traitement de l'Information Medicale (LaTIM)
%+ Département Image et Traitement Information (ITI)
%+ Laboratoire d'Informatique Médicale (LIM)
%+ Centre d'Investigation Clinique [Rennes] (CIC)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Unité Matériaux et Transformations - UMR 8207 (UMET)
%+ Direction générale en charge de la politique médicale et scientifique [ (DGMS)
%+ Service de Pharmacologie
%+ CIC - Poitiers
%A Bouzillé, Guillaume
%A Westerlynck, Richard
%A Defossez, Gautier
%A BOUSLIMI, Dalel
%A Bayat, Sahar
%A Riou, Christine
%A Busnel, Yann
%A Le Guillou, Clara
%A Cauvin, Jean-Michel
%A Jacquelinet, Christian
%A Pladys, Patrick
%A Oger, Emmanuel
%A Stindel, Eric
%A Ingrand, Pierre
%A Coatrieux, Gouenou
%A Cuggia, Marc
%< avec comité de lecture
%B The 16th World Congress on Medical and Health Informatics (MedInfo2017)
%C Hangzhou, China
%3 The 16th World Congress on Medical and Health Informatics (MedInfo2017)
%8 2017-08-21
%D 2017
%K Data sharing
%K Information Storage and Retrieval
%K Registries/statistics & numerical data
%Z Life Sciences [q-bio]/BioengineeringConference papers
%X CONTEXT: Sharing and exploiting efficiently Health Big Data (HBD) lead to tackle great challenges: data protection and governance taking into account legal, ethical and deontological aspects which enables a trust, transparent and win-to-win relationship between researchers, citizen and data providers. Lack of interoperability: data are compartmentalized and are so syntactically and semantically heterogeneous. Variable data quality with a great impact on data management and statistical analysis. The objective of the INSHARE project is to explore, through an experimental proof of concept, how recent technologies could overcome such issues. It aims at demonstrating the feasibility and the added value of an IT platform based on CDW, dedicated to collaborative HBD sharing for medical research. METHOD: The consortium includes 6 data providers: 2 academic hospitals, the SNIIRAM (the French national reimbursement database) and 3 national or regional registries. The platform is designed following a 3 steps approach: (1) to analyze use cases, needs and requirements (2). To define data sharing governance and secure access to the platform, (3) To define the platform specifications. RESULT: 3 use cases (healthcare trajectory analysis, epidemiologic registry enrichment, signal detection) were analyzed to design the platform. corresponding to 5 studies and using 11 data sources. The governance was derived from the SCANNER model and adapted to data sharing. As a result, the platform architecture integrates the following tools and services: Data repository and hosting, semantic integration services, data processing, aggregate computing, data quality and integrity monitoring, Id linking, Multisource query builder, Visualization and data export services, data governance, study management service and security including data watermarking..
%G English
%2 https://hal.archives-ouvertes.fr/hal-01535703/document
%2 https://hal.archives-ouvertes.fr/hal-01535703/file/or_submission_281_6_1.pdf
%L hal-01535703
%U https://hal.archives-ouvertes.fr/hal-01535703
%~ CNRS
%~ UNIV-UBS
%~ ENSC-LILLE
%~ INRA
%~ INSTITUT-TELECOM
%~ IRISA_SET
%~ HL
%~ UNIV-RENNES1
%~ INRIA
%~ CIC203
%~ CIC
%~ INRIA_TEST
%~ LTSI
%~ LATIM_TB
%~ UNIV-POITIERS
%~ AGREENIUM
%~ UNIV-BREST
%~ INC-CNRS
%~ IRISA
%~ BIOSIT
%~ UR1-HAL
%~ UR1-SDV
%~ UR1-MATH-STIC
%~ UR1-UFR-ISTIC
%~ UR1-UFR-SVE
%~ INRIA2017
%~ INSERM
%~ IMTA_SRCD
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ IMTA_ITI
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ IMT-ATLANTIQUE
%~ UNIV-LILLE
%~ LATIM_IMTA
%~ IRISA-DIONYSOS-IMTA
%~ IRISA_IMTA
Communication dans un congrès
Busnel Yann, Riveei Nicolo, Gal Avigdor
FlinkMan : Anomaly Detection in Manufacturing Equipment with Apache Flink : Grand Challenge
DEBS '17 - 11th ACM International Conference on Distributed and Event-based Systems, Jun 2017, Barcelone, Spain. pp.274-279 〈10.1145/3093742.3095099〉
Bibtext :
@inproceedings{busnel:hal-01644417,
TITLE = {{FlinkMan : Anomaly Detection in Manufacturing Equipment with Apache Flink : Grand Challenge}},
AUTHOR = {Busnel, Yann and Riveei, Nicolo and Gal, Avigdor},
URL = {https://hal.archives-ouvertes.fr/hal-01644417},
BOOKTITLE = {{DEBS '17 - 11th ACM International Conference on Distributed and Event-based Systems}},
ADDRESS = {Barcelone, Spain},
PAGES = {274-279 },
YEAR = {2017},
MONTH = Jun,
DOI = {10.1145/3093742.3095099},
KEYWORDS = {Markov Chains ; Clustering ; Linked-Data ; Anomaly Detection ; Stream Processing},
PDF = {https://hal.archives-ouvertes.fr/hal-01644417/file/main.pdf},
HAL_ID = {hal-01644417},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Paper
%F Oral
%T FlinkMan : Anomaly Detection in Manufacturing Equipment with Apache Flink : Grand Challenge
%+ IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
%+ Département Systèmes Réseaux, Cybersécurité et Droit du numérique (SRCD)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Technion - Israel Institute of Technology [Haifa]
%A Busnel, Yann
%A Riveei, Nicolo
%A Gal, Avigdor
%< avec comité de lecture
%B DEBS '17 - 11th ACM International Conference on Distributed and Event-based Systems
%C Barcelone, Spain
%P 274-279
%8 2017-06-19
%D 2017
%R 10.1145/3093742.3095099
%K Markov Chains
%K Clustering
%K Linked-Data
%K Anomaly Detection
%K Stream Processing
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Information Theory [cs.IT]Conference papers
%X We present a (soo) real-time event-based anomaly detection application for manufacturing equipment, built on top of the general purpose stream processing framework Apache Flink. e anomaly detection involves multiple CPUs and/or memory intensive tasks, such as clustering on large time-based window and parsing input data in RDF-format. e main goal is to reduce end-to-end latencies, while handling high input throughput and still provide exact results. Given a truly distributed seeing, this challenge also entails careful task and/or data parallelization and balancing. We propose FlinkMan, a system that ooers a generic and eecient solution , which maximizes the usage of available cores and balances the load among them. We illustrates the accuracy and eeciency of FlinkMan, over a 3-step pipelined data stream analysis, that includes clustering, modeling and querying.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01644417/document
%2 https://hal.archives-ouvertes.fr/hal-01644417/file/main.pdf
%L hal-01644417
%U https://hal.archives-ouvertes.fr/hal-01644417
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ UNIV-RENNES1
%~ INRIA_TEST
%~ INRIA
%~ IRISA
%~ INRIA2017
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ UR1-UFR-ISTIC
%~ IMTA_SRCD
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ CENTRALESUPELEC
%~ IMT-ATLANTIQUE
%~ IRISA-DIONYSOS-IMTA
%~ IRISA_IMTA
Communication dans un congrès
Rivetti Nicolò, Busnel Yann, Querzoni Leonardo
Délestage avisé dans les systèmes de traitement de flux
ALGOTEL 2017 - 19èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, May 2017, Quiberon, France
Bibtext :
@inproceedings{rivetti:hal-01519427,
TITLE = {{D{\'e}lestage avis{\'e} dans les syst{\`e}mes de traitement de flux}},
AUTHOR = {Rivetti, Nicol{\`o} and Busnel, Yann and Querzoni, Leonardo},
URL = {https://hal.archives-ouvertes.fr/hal-01519427},
BOOKTITLE = {{ALGOTEL 2017 - 19{\`e}mes Rencontres Francophones sur les Aspects Algorithmiques des T{\'e}l{\'e}communications}},
ADDRESS = {Quiberon, France},
YEAR = {2017},
MONTH = May,
KEYWORDS = {Evaluation de performances ; Algorithme d'approximation probabiliste ; Traitement de flux ; D{\'e}lestage de charge},
PDF = {https://hal.archives-ouvertes.fr/hal-01519427/file/main.pdf},
HAL_ID = {hal-01519427},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Délestage avisé dans les systèmes de traitement de flux
%+ Technion - Israel Institute of Technology [Haifa]
%+ IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Middleware Laboratory (MIDLAB)
%A Rivetti, Nicolò
%A Busnel, Yann
%A Querzoni, Leonardo
%< avec comité de lecture
%B ALGOTEL 2017 - 19èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications
%C Quiberon, France
%8 2017-05-29
%D 2017
%K Evaluation de performances
%K Algorithme d'approximation probabiliste
%K Traitement de flux
%K Délestage de charge
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Databases [cs.DB]
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]Conference papers
%X Le délestage de charge est une technique utilisée par les systèmes de traitement de flux en réaction aux pics de charge imprévisibles en entrée, lorsque les ressources de calcul ne sont pas suffisamment provisionnées. Le rôle du délesteur est d'abandonner certains tuples pour maintenir la charge en entrée en dessous d'un seuil critique, et éviter le débordement des mémoires tampons menant in fine à la défaillance complète du système. Dans cet article, nous proposons Load-Aware Shedding (LAS), une solution de délestage de charge qui ne repose ni sur un modèle de coût prédéfini ni sur des hypothèses sur les temps d'exécution des tuples. LAS construit et maintient dynamiquement et efficacement un modèle de coût pour estimer, par l'utilisation d'agrégats, la durée d'exécution de chaque tuple avec des taux d'erreur d'approximation faibles et bornés. Cette estimation est utilisée par un délesteur proactif, localisé en amont de chaque opérateur, permettant de réduire la latence liée aux files d'attente par le délestage d'un nombre minimal de tuples. Nous avons prouvé que LASest une (ε, δ)-approximation d'un délesteur temps-réel optimal. De plus, nous avons évalué son impact sur des applications de traitement de flux, en terme de robustesse et de fiabilité, par une large expérimentation sur la plateforme Microsoft Azure.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01519427/document
%2 https://hal.archives-ouvertes.fr/hal-01519427/file/main.pdf
%L hal-01519427
%U https://hal.archives-ouvertes.fr/hal-01519427
%~ ALGOTEL2017
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ UNIV-RENNES1
%~ INRIA
%~ INRIA_TEST
%~ IRISA
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ UR1-UFR-ISTIC
%~ INRIA2017
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
Communication dans un congrès
Rivetti Nicolò, Anceaume Emmanuelle, Busnel Yann, Querzoni Leonardo, Sericola Bruno
Ordonnancement dynamique pour un équilibrage de charge quasi-optimal dans les systèmes de traitement de flux
ALGOTEL 2017 - 19èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications, May 2017, Quiberon, France
Bibtext :
@inproceedings{rivetti:hal-01519432,
TITLE = {{Ordonnancement dynamique pour un {\'e}quilibrage de charge quasi-optimal dans les syst{\`e}mes de traitement de flux}},
AUTHOR = {Rivetti, Nicol{\`o} and Anceaume, Emmanuelle and Busnel, Yann and Querzoni, Leonardo and Sericola, Bruno},
URL = {https://hal.archives-ouvertes.fr/hal-01519432},
BOOKTITLE = {{ALGOTEL 2017 - 19{\`e}mes Rencontres Francophones sur les Aspects Algorithmiques des T{\'e}l{\'e}communications}},
ADDRESS = {Quiberon, France},
YEAR = {2017},
MONTH = May,
KEYWORDS = {Equilibrage de charge ; Groupement de cl{\'e} ; Traitement de flux ; Algorithme d'approximation probabiliste ; Evaluation de performance},
PDF = {https://hal.archives-ouvertes.fr/hal-01519432/file/main.pdf},
HAL_ID = {hal-01519432},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Ordonnancement dynamique pour un équilibrage de charge quasi-optimal dans les systèmes de traitement de flux
%+ Technion - Israel Institute of Technology [Haifa]
%+ Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE)
%+ IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Middleware Laboratory (MIDLAB)
%A Rivetti, Nicolò
%A Anceaume, Emmanuelle
%A Busnel, Yann
%A Querzoni, Leonardo
%A Sericola, Bruno
%< avec comité de lecture
%B ALGOTEL 2017 - 19èmes Rencontres Francophones sur les Aspects Algorithmiques des Télécommunications
%C Quiberon, France
%8 2017-05-29
%D 2017
%K Equilibrage de charge
%K Groupement de clé
%K Traitement de flux
%K Algorithme d’approximation probabiliste
%K Evaluation de performance
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Databases [cs.DB]
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]Conference papers
%X La répartition de la charge sur les opérateurs sans état parallélisé dans un système de traitement de flux repose principalement sur le groupement aléatoire des tuples. Chacun de ces derniers peut être assigné à n'importe quelle instance disponible de l'opérateur considéré, indépendamment des assignations précédentes. L'approche classique consiste à transmettre à tour de rôle les tuples aux différentes instances parallèles existantes. Cette politique convient bien tant que le temps d'exécution de tous les tuples est plus ou moins le même. Cette hypothèse est cependant rarement vérifiée en pratique, où les temps d'exécution reposent principalement sur le contenu des tuples, et peut causer un déséquilibre imprévisible menant in fine à un accroissement indésirable des temps d'exécution et potentiellement à la défaillance du système. Dans cet article, nous proposons Online Shuffle Grouping (OSG), une solution de groupement permettant de réduire le temps d'exécution global des tuples. OSG commence par estimer, par l'utilisation d'agrégats, la durée d'exécution de chaque tuple, avec des taux d'erreur d'approximation faibles et bornés, lui permettant d'effectuer un ordonnancement pro-actif en temps-réel. Nous proposons une analyse probabiliste de OSG et évaluons son impact sur des applications de traitement de flux, en terme de robustesse et de fiabilité, par une large expérimentation sur la plateforme Microsoft Azure.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01519432/document
%2 https://hal.archives-ouvertes.fr/hal-01519432/file/main.pdf
%L hal-01519432
%U https://hal.archives-ouvertes.fr/hal-01519432
%~ ALGOTEL2017
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ UNIV-RENNES1
%~ INRIA
%~ INRIA_TEST
%~ SUP_CIDRE
%~ CENTRALESUPELEC-SACLAY
%~ IRISA
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ UNIV-PARIS-SACLAY
%~ UR1-UFR-ISTIC
%~ INRIA2017
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ CENTRALESUPELEC-SACLAY-VP
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ CENTRALESUPELEC
Communication dans un congrès
Samba Alassane, Busnel Yann, Blanc Alberto, Dooze Philippe, Simon Gwendal
Instantaneous Throughput Prediction in Cellular Networks: Which Information Is Needed?
2017 IFIP/IEEE International Symposium on Integrated Network Management (IM), May 2017, Lisbonne, Portugal. IEEE, 2017, 2017 IFIP/IEEE International Symposium on Integrated Network Management (IM). 〈http://im2017.ieee-im.org〉
Bibtext :
@inproceedings{samba:hal-01535696,
TITLE = {{Instantaneous Throughput Prediction in Cellular Networks: Which Information Is Needed?}},
AUTHOR = {Samba, Alassane and Busnel, Yann and Blanc, Alberto and Dooze, Philippe and Simon, Gwendal},
URL = {https://hal.archives-ouvertes.fr/hal-01535696},
BOOKTITLE = {{2017 IFIP/IEEE International Symposium on Integrated Network Management (IM)}},
ADDRESS = {Lisbonne, Portugal},
PUBLISHER = {{IEEE}},
SERIES = {2017 IFIP/IEEE International Symposium on Integrated Network Management (IM)},
YEAR = {2017},
MONTH = May,
PDF = {https://hal.archives-ouvertes.fr/hal-01535696/file/bare_conf.pdf},
HAL_ID = {hal-01535696},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Instantaneous Throughput Prediction in Cellular Networks: Which Information Is Needed?
%+ Orange Labs [Lannion]
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Département Systèmes Réseaux, Cybersécurité et Droit du numérique (SRCD)
%+ Advanced technologies for operated networks (ADOPNET)
%A Samba, Alassane
%A Busnel, Yann
%A Blanc, Alberto
%A Dooze, Philippe
%A Simon, Gwendal
%< avec comité de lecture
%B 2017 IFIP/IEEE International Symposium on Integrated Network Management (IM)
%C Lisbonne, Portugal
%I IEEE
%3 2017 IFIP/IEEE International Symposium on Integrated Network Management (IM)
%8 2017-05-08
%D 2017
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Information Theory [cs.IT]Conference papers
%X Downlink data rates can vary significantly in cellular networks, with a potentially non-negligible effect on the user experience. Content providers address this problem by using different representations (e.g., picture resolution, video resolution and rate) of the same content and switch among these based on measurements collected during the connection. If it were possible to know the achievable data rate before the connection establishment, content providers could choose the most appropriate representation from the very beginning. We have conducted a measurement campaign involving 60 users connected to a production network in France, to determine whether it is possible to predict the achievable data rate using measurements collected, before establishing the connection to the content provider, on the operator's network and on the mobile node. We show that it is indeed possible to exploit these measurements to predict, with a reasonable accuracy, the achievable data rate.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01535696/document
%2 https://hal.archives-ouvertes.fr/hal-01535696/file/bare_conf.pdf
%L hal-01535696
%U https://hal.archives-ouvertes.fr/hal-01535696
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ UNIV-RENNES1
%~ INRIA
%~ INRIA_TEST
%~ IRISA
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ UR1-UFR-ISTIC
%~ INRIA2017
%~ IMTA_SRCD
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ IRISA-ADOPNET-IMTA
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ IMT-ATLANTIQUE
%~ IRISA-DIONYSOS-IMTA
%~ IRISA_IMTA
Article dans une revue
Anceaume Emmanuelle, Busnel Yann
Lightweight Metric Computation for Distributed Massive Data Streams
Transactions on Large-Scale Data- and Knowledge-Centered Systems, Springer Berlin / Heidelberg, 2017, 10430 (33), pp.1--39. 〈10.1007/978-3-662-55696-2_1〉
Bibtext :
@article{anceaume:hal-01634353,
TITLE = {{Lightweight Metric Computation for Distributed Massive Data Streams}},
AUTHOR = {Anceaume, Emmanuelle and Busnel, Yann},
URL = {https://hal.archives-ouvertes.fr/hal-01634353},
JOURNAL = {{Transactions on Large-Scale Data- and Knowledge-Centered Systems}},
PUBLISHER = {{Springer Berlin / Heidelberg}},
VOLUME = {10430},
NUMBER = {33},
PAGES = {1--39},
YEAR = {2017},
MONTH = Apr,
DOI = {10.1007/978-3-662-55696-2\_1},
KEYWORDS = {distributed approximation algorithm ; statistical metric ; Data stream model ; correlation metric},
PDF = {https://hal.archives-ouvertes.fr/hal-01634353/file/ab-tldks2017.pdf},
HAL_ID = {hal-01634353},
HAL_VERSION = {v1},
}
Endnote :
%0 Journal Article
%T Lightweight Metric Computation for Distributed Massive Data Streams
%+ Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE)
%+ Centre de Recherche en Économie et Statistique (CREST)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%A Anceaume, Emmanuelle
%A Busnel, Yann
%< avec comité de lecture
%@ 1869-1994
%J Transactions on Large-Scale Data- and Knowledge-Centered Systems
%I Springer Berlin / Heidelberg
%V 10430
%N 33
%P 1--39
%8 2017-04-01
%D 2017
%R 10.1007/978-3-662-55696-2_1
%K distributed approximation algorithm
%K statistical metric
%K Data stream model
%K correlation metric
%Z Computer Science [cs]
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]Journal articles
%X The real time analysis of massive data streams is of utmost importance in data intensive applications that need to detect as fast as possible and as efficiently as possible (in terms of computation and memory space) any correlation between its inputs or any deviance from some expected nominal behavior. The IoT infrastructure can be used for monitoring any events or changes in structural conditions that can compromise safety and increase risk. It is thus a recurrent and crucial issue to determine whether huge data streams, received at monitored devices , are correlated or not as it may reveal the presence of attacks. We propose a metric, called codeviation, that allows to evaluate the correlation between distributed massive streams. This metric is inspired from classical metric in statistics and probability theory, and as such enables to understand how observed quantities change together, and in which proportion. We then propose to estimate the codeviation in the data stream model. In this model, functions are estimated on a huge sequence of data items, in an online fashion, and with a very small amount of memory with respect to both the size of the input stream and the values domain from which data items are drawn. We then generalize our approach by presenting a new metric, the Sketch-metric, which allows us to define a distance between updatable summaries of large data streams. An important feature of the Sketch-metric is that, given a measure on the entire initial data streams, the Sketch-metric preserves the axioms of the latter measure on the sketch. We finally present results obtained during extensive experiments conducted on both synthetic traces and real data sets allowing us to validate the robustness and accuracy of our metrics.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01634353/document
%2 https://hal.archives-ouvertes.fr/hal-01634353/file/ab-tldks2017.pdf
%L hal-01634353
%U https://hal.archives-ouvertes.fr/hal-01634353
%~ CNRS
%~ UNIV-UBS
%~ IRISA_SET
%~ CREST
%~ GENES
%~ UNIV-RENNES1
%~ INRIA_TEST
%~ INRIA
%~ UR1-HAL
%~ ENSAE
%~ PARISTECH
%~ ENSAE-SACLAY
%~ IRISA
%~ INRIA2017
%~ SUP_CIDRE
%~ UR1-MATH-STIC
%~ UNIV-PARIS-SACLAY
%~ UR1-UFR-ISTIC
%~ CENTRALESUPELEC-SACLAY
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ CENTRALESUPELEC-SACLAY-VP
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ CENTRALESUPELEC
%~ X
%~ X-SACLAY
%~ X-CREST
%~ X-DEP
Communication dans un congrès
Rivetti Nicoló, Anceaume Emmanuelle, Busnel Yann, Querzoni Leonardo, Sericola Bruno
Online Scheduling for Shuffle Grouping in Distributed Stream Processing Systems Research Paper
ACM/IFIP/USENIX Middleware 2016 , Dec 2016, Trento, Italy. 〈10.1145/2988336.2988347〉
Bibtext :
@inproceedings{rivetti:hal-01397658,
TITLE = {{Online Scheduling for Shuffle Grouping in Distributed Stream Processing Systems Research Paper}},
AUTHOR = {Rivetti, Nicol{\'o} and Anceaume, Emmanuelle and Busnel, Yann and Querzoni, Leonardo and Sericola, Bruno},
URL = {https://hal.archives-ouvertes.fr/hal-01397658},
BOOKTITLE = {{ACM/IFIP/USENIX Middleware 2016 }},
ADDRESS = {Trento, Italy},
ORGANIZATION = {{ACM/IFIP/USENIX}},
YEAR = {2016},
MONTH = Dec,
DOI = {10.1145/2988336.2988347},
KEYWORDS = {CCS Concepts $\bullet$Information systems $\rightarrow$ Data streams ; Stream manage- ment ; $\bullet$Computer systems organization $\rightarrow$ Distributed architectures ; $\bullet$Theory of computation $\rightarrow$ Sketching and sampling ; Keywords Stream Processing ; Data Streaming ; Shuffle Grouping},
PDF = {https://hal.archives-ouvertes.fr/hal-01397658/file/main.pdf},
HAL_ID = {hal-01397658},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Online Scheduling for Shuffle Grouping in Distributed Stream Processing Systems Research Paper
%+ Middleware Laboratory (MIDLAB)
%+ Laboratoire d'Informatique de Nantes Atlantique (LINA)
%+ Confidentialité, Intégrité, Disponibilité et Répartition (CIDRE)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Centre de Recherche en Économie et Statistique (CREST)
%A Rivetti, Nicoló
%A Anceaume, Emmanuelle
%A Busnel, Yann
%A Querzoni, Leonardo
%A Sericola, Bruno
%< avec comité de lecture
%B ACM/IFIP/USENIX Middleware 2016
%C Trento, Italy
%8 2016-12-12
%D 2016
%R 10.1145/2988336.2988347
%K CCS Concepts •Information systems → Data streams
%K Stream manage- ment
%K •Computer systems organization → Distributed architectures
%K •Theory of computation → Sketching and sampling
%K Keywords Stream Processing
%K Data Streaming
%K Shuffle Grouping
%Z Computer Science [cs]
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]Conference papers
%X Shuffle grouping is a technique used by stream processing frameworks to share input load among parallel instances of stateless operators. With shuffle grouping each tuple of a stream can be assigned to any available operator instance, independently from any previous assignment. A common approach to implement shuffle grouping is to adopt a Round-Robin policy, a simple solution that fares well as long as the tuple execution time is almost the same for all the tu-ples. However, such an assumption rarely holds in real cases where execution time strongly depends on tuple content. As a consequence, parallel stateless operators within stream processing applications may experience unpredictable unbal-ance that, in the end, causes undesirable increase in tuple completion times. In this paper we propose Online Shuffle Grouping (OSG), a novel approach to shuffle grouping aimed at reducing the overall tuple completion time. OSG estimates the execution time of each tuple, enabling a proac-tive and online scheduling of input load to the target operator instances. Sketches are used to efficiently store the otherwise large amount of information required to schedule incoming load. We provide a probabilistic analysis and illustrate , through both simulations and a running prototype, its impact on stream processing applications.
%G English
%2 https://hal.archives-ouvertes.fr/hal-01397658/document
%2 https://hal.archives-ouvertes.fr/hal-01397658/file/main.pdf
%L hal-01397658
%U https://hal.archives-ouvertes.fr/hal-01397658
%~ CNRS
%~ UNIV-UBS
%~ LINA
%~ INSTITUT-TELECOM
%~ IRISA_SET
%~ CREST
%~ GENES
%~ UNIV-NANTES
%~ UNIV-RENNES1
%~ INRIA
%~ IRISA
%~ INRIA_TEST
%~ INRIA2
%~ SUP_CIDRE
%~ PARISTECH
%~ UR1-HAL
%~ CENTRALESUPELEC
%~ UR1-MATH-STIC
%~ ENSAE
%~ UR1-UFR-ISTIC
%~ ENSAE-SACLAY
%~ CENTRALESUPELEC-SACLAY
%~ UNIV-PARIS-SACLAY
%~ LINA-GDD
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ CENTRALESUPELEC-SACLAY-VP
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ X
%~ X-SACLAY
%~ X-CREST
%~ X-DEP
Communication dans un congrès
Rivetti Nicoló, Busnel Yann, Querzoni Leonardo
Load-aware shedding in stream processing systems
10th ACM International Conference on Distributed and Event-based Systems (DEBS), Jun 2016, Irvine, United States. pp.61 - 68, 2016, 〈10.1145/2933267.2933311〉
Bibtext :
@inproceedings{rivetti:hal-01413212,
TITLE = {{Load-aware shedding in stream processing systems}},
AUTHOR = {Rivetti, Nicol{\'o} and Busnel, Yann and Querzoni, Leonardo},
URL = {https://hal.inria.fr/hal-01413212},
BOOKTITLE = {{10th ACM International Conference on Distributed and Event-based Systems (DEBS)}},
ADDRESS = {Irvine, United States},
PAGES = {61 - 68},
YEAR = {2016},
MONTH = Jun,
DOI = {10.1145/2933267.2933311},
KEYWORDS = {Distributed systems organizing principles ; On-line learning algorithms ; Sketching and sampling ; Keywords Stream Processing ; Data Streaming ; Load Shedding},
PDF = {https://hal.inria.fr/hal-01413212/file/main-no-cc.pdf},
HAL_ID = {hal-01413212},
HAL_VERSION = {v1},
}
Endnote :
%0 Conference Proceedings
%T Load-aware shedding in stream processing systems
%+ Middleware Laboratory (MIDLAB)
%+ Laboratoire d'Informatique de Nantes Atlantique (LINA)
%+ Dependability Interoperability and perfOrmance aNalYsiS Of networkS (DIONYSOS)
%+ Centre de Recherche en Économie et Statistique (CREST)
%A Rivetti, Nicoló
%A Busnel, Yann
%A Querzoni, Leonardo
%< avec comité de lecture
%B 10th ACM International Conference on Distributed and Event-based Systems (DEBS)
%C Irvine, United States
%P 61 - 68
%8 2016-06-20
%D 2016
%R 10.1145/2933267.2933311
%K Distributed systems organizing principles
%K On-line learning algorithms
%K Sketching and sampling
%K Keywords Stream Processing
%K Data Streaming
%K Load Shedding
%Z Computer Science [cs]/Data Structures and Algorithms [cs.DS]
%Z Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC]
%Z Computer Science [cs]/Information Theory [cs.IT]Conference papers
%X Load shedding is a technique employed by stream processing systems to handle unpredictable spikes in the input load whenever available computing resources are not adequately provisioned. A load shedder drops tuples to keep the input load below a critical threshold and thus avoid tuple queuing and system trashing. In this paper we propose Load-Aware Shedding (LAS), a novel load shedding solution that drops tuples with the aim of maintaining queuing times below a tunable threshold. Tuple execution durations are estimated at runtime using efficient sketch data structures. We provide a theoretical analysis proving that LAS is an (ε, δ)-approximation of the optimal online load shedder and show its performance through a practical evaluation based both on simulations and on a running prototype.
%G English
%2 https://hal.inria.fr/hal-01413212/document
%2 https://hal.inria.fr/hal-01413212/file/main-no-cc.pdf
%L hal-01413212
%U https://hal.inria.fr/hal-01413212
%~ CNRS
%~ UNIV-UBS
%~ LINA
%~ INSTITUT-TELECOM
%~ IRISA_SET
%~ CREST
%~ GENES
%~ UNIV-NANTES
%~ UNIV-RENNES1
%~ INRIA
%~ IRISA
%~ INRIA_TEST
%~ INRIA2
%~ PARISTECH
%~ UR1-HAL
%~ UR1-MATH-STIC
%~ ENSAE
%~ UR1-UFR-ISTIC
%~ ENSAE-SACLAY
%~ UNIV-PARIS-SACLAY
%~ LINA-GDD
%~ TEST-UNIV-RENNES
%~ TEST-UR-CSS
%~ UNIV-RENNES
%~ INRIA-RENNES
%~ INRIA-RENGRE
%~ X
%~ X-SACLAY
%~ X-CREST
%~ X-DEP
Voir toutes les publications