Yannis HARALAMBOUS
Biographie
Personal Page
I am a member of the Computer Science Departement of IMT Atlantique, as well as of the research team DECIDE, belonging to the CNRS laboratory Lab-STICC. My research topics are natural language processing, text mining and grapholinguistics. I'm teaching graph theory, logic, probabilistic graphical models and computational linguistics.
Biography
Born in Athens (Greece) in 1962, I graduated from the Lycée Léonin High School (Athens) in 1979. I obtained my bachelor (DEUG A, Licence de mathématiques, Maîtrise de mathématiques pures and partly Maîtrise de mathématiques appliquées) and my master (DEA de mathématiques pures) from University of Lille I (USTL). I graduated (thèse de doctorat ès sciences mathématiques) in 1990 at the same university, in the field of Algebraic Topology, under the supervision of Prof. Daniel Tanré.
During my Ph.D. and until 1992, I worked as assistant associate (assistant associé and later ATER) at University of Lille I, giving classes in Algebra, Differential Calculus and Analysis.
After 1990 I became active in the field of digital typography and internationalization. In 1993/94 I gave lectures (chargé d'enseignement) at the Institute of Oriental Languages and Civilisations (INALCO) in Paris as an external member of the CERTAL (Centre d'études et de recherches sur le traitement automatique des langues). In 1994 my wife and I started the company Atelier Fluxus Virus, specialized in the development of digital typography tools and systems. In 2003 I wrote a 1,000+ page book on digital typography and internationalization (Fontes et codages) for O'Reilly France, which was subsequently translated into English and published by O'Reilly US (Fonts & Encodings, From Advanced Typography to Unicode and everything in between, 2007).
In 2001 I entered IMT Atlantique (at that time: ENST Bretagne) as a full Professor (directeur d'études) at the Computer Science Departement. I continued research on digital typography and electronic documents, progressively orienting myself to the area of natural language processing and text mining.
In 2010 I became a full member of the DECIDE research group (Data Mining and Decision Theory) of the Lab-STICC CNRS laboratory.
Ever since 2011 I am in charge of the DS (Data Science) Master of Science of IMT Atlantique. Some of my classes are specific to this master (natural language processing, statistics) and others (probabilistic graphical models, graph theory, logic) are open also to other students of IMT Atlantique.
In 2020 I obtained my “Habilitation à diriger des recherches” from Université de Bretagne Occidentale.
Here are my identifiers: ORCID (0000-0003-1443-6115), HAL, IdRef, Wikidata, Google Scholar, Semantic Scholar, dblp, Mathematics Genealogy Project, theses.fr.
My Erdős Number is 3 (Erdős—Diaconis—Rowley—me).
In 2018, 2020 and 2022 I organized there editions of the international conference Grapholinguistics in the 21st Century, all talks have been recorded and can be viewed on the corresponding Web sites (2018, 2020, 2022). The Proceedings have been published by Fluxus Editions.
Cheque of 1 hexadecimal dollar emitted by Donald E. Knuth on March 20, 2018 at the Bank of San Serriffe.
Cheque of 1 hexadecimal dollar emitted by Donald E. Knuth on May 5, 2021 at the Bank of San Serriffe.
Offres de stage, thèse ou post-doc
Contrat post-doctoral de 24 mois à partir d’octobre 2024
E-LEARNING SPONTANÉ DE DONNÉES D'INTELLIGENCE OPEN SOURCE (COGITAMUS)
Domaines : Traitement automatique du langage naturel, apprentissage assisté par la technologie, linguistique cognitive
Mots clés : E-learning spontané, structuration de l'information, échelle de charge cognitive
CONTEXTE GENERAL :
Les moteurs de recherche génériques produisent des grandes quantités de résultats devant lesquels un·e utilisateur·rice qui cherche à explorer un domaine de connaissances peut se trouver démuni·e. Au manque de pédagogie s'ajoute le manque de fiabilité et de traçabilité des résultats. Le logiciel Rnest de la société La Mètis résoud une partie du problème en fournissant à l'utilisateur·rice des informations fiables et traçables. Mais il reste le problème de la large quantité de données qui conduit à une charge cognitive excessive et à l'incapacité d'exploration du domaine.
D'autre part l'apprentissage assisté par la technologie (e-learning) est en plein essor, mais il est toujours basé sur des ressources minutieusement préparées par les éducateur·rice·s humain·e·s. Très peu de recherches existent sur la production algorithmique de ressources d'e-learning, et encore moins lorsqu'elles sont basées sur des informations collectées sur le Web suite à des requêtes émises par l'apprenant·e.
OBJECTIFS :
Le but du projet COGITAMUS est l'intégration des informations collectées à partir du Web et prétraitées par Rnest avec des méthodes d'e-learning pour obtenir spontanément des ressources d'apprentissage, et de monitorer cet apprentissage au niveau de l'apprenant·e humain·e.
Le problème scientifique sous-jacent est la détermination algorithmique d'une stratégie d'apprentissage à partir de données collectées sur le Web, et la mise en place de cette stratégie, qui doit également comporter une composante d'évaluation des performances de l'apprenant·e. Cela implique une modélisation des informations et connaissances en vue de leur découpage en brique d'apprentissage, la transmission de ces briques en tenant compte des particularités discursives des méthodes textuelles/graphiques à disposition, et la modélisation de la charge cognitive en vue de son évaluation.
Les recherches menées dans le cadre de ce projet permettront d'évaluer le potentiel des méthodes d'«e-learning spontané», utilisant des ressources pédagogiques générées algorithmiquement, sans intervention humaine autre que l'interaction avec l'apprenant·e, et en particulier sans intervention d'un·e éducateur·rice ou validateur·rice humain·e quelconque. Si les LLM sont de nos jours devenus, de par la large adhésion du public, des systèmes d'«e-learning spontanté» de facto, l'approche de COGITAMUS se veut explicable et basée sur des informations fiables et traçables — cela n'est pas le cas des LLM, mais est indispensable dans certains secteurs d'activités tels que l'intelligence militaire, ou la recherche industrielle.
TÂCHES :
• Découpage d'informations (texte, triplets RDF, knowledge graphs) en briques d'informations et de connaissances (BIC), dans deux domaines de connaissances prédéfinis.
• Agrégation des BIC en sessions d'apprentissage, et monitoring de leur transmission
à un sujet apprenant à travers d'interfaces homme-machine et de dispositifs oculométriques.
• Intégration des résultats obtenus dans un modèle prédictif de la charge cognitive et de la courbe d'apprentissage. Utilisation de ce modèle pour optimiser le découpage et l'agrégation des BIC.
• Publication des résultats.
PARTENAIRES ET ACTEURS :
COGITAMUS est un projet financé par un organisme institutionnel, porté par la société La Mètis et la grande-école d'ingénieurs IMT Atlantique.
RÉFÉRENCES :
• Krieger, K. (2015). “Creating Learning Material from Web Resources”. In: Gandon, F., Sabou, M., Sack, H., d’Amato, C., Cudré-Mauroux, P., Zimmermann, A. (eds) The Semantic Web. Latest Advances and New Domains. ESWC 2015. Lecture Notes in Computer Science, vol 9088. Springer, Cham. https://doi.org/10.1007/978-3-319-18818-8_45
• Kurdi, G., Leo, J., Parsia, B. et al. “A Systematic Review of Automatic Question Generation for Educational Purposes”. Int J Artif Intell Educ 30, 121–204 (2020). https://doi.org/10.1007/s40593-019-00186-y
• Ilić, M., Mikić, V., Kopanja, L. et al. “Intelligent techniques in e-learning: a literature review”. Artif Intell Rev (2023). https://doi.org/10.1007/s10462-023-10508-1
• Deborah Oluwadele, Yashik Singh & Timothy T. Adeliyi
“E-Learning Performance Evaluation in Medical Education—A Bibliometric and Visualization Analysis”, Healthcare 11 (2023), 232; https://doi.org/10.3390/healthcare11020232
• Fırat, M., “Integrating AI Applications into Learning Management Systems to Enhance e-Learning”, Instructional Technology and Lifelong Learning 4 (2023), 1-14 . https://doi.org/10.52911/itall.1244453
PRÉREQUIS : thèse de doctorat en traitement automatique du langage ou en sciences cognitives de l'apprentissage ou en technologies d'assistance à l'apprentissage.
LIEU : IMT Atlantique, Brest. (Laboratoire Lab-STICC UMR CNRS 6285, équipe DECIDE)
DÉBUT DE CONTRAT : octobre 2024
DURÉE DU CONTRAT : 24 mois
MODALITÉ DE CANDIDATURE : Le dossier de candidature doit comprendre, dans un PDF, votre CV, lettre de motivation, liste de publications, les noms de 2-3 référents à contacter ou éventuellement des lettres de recommandation et dans un deuxième fichier PDF, si possible, le manuscrit de votre thèse. Le dossier doit être adressé à:
- Yannis Haralambous : yannis.haralambous@imt-atlantique.fr
- Philippe Charlot : philippe.charlot@la-metis.fr
- Nicolas Kahn : nicolas.kahn@la-metis.fr
==================================
Ressources
Ressources
- Yannis Haralambous, Formation doctorale/LIESSE LaTeX. En supplément, page en arabe et chinois.
- Yannis Haralambous, Poster presented at the 12th International Workshop of the Association for Written Language and Literacy (Cambridge, March 26-28, 2019): Phonocentrism in Greece: Side Effects of Two Centuries of Diglossia.
- Yannis Haralambous, Introduction au grec moderne pour la classe de grec du Lycée Sainte-Anne.
- David I. Masson, Hausfreund von Vorgeſtern (1968), übersetzt von Horst Pukallus, gesetzt in Schönberger Fraktur und HW Caslon.
- L'interpréteur de logique combinatoire de John Tromp :
L'archive cl.tar.gz provient de la page dédiée à la logique combinatoire de John Tromp (Tromp avec un `o' !!, un adepte du jeu de Go), pour interprêter des programmes en logique combinatoire il faut le décompresser, compiler CL.java :
javac CL.java
et ensuite l'exécuter :
java CL
Sur la ligne de commande on peut écrire des expressions qui séront réduites (par exemple : en écrivant KKxyz on obtient la réponse :
of size 1
head reduces in 0 steps to y of size 1On peut également utiliser une fonction anonyme f, on obtient alors le combinateur complexe qui a le même comportement, par exemple si on demande fxyzt=t (le projecteur π44), on obtient
defines f as K(SK)
of size 3 - Yannis Haralambous, Transparents de la présentation au colloque HUMANUM, Cluj-Napoca, 18 octobre 2018.
- Yannis Haralambous & Philippe Lenca, Response to the “My Tailor is Rich” Challenge, May 28, 2018.
- Yannis Haralambous, La graphématique, de Saussure à Unicode, et au-delà..., Conférence dans le cadre du séminaire du Master Sciences du langage, Université Grenoble-Alpes, le 21 septembre 2018.
- François Sébastianoff, La poligrafi, une écriture pour tous les usages du français, 1990.
- Corpus de mails ENRON pour formation LIESSE «Traitement automatique de la langue».
- Small manual for the CCG LaTeX style file by B. Hoffman, M. Steedman, and J. Baldridge
- Annexe C de l'article «Exemples de requêtes SPARQL associées aux patrons de questions» de l'article «Un système de questions-réponses automatiques dans le domaine légal : le cas des réglementations maritimes», TAL 58 (2) 47–72, 2018.
- PDF file 1 of graphs and PDF file 2 of graphs of the paper An Attempt to Decrypt Pages 269-271 of Jonathan Safran Foer's Extremely Loud & Incredibly Close, published on viXra.
- Graphemic and graphetic methods for gender-neutral writing, Invited conference at the Technische Universität Braunschweig, January 14th, 2021. Youtube link.
Stages LIESSE
Ci-dessous les liens Youtube et supports des formations LIESSE 2021.
Formation du 10 mai 2021 : Théorie des graphes sous Python
Transparents de présentation de bienvenue
TP 1 « Échelle de mots » (par C. Bothorel), archive contenant les fichiers de données et de corrigé.
TP 2 « Graphe, arbre, diffusion » (par C. Bothorel), archive contenant les fichiers de données et le corrigé.
TP 3 « Rendre les Oscar plus justes », archive contenant les fichiers de données et le corrigé.
Défi 3 « Survivre à l'apocalypse zombie », archive contenant les fichiers de données
Formation du 12 mai 2021 : Langages formels et logique du premier ordre sous Python
Transparents de présentation de bienvenue
TP «Expressions régulières et automates de type fini»
TP «Logique et langage naturel»