Projets financés
CO-SMA-GEMS : Corpus d'Ontologies pour les Systèmes Multi-Agents en Géographie, Economie, Marketing et Sociologie.
Le projet a pour but d’initier la production collective d’un corpus public et documenté d'ontologies informatiques utilisable pour la modélisation et la simulation multi-agents. Il s’agit de produire une description conceptuelle formelle pour représenter et organiser nos connaissances au moyen d’une
Langues en danger d'Amérique latine et d'Afrique : Description, documentation et typologie. (Afrique Amérique Latine Langues En Danger = AALLED)
Le présent projet réunira les compétences de deux équipes de recherche du laboratoire DDL, l’une spécialisée dans la description et la documentation des langues d’Amérique latine et l’autre dans la description des langues d’Afrique. Il a pour objectifs le développement du thème des langues en danger
SCIENTEXT : un corpus et des outils pour étudier le positionnement et le raisonnement de l'auteur dans les écrits scientifiques
A travers un corpus annoté d’environ 4,5 millions de mots, seront étudiés deux éléments essentiels du texte scientifique : le positionnement, qui permet à l’auteur de se situer par rapport à ses devanciers ou collègues et de préciser ses choix scientifiques ; le raisonnement, prenant en compte le c
Genèse des travaux de toxicologiques de C. Bernard : approches génétique, épistémologique et informatique.
Application de techniques d’intelligence artificielle à la genèse des travaux de Claude Bernard sur l’intoxication oxycarbonée et l’intoxication par le curare, sous les aspects textuels (étude des manuscrits, variantes, comparaison des élaborations successives des plans de recherche et des exposés d
Leges populi Romani. Base de données sur les lois comitiales du peuple romain.
Constitution d'une base de données, accessible par Internet et avec mise à disposition gratuite, portant sur les lois comitiales du peuple romain (sources, bibliographies sélectives, notices indiquant le contexte et la signification politique des lois, une analyse détaillée de leur structure et de l
Réalisation de corpus de données visuelles pour l'analyse des processus de création d'unités gestuelles (LSF et gestualité naturelle).
A travers la constitution et la documentation de corpus de locuteurs de langue des signes française (enfants et adultes sourds) et de gestualité naturelle d'entendants, répartis sur l'ensemble du territoire et rassemblant des genres discursifs divers, ce projet vise à approfondir la compréhension de
Mobilités, Populations et Familles dans la France du Nord de la fin du XVIIe siècle à la fin du XIXe siècle
Le projet MPF est axé autour de l’exploitation des recensements annuels effectués par les autorités municipales de Charleville de la fin du XVIIe à la fin du XIXe siècles qui sont une source unique en Europe. Il vise à reconstituer sur une dizaine de générations l’évolution démographique et sociale
Constitution d'un corpus de données sur les usages des outils mobiles de communication et leurs relations aux comportements de mobilité
Le projet a pour objectif de construire un corpus de données sur les usages des outils mobiles de communication et leurs relations à la mobilité des personnes, le présenter dans un format pouvant être exploité par différentes disciplines des SHS, le mettre à disposition des chercheurs et favoriser l
Système d'information: "Patrons et patronat français - XIXe - XXe siècles"
Même si des sources importantes ont été repérées et de nombreux renseignements ont été collectés, les travaux sur les entreprises et les entrepreneurs se heurtent à la difficulté de rassembler des informations biographiques précises sur les responsables patronaux étudiés. Or, l'outil informatique, à
Corpus électronique des lettres des papes des XIIIe et XIVe siècles
Ce projet à pour but de construire le Corpus des lettres des papes des XIIIe et XIVe siècles conservées à l’Archivio segreto vaticano. A partir du travail d’analyse et d’édition accumulé depuis la fin du XIXe siècle et en le complétant de façon efficace pour un certain nombre de pontificats, l’objec
Edition électronique de la correspondance de Eugène Delacroix
L’objectif de ce projet est de proposer une nouvelle édition de la correspondance du peintre Eugène Delacroix. Celle-ci, qui comporte à l’heure actuelle plus d’un millier de lettres courant sur toute sa carrière, est en effet une source capitale tant pour la connaissance de l’artiste que celle de so
Échange de corpus d'apprentissage multimodaux
Nous proposons la création et la diffusion de corpus d'apprentissage. Cet ensemble de données doit rassembler, non seulement les données résultats d'une formation mais également son contexte, c'est-à-dire les données caractérisant le dispositif de formation, ainsi que celles provenant du dispositif
Application de Recherche et d’Information sur les Deserts
ARIDE vise à constituer des corpus de données spatiales sur le peuplement des déserts. Il s’agit de concevoir des applications d’accès et de traitement des corpus ; d’enrichir les corpus sur l’Égypte ; de constituer des corpus thématiques sur l’Égypte, la Chine et le Burkina Faso. Nous nous adresson
CSES - France Dispositif français d’une enquête électorale internationale à l’occasion des élections législatives 2007
Le projet CSES-France a pour objet la réalisation et l’exploitation d’une enquête post-électorale en France à l’occasion des élections législatives programmées pour le printemps 2007. Cette enquête s’inscrit dans un projet plus vaste, le CSES (Etude comparative des systèmes électoraux), pensé à une
Translations médiévales : cinq siècles de traductions en français (Xe-XVe siècle)
Le projet TRANSMEDIE est un corpus bibliographique et analytique des traductions dans les langues françaises du Moyen Âge qui recense, rassemble, ordonne et interprète les informations bibliographiques sur les œuvres historiques, philosophiques, littéraires, théologiques et scientifiques traduites e
Corpus de temps de réaction pour 40 000 mots de la langue française et étude de la lecture silencieuse et à voix haute chez l’adulte.
L’objectif de ce projet est d’une part de recueillir des temps de réaction dans les tâches de décision lexicale et de prononciation sur environ 40 000 mots de la langue française à travers 1200 adultes, et d’autre part, à partir de ce large corpus, de répondre à un certain nombre de questions théori
Corpus Sciento-Technométrique de la Génomique
Le projet poursuit trois objectifs :1. La constitution d’un corpus sciento-technométrique 1990 -2003, - les données clé du domaine de la génomique. 2. L’exploitation pilote de ce corpus sera développée dans une étude d’application. 3. Valorisation et dissémination : il en résultera un protocole de m
Traitement des Variations Linguistiques dans les Corpus
Le programme « Variling - Traitement des variations linguistiques dans les corpus » réunit les compétences de quatre équipes, engagées dans le travail sur des corpus représentatifs de la variation diatopique, diachronique et sociale du français, à des fins de comparaison et d’analyse. Le travail vis
Le devenir de 20 000 enfants. Aspects familiaux, sociaux, économiques et éducatifs.
Le projet consiste en la mise en place d’une cohorte, représentative au plan national, de 20 000 enfants qui seront suivis de la naissance à l’âge adulte dans une approche pluridisciplinaire, permettant d’analyser le développement de l’enfant dans son milieu, en tenant compte des facteurs familiaux,
Création d’un corpus d’expressions émotionnelles faciales spontanées et dynamiques
Ce projet de recherche a pour but de construire et de valider un corpus de vidéos présentant des expressions faciales à la fois dynamiques et naturelles pour d’une part, améliorer nos connaissances concernant l’analyse psychologique des processus cognitifs mobilisés pour ce type d’expression et d’a
Corpus Oral en langues Afroasiatiques : Analyse Prosodique et Morphosyntaxique
L’objectif de ce projet est d’établir une méthodologie de partage et d’unification des données orales de terrain dans une famille de langues, l’Afro-Asiatique (ou Chamito-Sémitique), à partir de l’analyse linguistique de la structure intonative et morphosyntaxique des langues représentées. Le but vi
Pour une refondation de l’histoire economique quantitative : application à l’industrie houillère (1740-2004).
Ce corpus mettra à la disposition des chercheurs des séries couvrant le cycle de vie du charbon en France (1740-2004). Structuré en 4 rubriques (marché, capital physique, capital financier et capital humain), il permettra d’établir des indicateurs susceptibles de mieux comprendre les déterminants de
Biographie collective des acteurs du mouvement ouvrier et du mouvement social
Objectifs, contexte, problématique, originalité :Mettre à la disposition de la communauté scientifique un ensemble de corpus concernant le mouvement ouvrier et le mouvement social, avec des facilités d'accès informatiques. La méthode prosopographique sera utilisée ainsi que l'approche sociobiographi
Eclats d'Histoire : Dion Cassius et l'historiographie fragmentaire de Rome
Travail d'ensemble sur les parties mutilées de l'œuvre de Dion Cassius : traitement (identification, classement), et établissement d'une base de données textuelle et bibliographique à l'intérieur d'une BDD internationale. Parallèlement, le même travail est entrepris sur d'autres historiens grecs de
Le fonds judiciaire du Parlement de Flandre (1668-1790). Constitution d’outils adaptés à une exploitation scientifique.
L’objet du projet est de constituer un corpus documentaire informatisé à partir des dossiers de procédure du Parlement de Flandre conservés aux Archives départementales du Nord. L’analyse de ces dossiers fournira aux historiens et historiens du droit des informations pour leurs futures recherches, e
Développement et exploitation textuelle d'un corpus d'oeuvres linguistiques.
Etablir une représentation de l’histoire de la terminologie linguistique occidentale sous l’angle conceptuel et terminologique (volet 1) et sous l’angle lexicologique et étymologique (volet 2). Exploiter un corpus de textes linguistiques par les moyens techniques les plus élaborés. Mettre à disposit
Langues et traditions orales de l’Ouest népalais
Le projet consiste en l'archivage numérique, la transcription et le traduction d'un corpus de traditions orales (contes et épopées) du Népal oriental, ainsi qu'en la récolte de nouveaux matériaux. Ce fonds servira à l'étude linguistique des dialectes Pahari en vue de les caractériser, ainsi qu'à l'é
Fédération des recherches et développements en textométrie autour de la création d’une plateforme logicielle ouverte
Pour l'analyse de grands corpus de textes, la textométrie, née en France dans les années 70-80, a développé des techniques puissantes et originales, éprouvées dans de multiples branches des SHS et statistiquement solidement fondées. Ce projet fédère les développements logiciels académiques du domain
Évolution linguistique et corpus
Le projet concerne l'évolution des déterminants français du 12ème au 18ème siècle. Il s'agit à la fois de réfléchir sur les modifications majeures qui ont affecté un secteur considéré comme crucial pour l'organisation des langues et de proposer un corpus annoté permettant à des chercheurs, ou simp
Sources du savoir mathématique au début du XXe siècle
La problématique de la modernité en sciences exactes est étudiée par rapport à trois corpus en rapport direct avec le tournant moderne vers 1900 : (1) les Annales de mathématiques, (2) le Répertoire bibliographique des sciences mathématiques, et (3) la Nachlass de Henri Poincaré. Ces sources seront
Outils Pour le Traitement et l'analyse de l'Information dans les MAnuscrits modernes
Il s’agit de créer les outils théoriques et techniques qui doivent permettre la valorisation des grands corpus modernes actuellement inexplorés et à l’état de documents illisibles dans nos grandes bibliothèques européennes. Il s’agira de convertir des manuscrits autographes en un « avant texte » tra