Description des missions
La Direction pour la Science Ouverte (DipSO) participe à la définition et à la mise en œuvre de la politique de Science Ouverte de l’Institut. Pour répondre à ses missions, il est essentiel pour la DipSO d’identifier les tendances et les émergences du domaine afin d’en anticiper les évolutions. La DipSO, organisation multi-site impliquant un travail en réseau, est composée de quatre pôles. Afin de répondre aux besoins d’analyse informationnels du management scientifique, la DipSO développe des outils et des méthodes pour observer et suivre l’activité scientifique et son impact.
Profil recherché
La Direction pour la Science Ouverte (DipSO) participe à la définition et à la mise en œuvre de la politique de Science Ouverte de l’Institut. Pour répondre à ses missions, il est essentiel pour la DipSO d’identifier les tendances et les émergences du domaine afin d’en anticiper les évolutions. La DipSO, organisation multi-site impliquant un travail en réseau, est composée de quatre pôles. Afin de répondre aux besoins d’analyse informationnels du management scientifique, la DipSO développe des outils et des méthodes pour observer et suivre l’activité scientifique et son impact.Niveau minimum requis : Bac+5 ou expérience significative dans un poste similaireCompétences / savoir-faire :1. Maîtriser les outils et méthodes d’analyse de données textuelles (statistiques et fouille de texte).2. Maîtriser le nettoyage, les prétraitements nécessaires à l’exploitation des données textuelles (qualité des données).3. Une connaissance des Large Language Models (LLMs) serait appréciée.Premier organisme de recherche spécialisé au monde en agriculture, alimentation et environnement, INRAE est né le 1er janvier 2020 de de la fusion entre l’INRA et IRSTEA. Nous sommes une communauté de travail de 12 000 personnes, avec plus de 200 unités de recherche et une quarantaine d’unités expérimentales implantées dans 18 centres sur toute la France. Contexte :La recherche évolue et produit un flux d’informations de plus en plus hétérogène et massif. Les sources de données se multiplient et il faut de plus en fouiller dans des textes pour extraire les informations souhaitées. Une exploitation (fouille de données et de textes, data visualisation) combinée de ces données est primordiale pour avoir une vision synthétique et pertinente de la production scientifique, afin d’éclairer l’aide à la décision. Pour répondre à ces enjeux, la DipSO a entamé une montée en compétences en science des données et en analyses statistiques et de données textuelles, dans laquelle s’intègre ce poste.L’ingénieur.e apportera son savoir-faire dans plusieurs projets de production d’analyses stratégiques, à partir de corpus de données hétérogènes, en appui au management scientifique et fonctionnel de l’institut. Dans ce cadre, la personne recrutée sera en interaction avec des professionnels de l’information scientifique (bibliomètres, veilleur.se.s notamment) et des informaticiens (développeur.se.s et data scientists).Mission principaleL’ingénieur.e recruté.e apportera un appui méthodologique et technique au pôle dédié à l’analyse de l’information via un panel d’activités telles que :· Les prétraitements (extraction et homogénéisation du contenu textuel) de différents corpus de données textuelles hétérogènes (sources, formats). Ces prétraitements devront exploiter des outils et méthodes d’analyse de corpus de texte (informations structurées ou non structurées), voire des modèles de langues, en se basant sur un langage de programmation (R, Python...) et des bibliothèques adaptées.· La production d’analyses exploratoires à partir des jeux de données issus de l’étape de prétraitement (analyses statistiques descriptives voire multifactorielles).· Le regroupement de documents sur la base de similarités (classification non supervisée voire supervisée). · Le développement de scripts visant l’automatisation des traitements et analyses relevant du text-mining. Il s’agira d’améliorer des scripts existants ou d’en créer de nouveau, et de tester différentes méthodes.· La rédaction de rapports et contribution au développement d’une bibliothèque de workflows d’analyse (notebooks).4. Être à l’aise avec la programmation (expérience d’outils ; maîtrise du R ou Python obligatoire) ainsi que les outils informatiques dédiés à l’activité à distance.5. Une maîtrise des notebooks serait bienvenue.6. Des connaissances du monde de la recherche et une culture scientifique dans le domaine de l’agronomie, de l’agroécologie et/ou des sciences de l’environnement seraient des plus.Capacités / savoir-être :1. Rigueur, esprit d’analyse et de synthèse2. Capacité à travailler à distance et en réseau3. Proactivité, autonomie appréciée4. Sens du contact/relationnel et capacité de transfert appréciésPour candidaterFaites parvenir un CV et une lettre de motivation détaillée indiquant pourquoi vous postulez sur ce poste et quelles sont vos compétences et vos expériences au regard de l’offre. Après présélection des dossiers, une audition des candidat(e)s retenu(e)s sera organisée à partir de la semaine 11 en visio (date à fixer en fonction de la disponibilité des recruteurs).Face à l’augmentation de la population, au changement climatique, à la raréfaction des ressources et au déclin de la biodiversité, INRAE construit des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources.Pour répondre à ces grands enjeux mondiaux, nous avons besoin de renfort dans nos équipes. Des métiers de la recherche aux métiers de l’appui, l’INRAE recrute à tout niveau de diplôme (du CAP/BEP à Bac+8) ! Rejoignez une communauté engagée et agissez pour l’intérêt général !L’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) est un établissement public de recherche rassemblant une communauté de travail de 12 000 personnes, avec 272 unités de recherche, de service et expérimentales, implantées dans 18 centres sur toute la France. INRAE se positionne parmi les tout premiers leaders mondiaux en sciences agricoles et alimentaires, en sciences du végétal et de l’animal. Ses recherches visent à construire des solutions pour des agricultures multi-performantes, une alimentation de qualité et une gestion durable des ressources et des écosystèmes.