BioLLM
- LLM au service de la biodiversité
LLM au service de la biodiversité
BioLLM vise à développer à mettre en place un modèle d’extraction d’informations des dossiers d’évaluation environnementales à l’aide de LLM (Large Language Model) spécifiquement adaptés à cette tâche. Le prototype de modèle devra extraire les informations jugées pertinentes par une communauté d’acteurs de l’évaluation environnementales pour constituer une base de données de référence consolidée permettant après analyse de rendre compte de l’application de la séquence ERC.
Si ce prototype venait à être efficace, l’approche pourra aisément être étendue et répliquée à d’autres domaines de la filière de l’ingénierie écologique pour lesquels une vaste littérature existe mais de laquelle il est fastidieux et particulièrement chronophage d’en extraire des données exploitables (veille juridique, veille taxonomique, etc.).
Le modèle sera développé et utilisé sur la base de données d’évaluations environnementales constituée par la Communauté Régionale ERC d’Occitanie comprenant à ce plus de 800 documents. Si les performances du modèle sont satisfaisante et qu’une base de donnée pertinente est produite, ces travaux pourront faire l’objet du data paper.
Responsable(s) scientifique(s)
Sylvain- Moulherat
- A-IGEco
- sylvain.moulherat@terroiko.fr