logo entretiens Energies de la mer bandeau entretiens Science et Ethique
M E N U

Année :



Veilles internationales
Informations du 29/03/2024

Energies de la mer
www.energiesdelamer.eu

energiesdelamer.eu vous souhaite un bon week-end de 15 août


2001 : Internet, la substantifique toile : science en jeu et jeu de pouvoirs ? > TR3 : Interconnexion et validation de la connaissance >  Discours de Simon Tillier : Des bases de données scientifiques en perpétuelle évolution : l'exemple du GBIF

Discours de Simon Tillier : Des bases de données scientifiques en perpétuelle évolution : l'exemple du GBIF

Directeur du Laboratoire de systémique moléculaire, Muséum National d'Histoire Naturelle, représentant français du projet mondial des bases de données en réseau sur la biodiversité

Biographie :

TILLIER Simon

Compte rendu :

Transcription :

19 octobre 2001 TR3


Discours de Simon Tillier



Des bases de données scientifiques en perpétuelle évolution : l'exemple du GBIF

Michèle Le Goff :
Internet est un outil qui sert notamment aux scientifiques. Un outil qui permet, entre autres, de connecter, de globaliser les données mises à disposition des scientifiques, dans des bases de données. C'est ce que nous allons évoquer dans un premier temps.

Simon Tillier :
Je vais parler du problème de la gestion et de l’accès à l’information sur la diversité biologique mondiale par le Web. Un organisme international est en train de se constituer, le GBIF (Global Biodiversity Information Facility), traduit en français par “ Système mondial d’information sur la diversité biologique ”. Il s’agit de donner accès directement à toute l’information sur la biodiversité, depuis les données écologiques jusqu’aux séquences d’ADN ou de protéines. L’accès à cette information n’est possible qu’à travers une classification et un système de noms (les noms des espèces). Or ce système n’est pas fixé : on décrit des espèces dans un cadre mouvant depuis Linné. Les théories qui sous-tendent la description des espèces changent parce que la science évolue, et donc aussi le concept des espèces et leur nom. On fournit ce cadre conceptuel à la société et c'est à travers lui qu'elle regarde le vivant, ce qui n'est pas neutre du tout. Ce système changeant a très bien été géré jusque récemment dans le petit monde scientifique parce qu’en gros, entre experts, nous avons nos bibliothèques, nos collections, on se connaît et le fait que la classification change tout le temps nous gêne peu parce qu’en changeant elle devient plus pertinente à nos yeux.



GBIF, Convention de Rio et problème de taxonomie

La question est toute autre et change de dimension à partir du moment où l'on se préoccupe d’environnement, et plus seulement d’utilisation scientifique des noms d’espèces. L’environnement, ce sont les relations de l’homme et de ce qui l’entoure. Dans la nature, on définit l’environnement en partie par des listes d’espèces. Par exemple, quand on parle de directive “ habitat ”, chaque habitat de la directive est défini par une liste d’espèces dans une région. C’est un problème de taxonomie.

Vers une gestion équitable des ressources, en amont du partage des connaissances

Ces problèmes d’environnement sont pris en compte au niveau mondial par la convention de Rio sur la diversité biologique. Elle tente de prendre en compte l’ensemble des problèmes liés à la conservation, à la gestion et à l’utilisation des espèces. Cette convention dit : “ que les États signataires s’engagent à conserver la biodiversité (espèces et assemblages d’espèces) ; que les États s’engagent à gérer durablement les composants de la biodiversité (pour que les espèces ne s’éteignent pas) ; que les bénéfices tirés de l’utilisation de la biodiversité doivent être partagés équitablement ”. La notion de partage équitable et son application ne sont pas très clairs, mais il est admis internationalement que chaque État est responsable de sa biodiversité dont il contrôle les droits d’exploitation. Que sont ces droits ? C'est par exemple la possibilité pour Madagascar de demander des redevances sur l’utilisation des antitumoraux extraits de la pervenche de Madagascar.

Classification des ressources : une question de patrimoine ?

Quand on parle de diversité biologique, pour des raisons historiques, on parle principalement de diversité des espèces, et pas tellement de diversité génétique. Cependant les textes et les annexes de la convention parlent de diversité des gènes, des espèces, des peuplements et des écosystèmes. On envisage toutes les échelles. "Patrimoine génétique", c’est restrictif parce que dans "biodiversité", il y a aussi “ dynamique des écosystèmes". La convention de Rio a adopté officiellement “ l’approche par écosystèmes ” et ce terme, même si personne ne sait très bien ce qu’il veut dire ; traduit au moins la volonté d’une approche qui n’est pas restreinte au seul niveau génétique. Quand on parle de patrimoine génétique, on parle de diversité biologique à une seule échelle.


Ligne de partage Nord-Sud

Sur les questions économiques, il y a toujours opposition entre pays du Nord et pays du Sud. La biodiversité des espèces est concentrée dans les pays du Sud, tandis que la connaissance sur cette diversité, et les possibilités de l'exploiter se trouvent au Nord. Les controverses surviennent vite : qui va tirer les bénéfices économiques de l’exploitation de la diversité biologique des pays du Sud ? C’est une question politique internationale que l’on ne peut pas contourner.

Sens et collections de référence

Dans un premier temps, les pays du Sud ont exigé le rapatriement de tout le matériel biologique que détenaient les pays du Nord, en particulier les collections de référence qui permettent d’identifier “ leurs ” espèces. Très rapidement leurs experts se sont aperçus qu’avec les collections ou les bibliothèques seulement, on ne peut pas faire grande chose. Ce qui est important, c’est l’information sur ces collections et la capacité de la gérer. La question s'est posée du rapatriement de l’information par le Web. Il doit permettre d'avoir accès à l’ensemble de la diversité biologique, de n’importe quel endroit du monde, ou du moins à l’information existante sur le sujet. Bien entendu, dans le même temps on ne doit pas oublier que l’accès au web dans les pays en développement est loin d’être acquis, et que même le maintien d’une ligne téléphonique permanente peut être un problème pour certains des états les plus pauvres de la planète.

Le web : une solution pour l'équité du Nord au Sud

L’OCDE (au sein de laquelle se trouvent les pays riches) a très rapidement formé un consortium, pour construire un système de diffusion de l'information. Il s'agit à la fois de gérer l’information, pour exploiter économiquement les ressources biologiques, et de remplir une obligation morale vis-à-vis des pays du Sud qui ne maîtriseraient pas cette information sur la diversité si on ne la mettait pas en commun. Le GBIF a été créé dans cet esprit : il est le résultat du travail d’un groupe d’experts de l’OCDE. On a déjà tout un tas de bases de données, déjà accessibles sur le Web, dans divers pays et diverses organisations. Elles portent sur des données écologiques, climatiques ou géospatiales, sur les écosystèmes, sur les séquences de gènes etc. S’y ajoutent des bases de données sur la réglementation s’appliquant à la biodiversité, qui relèvent du Centre de Mécanismes d’Echanges (Clearing House Mechanism, CHM) de la convention sur la diversité biologique.

Référence commune et interopérabilité des bases de données : nécessité d'un nouvel outil de classement

L'objectif est de mettre toutes ces bases de données en relation, de façon à ce que l'on dispose d'un coup de clic et partout dans le monde, de la liste des espèces de tel ou tel endroit par exemple. En cliquant sur le nom d’une espèce, on aura l’ensemble de l’information biologique disponible dans les bases de données mondiales.
Une table de référence commune est apparue nécessaire au cœur de ce système, pour consulter simultanément les bases de données écologiques hétérogènes.
Cette table de référence commune, il y a 250 ans que des systématiciens la construisent : c’est la classification biologique Or il se trouve qu'elle n’a pas été formalisée, ni synthétisée en une seule base de données ou en une seule liste. Si incroyable que cela puisse paraître, on estime que l’on a décrit environ un million d’espèces vivantes sans qu'il n’y ait d’annuaire des noms de ces espèces ! Si l'on n'en constitue aucun, en amont de toute vision critique sur l’utilisation que l’on fait de ces noms, on ne peut pas rendre inter-opérables toutes les bases de données sur la diversité biologique.


Recherche scientifique, recherche informatique : des problèmes en partage pour un combat commun

J'interviens personnellement et d'autres avec moi, car au cœur du GIBF, et de cette interopérabilité, nous avons actuellement un problème de systématique face aux bases de données disponibles. Le consortium international qu'est le GBIF doit dresser avant tout un catalogue des organismes connus. Il faut que ces noms d’organismes soient décrits scientifiquement avec leurs synonymes. Ce catalogue doit être relié à celui des spécimens dans les collections des musées afin d’expliciter les noms, de les tester face à la réalité. Il faut donc aussi mettre au point des moteurs de recherche, spécifiquement conçus pour pouvoir consulter toutes ces données de façon conjointe.
Ces outils d’accès et d’interopérabilité sont particulièrement complexes du point de vue informatique, parce que l’ensemble de ces données sont des données floues, incomplètes et imprécises. Mais cela intéresse beaucoup les chercheurs en informatique : c'est véritablement une question de recherche en informatique et non pas seulement de lignes de code.

Ce consortium GBIF s’est constitué avec environ 25 pays membres et son secrétariat international est en train de s’établir à Copenhague. Son budget est de l’ordre de 3 millions de dollars : il est déjà supérieur à celui de la Convention sur la diversité biologique et à celui du programme des Nations Unies pour l’environnement. Cela s'explique par tous les intérêts économiques sous-jacents.


Quelqu'un dans le public :
La problématique n’est donc pas au cœur du réseau, mais dans l'organisation même de cette base de données scientifiques et relationnelles extrêmement complexes ?

Simon Tillier :
On a compris depuis un certain temps que construire une base de données exhaustive au niveau mondial est impossible. Le problème est donc d’arriver à consulter simultanément de très nombreuses bases de données, pour la plupart hétérogènes, du point de vue de leur standard de base de données mais aussi du point de vue de leurs concepts. Cela est une question de recherche en informatique. Les tables, les concepts correspondant aux champs des bases de données ne sont pas forcément strictement recouvrants et il faut quand même que les utilisateurs trouvent l’information pertinente.

Scientifiques, bibliothécaires ou citoyens : vers un protocole d'accès public ?

Jean-Claude Guédon :
Le protocole Z39.50 est un protocole qui a été mis au point par les bibliothécaires pour permettre une interrogation distribuée à travers des bases de données de bibliothèques hétérogènes tout autour du monde. C'est un problème analogue au vôtre. On trouve déjà des millions et des millions de titres, de catégories de documents, interrogeable d’une seule manière par ce protocole.


Quelqu'un dans le public :
Est-ce qu’il est prévu à terme une interface publique du GIBF pour permettre l'accès aux gens qui n’ont pas trop de connaissances en ce domaine ?

Simon Tillier :
Le principe de base du GBIF est que tout est public, et que l’information doit être accessible aux non-scientifiques. Quiconque donne accès à sa base de données ou à une partie de celle-ci par le GBIF s’engage à ce que ses données soient publiques. Cela est fondamental, et c’est un objectif aussi politique Et cette accessibilité pour les non-spécialistes est indispensable. En fait ce sont surtout les décideurs qui ont besoin de cela. Sous quelle forme ? On ne la sait pas encore, mais il est certain que c’est un des aspects importants du GBIF et la diffusion vers le public constitue' l’un des quatre programmes pour nous prioritaires.





Mis à jour le 04 février 2008 à 12:04