Méthodes d'agrégation d'indicateurs
"Tout ce qui est simple est faux et tout ce qui est compliqué est inutilisable" Paul ValéryS'intéresser aux indicateurs de biodiversité montre très vite la complexité du problème, en particulier liée à la dispersion et à l'hétérogénéité des données existantes. Il peut en résulter une multiplication d'indicateurs hétérogènes correspondant chacun à un domaine restreint. Dans un objectif de communication grand public il est indispensable qu'un observatoire ait à coeur d'obtenir des chiffres synthétiques.
Agrégation de tendances d'espèces
L'impact des activités humaines est reconnu comme responsable d'une forte augmentation du nombre d'extinctions d'espèces qui a amené la communauté scientifique à parler de la période actuelle comme la sixième plus grande crise d'extinction qu'ait connu la vie sur la planète. Cependant, le nombre d'extinction est un indicateur très imparfait car a posteriori. La plupart des espèces sont en effet loin de l'extinction mais peuvent néanmoins montrer bien auparavant des signes de déclin, ayant rôle d'alerte. C'est pourquoi des indicateurs de tendance moyenne d'évolution des abondances des espèces ont été construits ces dernières années (Collen 2009).Ils consistent à faire la moyenne des tendances temporelles des abondances pour un grand nombre d'espèces. Les méthodes employées sont variables mais le principe reste globalement le même. Dans le paysage des indicateurs actuels, on peut noter deux exemples : la méthode du Living Planet Index et les indicateurs STOC.
Living Planet Index
Introduction
Le LPI est l'un des 22 indicateurs de la CBD, visant à évaluer l'objectif d'arrêt de l'érosion de la biodiversité en 2010. Cet indicateur a été proposé pour la première fois par le WWF. C'est un indicateur très agrégé, permettant de prendre en compte des données collectées sur des centaines d'espèces, à partir de suivis hétérogènes, inégaux dans le temps et même dans leur fiabilité.Ces données ont pour seules contraintes d'être des séries temporelles réalisées selon un protocole homogène dans le temps, mais les protocoles peuvent être différents d'une espèce à l'autre.
"Les données utilisées dans le calcul de l’Indice Planète Vivante peuvent correspondre aux effectifs totaux d’une population ou à des approximations de la taille d’une population : estimations, mesures de densité, biomasses, nombre de nids… Ces populations peuvent occuper un site précis (étang, rivière, parc naturel) ou une aire géographique plus large (région administrative, pays). Les séries temporelles prises en compte doivent être représentées par au moins deux mesures [...], généralement plus, afin qu’une tendance puisse ainsi être déterminée entre ces points. Pour une même population, les mesures peuvent provenir de sources différentes, à condition que les méthodologies suivies soient similaires. Plantes et invertébrés ne sont pas, pour l’instant, pris en compte car trop peu de séries temporelles sont disponibles." Galewski (2008)
Malgré son niveau d'agrégation, cet indicateur a l'intérêt de pouvoir être désagrégé (géographiquement, par groupe biologique, par habitat etc) dans la limite des données disponibles.
Méthodologie
Il existe deux méthodes pour calculer les tendances spécifiques :- une méthode de proche en proche ("chain method") adaptée par Collen et al. (2009), qui consiste à faire une interpolation log-linéaire de proche en proche des valeurs manquantes à partir uniquement de la valeur précédente et de la valeur suivante.
- une méthode basée sur les Modèles Additifs Généralisés (GAM) qui consiste à ajuster une courbe de lissage aux données. Cette méthode semble plus adaptée aux longues séries de données (> 6 années) et permet de mieux mettre en évidence certaines tendances non linéaires.
Dans les deux cas, les tendances "dt" d'une année à la suivante sont calculées à partir des valeurs prédites (données manquantes interpolées, avec ou sans lissage selon la méthode) sur toute la durée de chaque série temporelle. Chaque valeur dt est le logarithme du rapport entre l'effectif à l'année n et l'effectif à l'année n-1. Ces tendances interannuelles sont ensuite moyennées pour chaque espèce, ce qui donne une tendance moyenne par espèce sur la période considérée. Si une espèce possède plusieurs séries temporelles chevauchantes, les tendances interannuelles dt sont calculées séparément sur les différentes séries, mais toutes sont incluses dans la moyenne finale avec un poids identique (ce qui peut poser certains problèmes lorsqu'une population est beaucoup moins représentative qu'une autre).
Un indice de tendance i est obtenu pour chaque espèce. L'agrégation consiste à faire la moyenne géométrique de ces indices sur l'ensemble d'espèces considéré.
L'intervalle de confiance de l'indicateur au cours du temps peut être calculé par bootstrap.
Contraintes et biais possibles
Les principaux critères de qualité des données sont les suivants :- longueur des séries temporelles
- quantité de lacunes dans les séries (données non interpolées)
- nombre de séries temporelles (d'espèces suivies) à aggréger
- pérennité des suivis et homogénéité dans le temps
Les biais les plus fréquents sont les suivants:
- qualité des données (origine)
- représentativité de la population mesurée par rapport à l'ensemble de la population
- changements dans la nature des données au cours du temps (changements de protocoles, arrêt des suivis sur certains groupes, apparition de nouveaux groupes).
Ce dernier risque de biais est d'autant plus fort que le nombre d'espèces suivies est faible. Il faut donc rester extrêmement prudent quant à l'interprétation des changements observés de ce type d'indicateur aggrégé dans une application à l'échelle d'une région (peu d'espèces), et être particulièrement strict sur la sélection des données au départ (garantie de pérennité des suivis et de compatibilité des protocoles si changement). Un changement soudain dans les sources de données, qui conduirait à remettre en question les tendances globales déjà publiées, pourrait en effet décrédibiliser l'indicateur et l'observatoire.
Applications locales
Le LPI a été appliqué par la Tour du Valat à l'ensemble des zones humides méditerranéenne, ainsi qu'à la Camargue (Galewski, 2008).
Indicateurs STOC
Les indicateurs STOC sont basés sur une méthodologie analogue, avec un indice national qui peut être désagrégé par groupes d'espèces (forestières, agricoles, urbaines, généralistes).Indicateurs d'intégrité à agrégation pyramidale
Principe général
L’Alberta Biodiversity Monitoring Institute propose un type d’indicateur original appelé « intactness », représentant l’écart à un état de référence excluant l’empreinte humaine par modélisation. Cette méthodologie est appliquée pour différents niveaux de biodiversité (groupes d’espèces, habitats, paysage) et agrégée selon une logique pyramidale. Des indicateurs de pressions humaines sont également proposés, selon la même logique pyramidale. L'ensemble de ces indicateurs repose sur un monitoring systématique des espèces, habitats (structure, paysage), et de l'occupation humaine à l'échelle de l'Alberta.Définition des indicateurs d'intégrité ("intactness")
Pour les indicateurs spécifiques, les indices fournis représentent l'écart des abondances observées à un état de référence "en l'absence de l'homme" extrapolé à partir d'une modélisation des dites abondances en fonction d'un ensemble de variables relatives à l'agriculture, la foresterie, l'extraction pétrolière, l'urbanisation et les infrastructures. Ces indices sont progressivement agrégés par guildes, groupes taxonomiques, etc. La pyramide des indicateurs spécifiques comprend 6 niveaux et aboutit à un indicateur synthétique global.Les indicateurs d'habitat suivent la même logique mais sont basés sur des variables différentes (structure forestière et surfaces de différents types d'occupation du sol).
Pyramide des indicateurs spécifiques
Voir également Biggs et al. (2004) pour une utilisation d'indicateurs d'intégrité en Afrique du Sud.
Regard critique sur le concept d'intégrité
Cette méthode repose sur l'hypothèse que l'extrapolation d'un état de référence sans l'homme est possible à partir des données actuelles, et rend difficile l'attribution des fluctuations observées de l'indice à l'homme ou à des fluctuations naturelles. Plus problématique, cette méthode repose :- sur une certaine idée de la naturalité (l'état sans l'homme étant implicitement ce qu'il y a de mieux, ce qui, dans le contexte méditerranéen, serait inapproprié)
- sur l'existence d'une sorte d'état d'équilibre.
A ces remarques s'ajoute la question des possibilités d'interpréter les indicateurs ayant un fort niveau d'agrégation.
Les indicateurs de pression humaine ne sont pas soumis au concept d'intégrité, mais sont également structurés de manière pyramidale, ce qui pose les mêmes problèmes d'interprétation pour les niveaux les plus agrégés :
Tableau des indicateurs de pression humaine
Enfin, il faut bien noter que ce type d'organisation pyramidale de l'information au sein d'un observatoire est totalement dépendant de la mise en place d'un monitoring systématique de la biodiversité dédié et adapté à cette fin dès la conception. Il serait évidemment impossible d'aboutir à un tel résultat en ne se basant que sur les suivis hétérogènes disponibles.
