DE LA BIODIVERSITÉM ESURES Eric Marcon 05/03/2013 1 REMERCIEMENTS Je remercie François Morneau pour sa relecture attentive de la première version de ce document et sa contribution décisive pour la bonne utilisation de R dans les exemples. Bruno Hérault et Chris Baraloto ont contribué à la revue de la littérature de façon significative. Les opinions émises par les auteurs sont personnelles et n’engagent pas l’UMR EcoFoG ou ses tutelles. MESURES DE LA BIODIVERSITÉ Entropie : introduction ......................... 33 Sommaire Remerciements ................................... 2 Notations ............................................. 5 Notions de diversité ............................. 7 Composantes ....................................... 7 Richesse Équitabilité Régularité et divergence Diversité 𝛼, 𝛽 et 𝛾 Décomposition 7 8 8 Définition de l’entropie Entropie relative Entropie et biodiversité : historique Logarithmes déformés Entropie et diversité Biais d’échantillonnage Profils de diversité Définition Biais d’échantillonnage 33 34 35 36 37 38 39 39 39 Entropie HCDT ................................... 36 Indice de Hurlbert ............................... 39 Niveaux de l’étude ................................ 9 9 10 Équitabilité .......................................... 40 SAD et SAR........................................ 10 Mesures neutres de la diversité 𝛼 ou 𝛾 .......................................................... 13 Mesures fondées sur les relations aireespèces .............................................. 13 Indice 𝛼 de Fisher Synthèse Influence de la structure spatiale Taux de couverture 14 16 18 19 20 20 La relation d’Arrhenius Le modèle de Gleason Diversité 𝛽 et décomposition ............. 43 Le débat sur la décomposition ............ 44 Définitions de la diversité 𝛽 ................. 43 Décomposition multiplicative de la diversité .............................................. 45 L’indice de chevauchement 𝐶𝑞𝑁 ......... 45 Biais d’échantillonnage Tests 46 46 Décomposition de l’indice de Shannon 45 Décomposition de l’entropie généralisée ........................................................... 47 Décomposition du nombre d’espèces . 49 Décomposition de l’indice de GiniSimpson.............................................. 50 Synthèse............................................. 50 Le partitionnement de la diversité selon Pélissier et Couteron........................... 51 Cadre Décomposition 51 52 Richesse spécifique............................ 21 Techniques d’estimation non paramétrique 21 Inférence du nombre d’espèces à partir de la SAD 26 Inférence du nombre d’espèces à partir de courbes d’accumulation 27 Combien y a-t-il d’espèces différentes sur Terre ? 28 Indice de Simpson .............................. 29 Définition Biais d’échantillonnage 29 30 Diversité fonctionnelle et phylogénétique .......................................................... 53 Cadre .................................................. 53 Dissimilarité et distance Distance phylogénétique Distance fonctionnelle Équivalence des deux diversités 53 54 54 55 Indice de Shannon.............................. 30 Définition Biais d’échantillonnage 30 31 3 ................. 61 Mesures d’entropie phylogénétique ........................................Typologie des mesures Biais d’échantillonnage 55 56 FD et PD ................................. 56 Indice de Rao .................... 65 Conclusion ........................................ 60 Hp et I1.................. 61 Généralisation de l’entropie HCDT Biais d’échantillonnage Entropie et diversité Décomposition Arbres non ultramétriques 61 62 62 63 64 Régularité ............. 67 Bibliographie ...................... 69 4 ................................... 56 Principe Calcul sous R Maximum théorique Décomposition Alternatives 56 57 57 59 60 FAD et MFAD............................................................ ∑𝑛 𝜈=1 𝜋𝜈 =1. 𝐼 (𝑝𝑠 ) : l’information apportée par l’observation d’un évènement de probabilité 𝑝𝑆 . nombre équivalent de communautés pour la diversité 𝛽 . : le nombre d’espèces. la probabilité est notée 𝜋𝑛𝑠 . mais restreinte aux individus de l’espèce 𝑠. une variable aléatoire. 𝒫 = {𝑝1 . Souvent. selon le contexte. avec les 𝜈 mêmes notations que ci-dessus. 𝐴 𝑆 est le nombre d’espèces non rencontrées dans la surface 𝐴. observées 𝜈 fois dans l’échantillonnage. 𝑝𝑠 ) est le gain d’information apporté par l’expérience (𝑞𝑠 est observé) par rapport aux probabilités 𝑝𝑠 attendues. 𝐷 𝐻 : l’entropie de Tsallis (ou HCDT). Dans la mesure du possible. 𝑝𝑠 . : le nombre d’espèces observées. un nombre d’individus aléatoire (résultat d’un processus stochastique) devrait être noté 𝑁 et son estimateur � . 𝑛 𝑆 est le nombre d’espèces vues 𝜈 fois dans un échantillon de taille 𝑛. 𝑝𝑠𝑖 est la même probabilité dans la communauté i. considéré comme une variable aléatoire. 𝑞 𝑖𝐷𝛼 est la diversité 𝛼 mesurée dans la communauté i. 5 𝜈 𝑛𝑠 . Les effectifs totaux sont 𝑛𝑠+ (pour l’espèce s). 𝐻 𝜋𝜈 : la probabilité qu’une espèce choisie au hasard soit représentée par 𝜈 individus. 𝑝𝑆 } : la distribution des probabilités 𝑝𝑠 . sa surface. 𝑁 : le nombre (aléatoire) d’individus se trouvant dans l’aire d’étude. l’échantillon n’est pas précisé et peut être aussi bien un nombre 𝜈 2 d’individus qu’une surface. 𝑛 𝑠 peut être 𝜈 considéré comme une réalisation de 𝑛 𝑆. l’exposant est omis pour les espèces présentes : >0 𝐴𝑆 est noté 𝐴𝑆. 𝐴 : l’aire d’étude. 𝑛𝑠𝑖 est le nombre d’individus de l’espèce 𝑠 dans la communauté 𝑖 . estimé par le � . Si l’espèce est choisie explicitement. 𝔼(𝑋) : l’espérance de la variable aléatoire 𝑋. la littérature écologique n’est pas très rigoureuse sur la distinction de ce qui est un paramètre. 𝑆 : le nombre d’espèces. 𝑛+𝑖 pour la communauté 𝑖 et 𝑛 le total général. Les communautés sont indexées par 𝑖 . 𝐼 (𝑞𝑠 . au carré. le nombre d’individus par espèce est 𝑛𝑠 . Si l’indice n’est pas noté. paramètre choisi dans le cadre du protocole d’échantillonnage. L’indice est la taille de l’échantillon : 𝐴𝑆 pour la surface 𝐴 ou 𝑛𝑆 0 pour un échantillon de 𝑛 individus. 𝑞 𝐷 : la diversité vraie (nombre de Hill pour les diversités 𝛼 et 𝛾). S’il n’y a qu’une communauté. estimé par 𝑆 𝜈 𝑛𝑆 𝑝𝑠 : la probabilité qu’un individu tiré au hasard appartienne à l’espèce s. 𝑝2 . Son estimateur. 𝑁𝑠 est la même variable nombre observé 𝑁 aléatoire. le nombre d’individus échantillonnés (choisi) devrait être noté 𝑛. 𝐼 : le nombre de communautés qui constituent une partition de la méta-communauté dans le cadre de la décomposition de la diversité. 𝑞 𝑛 : le nombre d’individus échantillonnés. considéré comme ̂.NOTATIONS Les notations peuvent différer de celles de la littérature citée pour l’homogénéité de ce document. té i. 𝑞 𝑖𝐻𝛼 est l’entropie 𝛼 mesurée dans la communau𝑞 � (𝑇) est l’entropie phylogénétique. La confusion est fréquente dans la formu𝑁 lation des mesures de diversité et leurs estimateurs. une variable aléatoire ou son estimation. Par exemple. 𝑝̂𝑠 est la fréquence observée. … . 𝑞 � (𝑇) est la diversité phylogénétique. s’il n’y a pas d’ambiguïté. Pour alléger les notations. … . L’exposant est le nombre de fois où l’espèce est détectée : par exemple 1𝑆 ou >0𝑆. et. des notations plus rigoureuses que les originales sont utilisées ici. classi- quement 1.𝑡𝑛 1−𝛼⁄2 : le quantile d’une loi de Student à 𝑛 degrés de liberté au seuil de risque 𝛼. 6 .96 pour 𝑛 grand et 𝛼 = 5%. Composantes Une communauté comprenant beaucoup d’espèces mais avec une espèce dominante n’est pas perçue intuitivement comme plus diverse qu’une communauté avec moins d’espèces.gf/spip. On gardera toujours à l’esprit que la prise en compte de la diversité spécifique n’est pas la seule approche. par exemple le nombre d’espèces d’arbres dans une forêt.php?article427 L’indice de richesse le plus simple et le plus utilisé est tout simplement le nombre d’espèces 𝑆 ou son logarithme ln𝑆. Un certain nombre d’hypothèses sont assumées plus ou moins explicitement : ● ● Les classes sont bien connues : compter le nombre d’espèces a peu de sens si la taxonomie n’est pas bien établie.NOTIONS DE DIVERSITÉ Le terme biodiversité concerne le plus souvent la diversité en termes d’espèces d’un écosystème. 7 . 1965). essentiellement avec le package entropart (Marcon et Hérault. 2013). Les classes sont équidistantes : la richesse augmente d’une unité quand on rajoute une espèce. (2000) pour une revue sur cette question. Richesse La richesse est le nombre (ou une fonction croissante du nombre) de classes différentes présentes dans le système étudié.ecofog. L’ensemble du code est disponible sur le site web 1 où se trouvent les mises à jour de ce document. Figure 1 : Importances de la richesse (en haut) et de l’équitabilité (en bas) pour la définition de la diversité 1 http://www. est nécessaire (Whittaker. pas son importance en tant que telle. On peut bien évidemment s’intéresser à d’autres niveaux et d’autres objets. même si le texte se s’y réfère le plus souvent. mais dont les effectifs sont proche (Figure 1. que cette espèce soit proche des précédentes ou extrêmement originale. Les calculs nécessaires sont réalisés dans R (R Development Core Team. colonne de gauche). La prise en compte de deux composantes de la diversité. par exemple la diversité génétique (en termes d’allèles différents pour certains gènes ou marqueurs) à l’intérieur d’une population ou à l’opposé la diversité des écosystèmes. L’objectif de ce document est de traiter la mesure de la biodiversité. C’est parfois une difficulté majeure quand on travaille sur les microorganismes. appelées richesse et équitabilité. On se référera par exemple à Chapin et al. submitted-a). . evenness ou equitability en Anglais) est un élément important de la diversité. (a) Le nombre d’espèces de vers de terre augmente en fonction de la surface échantillonnée. La plupart des indices courants. Régularité et divergence Les mesures classiques de la diversité ne prennent pas en compte une quelconque distance entre classes. (b) Nombre d’espèces d’oiseaux en fonction de la latitude. la présence d’espèces très dominantes entraîne mathématiquement la rareté de certaines autres : on comprend donc assez intuitivement que le maximum de diversité sera atteint quand les espèces auront une répartition très régulière. Un indice d’équitabilité est indépendant du nombre d’espèces (donc de la richesse). de 100 m2 à plus de 500 000 km2 selon la relation d’Arrhenius (voir page 16). comme ceux de Simpson ou de Shannon. À nombre d’espèces égal. 2007 . (e) Nombre d’espèces de végétaux ligneux en fonction des précipitations en Afrique du Sud. Pavoine et Bonsall. 8 . (d) Nombre d’espèces de chauves-souris en fonction de l’altitude dans une réserve au Pérou. Une espèce représentée abondamment ou par un seul individu n’apporte pas la même contribution à l’écosystème. Pourtant. 2000. Les mesures de diversité phylogénétique et de diversité fonctionnelle prennent en compte cette notion. figure 1). 2011). deux espèces du même genre sont de toute évidence plus proches que deux espèces de familles différentes. Équitabilité La régularité de la distribution des espèces (équitabilité en Français. évaluent à la fois la richesse et l’équitabilité. Ricotta.Mesures de la biodiversité Figure 2 : Patrons de biodiversité (Gaston. qui nécessite quelques définitions supplémentaires (Mouillot et al. (c) Relation entre la richesse régionale et la richesse locale. 2005 . Elle est généralement plus faible sur les îles. Plus précisément. avec ou sans pondération par la fréquence. nommés 𝛼. Diversité 𝛼 . 2001). Les mesures de régularité décrivent la façon dont les espèces occupent l’espace des niches. 320). la richesse spécifique diminue avec la latitude (la diversité est plus grande dans les zones tropicales. source de migrations. quand on se rapproche de l’équateur). De façon générale (Gaston. évaluée par la richesse spécifique. La richesse diminue avec l’altitude. il s’agit de la diversité dans un habitat uniforme de taille fixe. page 53). mesurée à l’intérieur d’un système délimité. la diversité 𝛾 est similaire à la diversité 𝛼. 2001). voir Figure 2. Ce concept est équivalent à celui d’équitabilité dans les mesures classiques. Les mesures de divergence sont construites à partir de la dissimilarité entre les classes. Les diversités 𝛼 et 𝛾 se mesurent donc de la même façon. et au sein de celles-ci. mais parfois une mesure qui n’a pas toutes les propriétés d’une distance : une dissimilarité (voir Dissimilarité et distance. p. Enfin. 9 . prise en compte sur l’ensemble du système étudié. La diversité 𝛽 est le taux de remplacement des espèces le long d’un gradient (topographique ou d’habitats par exemple). évaluée par le nombre d’espèces nouvelles rencontrées dans chaque nouvel habitat (figure issue de Morin et Findlay. 2000). L’habitat B possède la plus grande richesse (figure issue de Morin et Findlay. La diversité est classiquement estimée à plusieurs niveaux emboîtés. qui a nommé 𝛼 la diversité locale qu’il mesurait avec l’indice 𝛼 de Fisher (voir page 14) et a utilisé les lettres suivantes selon ses besoins. Figure 4 : Diversité 𝜷. où elle décroît avec la distance au continent. Niveaux de l’étude Figure 3 : Diversité 𝜶. 𝛽 et 𝛾 La diversité 𝛼 est la diversité locale.Notions de diversité La mesure de la différence entre deux classes est souvent une distance. 𝛽 et 𝛾 par Whittaker (1960. Seuls les trois niveaux originaux ont été conservés par la littérature. La distribution de l’abondance des espèces (SAD) est la loi qui donne l’abondance attendue de chaque espèce d’une communauté. Elle peut être représentée sous la forme d’un histogramme Nous appellerons communauté le niveau de découpage concernant la diversité 𝛼 et méta10 . décomposable en la somme (ou le produit) convenablement pondérée de toutes les diversités 𝛼 des habitats (diversité intra) et de la diversité 𝛽 interhabitat. Décomposition Whittaker (1977) a proposé sans succès une normalisation des échelles d’évaluation de la biodiversité. Figure 6 : Diagramme rang-abondance (diagramme de Whittaker) correspondant au diagramme de Preston de la Figure 5. le nombre d’espèces. page 15) quand l’effort d’échantillonnage est mesuré de cette façon.. Il est donc important de définir une mesure qui ne dépende pas de ce découpage.Mesures de la biodiversité 50 Nb Espèces 40 30 20 ln Ns 0 10 0 2 4 ln Ns 6 8 1 0 5 10 50 100 500 50 100 Rang 150 200 Figure 5 : Histogramme des fréquences (diagramme de Preston) des arbres du dispositif de Barro Colorado Island (Hubbell et al. sans définition stricte des échelles d’observation. Elle est la base de certaines mesures de diversité. La distinction entre les diversités 𝛼 et 𝛽 dépend de la finesse de la définition de l’habitat. Les points sont les données. donc une mesure additive (ou multiplicative) décrivant la diversité totale. la courbe est l’ajustement d’une distribution lognormale. le nombre d’arbres de chaque espèce (en logarithme). mais par le nombre d’individus leur appartenant. communauté le niveau de regroupement pour l’estimation de la diversité 𝛾. SAD et SAR La courbe aire-espèces (SAR : Species Area Relationship) représente le nombre d’espèces observées en fonction de la surface échantillonnée (exemple : Figure 10. Les espèces ne sont pas identifiées individuellement. en ordonnée. La SAR est parfois remplacée par une courbe nombre d’individus-espèces (Figure 8. en introduisant la diversité régionale 𝜀 (𝛾 étant réservé au paysage et 𝛼 à l’habitat) et la diversité 𝛿 entre les paysages. page 16). 2005). La distinction de nombreux habitats diminue la diversité 𝛼 au profit de la 𝛽 . En abscisse. mean(log(Ns)). Figure 5 2) ou bien d’un diagramme rangabondance (RAC : Rank Abundance Curve. decr = TRUE) > N <. Le RAC est souvent utilisé pour reconnaître des distributions connues. 1948). Ns. lwd=3) 11 . xlab = "Rang".sum(Ns) > hist(log(Ns). sd(log(Ns)))) > lines(ranks. ylab="Nb Espèces") 3 Code complémentaire pour le diagramme de Whittaker : > S=length(Ns) > plot(Ns.sort(colSums(BCI).lognormal <.Notions de diversité des fréquences (diagramme de Preston. main = NULL . 2 Le code R nécessaire pour réaliser les figures est: > library(vegan) > data(BCI) > Ns <. le modèle Broken Stick de MacArthur (1957). type = "b". main = NULL. col="red".S*(1pnorm(log(Ns).) ou diagramme de Whittaker.lognormal. Les SAD ne sont pas traitées en détail ici : on se reportera à Magurran (1988). (2007) et Izsák et Pavoine (2012). ylab = expression(ln(N[s]))) > ranks. Les SAD nécessaires à la compréhension de la suite sont : ● ● ● La distribution en log-séries de Fisher (1943) La distribution log-normale (Preston. Izsák et Pavoine (2012) ont étudié les propriétés des RAC pour les principales SAD. xlab = expression(ln(N[s])). McGill et al. Figure 6 3. log = "y". . Une revue sur la façon d’obtenir une SAR est fournie par Scheiner (2003). celles fondées sur les relations aire-espèces. L’expérience montre que l’augmentation de l’aire d’échantillonnage Figure 7 : Courbes d’accumulation et de raréfaction. Les mesures présentées ici sont les plus utilisées : dans un premier temps. 2001). et nombre d’espèces augmente tant que la surface échantillonnée croît (Williamson et al. L’aire minimale est la surface nécessaire à échantillonner pour caractériser une association végétale. obtenues par inventaires individuels ou groupés (« samples »). En forêt tropicale. Shannon. n’est pas la solution adaptée. Les mesures sont qualifiées de neutres au sens où elle ne prennent en compte aucune caractéristique propre des espèces. au sens où la probabilité de ne pas les rencontrer à l’occasion d’un échantillonnage d’une certaine taille n’est pas négligeable. il existe de nombreuses espèces rares. Les courbes de raréfaction permettent de lisser les courbes d’accumulation. mais un nombre dépendant de la surface d’échantillonnage. sans que certaines soient plus ou moins semblables. page 16). Mesures fondées sur les relations aire-espèces En forêt tempérée. Ils suggèrent notamment de calculer la courbe de raréfaction (Figure 7) plutôt que d’utiliser la courbe d’accumulation obtenue en traçant simplement le nombre d’espèces découvert en fonction de l’effort d’échantillonnage. 2003). toutes les espèces d’un habitat sont rencontrées sur une surface inférieure à l’hectare. Fig. même en échantillonnant des surfaces considérables (50 hectares pour la Figure 12. Il ne s’agit donc pas d’estimer un nombre d’espèce asymptotique pour une communauté. Ces dernières sont sujettes à des biais d’échantillonnage (Mouillot et Leprêtre. Gotelli et Colwell (2001) proposent une revue des problèmes les plus communément rencontrés dans l’estimation et la comparaison de la richesse spécifique. les classes seront des espèces. 2001). au-delà du million de km2 pour la Figure 10. Elle est de l’ordre de 200 m2 en Europe (Chytrý et Otýpková. dans l’approche est de la phytosociologie fondée par Braun-Blanquet (1928) : elle ne contient pas toutes les espèces mais un sousensemble caractéristique. la SAR ne tend pas vers une asymptote. Simpson).. dont l’indice 𝛼 de Fisher.MESURES NEUTRES DE LA DIVERSITÉ 𝛼 OU 𝛾 Les mesures classiques considèrent que chaque classe d’objets est différente de toutes les autres. puisqu’on rencontre toujours de nouvelles espèces (Gotelli et Colwell. La courbe de raréfaction est obtenue en souséchantillonnant dans l’inventaire complet des effectifs de toutes tailles et en calculant 13 . L’entropie HCDT permet d’unifier ces mesures et les nombres de Hill de leur donner un sens intuitif. Dans ce chapitre. 1999) : la correction de ces biais est traitée en détail. 1). 2001. Les courbes obtenues par inventaire groupé sont en général en dessous des courbes individuelles à cause de l’agrégation spatiale (Gotelli et Colwell. puis les trois mesures d’entropie (richesse. Dans le cas général. le nombre fondamental de la biodiversité de Hubbel (2001) quand le nombre d’espèces est grand (Alonso et McKane. pages 204-205). mais un « pseudoRAC » (Izsák et Pavoine. à l’intérieur du même habitat. 1976 . Fisher (Fisher et al. La probabilité 𝜋𝑛𝑠 d’observer 𝑛𝑠 individus d’une espèce donnée est donc la moyenne sur toutes les valeurs possibles de 𝜆 de la +∞ 𝜆𝑛𝑠 𝑒 −𝜆 𝑛𝑠 ! 𝛼 est un indicateur de la biodiversité qui peut être interprété comme le nombre d’espèces nouvelles découvertes quand le nombre d’individus échantillonnés est multiplié par 𝑒 : c’est en effet la pente de la courbe de 𝑆 en fonction de ln𝑛. Deux cas sont traités largement dans la littérature : l’indice de Fisher pour une SAD en log-séries et la relation d’Arrhenius (loi de puissance) pour une SAD log-normale. démontrée par Pielou (1969. ce qui permet de lisser la courbe. la relation de l’équation (1) est équivalente à une courbe aire-espèces (SAR). Kempton (Kempton et Taylor.alpha de la librairie vegan 𝑓(𝜆)𝑑𝜆 . Kempton et Wedderburn. Les probabilités 𝑝𝑠 suivent toutes la même loi. 1978) a montré qu’il était identique à sa statistique 𝑄 . 2007) contient la fonction fishers. Lorsque l’inventaire est fait par quadrats ou toute autre méthode qui regroupe les individus (pièges à insectes. le nombre d’espèces échantillonnées pour 𝑛 individus est calculable (pour 𝑛 suffisamment grand) et ne dépend que d’un paramètre 𝛼 estimé à partir des données. qui se stabilise à partir d’une valeur de 𝑛 suffisante. filets de pêche…). 2012) et la distribution de 𝜋𝑛𝑠 est une pseudo-SAD. C’est une conséquence directe de l’indépendance entre les échantillons. 2001). ce qui implique que 𝜋𝑛𝑠 suit une loi binomiale négative de paramètre 𝑘. distribution « bien connue » selon Fisher. 1943) a relié le nombre d’espèces 𝑆𝑛 au nombre d’individus 𝑛 échantillonnés à partir du modèle suivant : ● Indice 𝛼 de Fisher 𝑛 𝑆𝑛 = 𝛼ln(1 + ) 𝛼 (1) ● ● ● La distribution de 𝜆 retenue par Fisher est une loi gamma. Dans R. les courbes montrent moins d’espèces pour le même effort d’échantillonnage à cause de l’agrégation spatiale des espèces. La courbe représentant 𝑛𝑠 en fonction de son rang n’est pas un vrai diagramme rang-abondance. Il suit une loi de Poisson d’espérance 𝑛𝑝𝑠 . l’espérance du nombre d’individus échantillonnés dans l’espèce 𝑠 est 𝑛𝑝𝑠 . Si le nombre d’individus est proportionnel à la surface (saturation de Hubbell. Dans ce cas.alpha. Le problème est donc bien la prise en compte des espèces rares. et retient cette propriété pour la suite de son raisonnement.Mesures de la biodiversité le nombre moyen d’espèces trouvé pour chacun.. 14 loi de Poisson : 𝜋𝑛𝑠 = ∫0 Étant donné la taille de l’échantillon 𝑛 et la probabilité 𝑝𝑠 d’échantillonner l’espèce 𝑠. Le nombre d’individus réellement observé fluctue aléatoirement. la librairie untb (Hankin. La densité de probabilité de 𝑛𝑝𝑠 est notée 𝑓 (𝜆). Le modèle est donc applicable pour un grand nombre d’observations et un grand nombre d’espèces. où 𝜆 = 𝑛𝑝𝑠 permet d’alléger l’écriture. Alors : On notera que la distribution de 𝜋𝑛𝑠 n’est pas celle de 𝑝𝑠 . problème traité plus loin. 2004) : la SAD de la métacommunauté (pas celle de la communauté locale si la dispersion est limitée) du modèle neutre est en log-séries. En appliquant son modèle à des données. ce qui correspond à une distribution comprenant de nombreuses espèces et un pseudo-RAC décroissant rapidement. La fonction fisher. et après calcul. Il s’agit dans un premier temps de mesurer la diversité 𝛼 . et non d’augmenter la surface échantillonnée le long d’un gradient d’habitats (diversité 𝛽 ). Fisher remarque que 𝑘 → 0. 𝛼 est aussi égal à 𝜃. dont les individus sont distribués indépendamment. α est fixé à 100 pour toutes les courbes. différente selon les sites. (2005) ont étendu le modèle de Fisher pour prendre en compte un nombre d’espèces fini 𝑆𝑚𝑎𝑥 et une distribution non indépendante des individus. où 𝑞 = 1−𝑒 (𝑐−𝑐𝑆𝑚𝑎𝑥 )⁄𝛼 𝑒 𝑐⁄𝛼 −1 Schulte et al.length(Ns)) [1] 35. 2005) (Oksanen et al.. Si le nombre d’observations est grand. 𝑆𝑛 = 𝛼 1 + 𝑛𝑐 𝑞 ln � � 𝑐 1 + 𝑛𝑐 𝑞𝑒 (−𝑐𝑆𝑚𝑎𝑥)⁄𝛼 (2) Appliqué à des données réelles (Figure 9). seuls S et N ( ≥𝟏 𝒏𝒔 et 𝒏 dans nos notations) sont observés. L’approximation du nombre d’espèces infini paraît être la plus pénalisante parce qu’elle exclut l’inflexion de la courbe pour les grandes valeurs de 𝑁. . même si ces valeurs sont rarement atteinte dans les faits (𝑒 10 > 20 000). le modèle de Fisher étendu s’ajuste forcément mieux (il possède trois paramètres au lieu d’un). > Ns <. (a) et (c) : le nombre d’espèces n’est évidemment pas infini.05476 > library(untb) > fishers. ce qui invalide les comparaisons inter-sites. 2012) estime 𝛼 selon Kempton et Taylor (1974) > library(vegan) > data(BCI) > # Ns est un vecteur contenant les effectifs de chaque espèce.05477 Si 𝑆𝑚𝑎𝑥 = ∞ et 𝑐 = 1. l’équation (2) se simplifie pour retrouver l’équation (1).alpha(sum(Ns). En pratique. prise en compte par un paramètre d’agrégation spatiale c valable pour toutes les espèces.Mesures neutres de la diversité 𝛼 ou 𝛾 Figure 8 : Courbes nombre d’individus-espèces.simulées pour illustrer l’importance des paramètres 𝒄 (concentration spatiale) et 𝑺𝒎𝒂𝒙 (nombre total d’espèces) dans le modèle de Fisher.alpha(Ns) [1] 35. (in Schulte et al.. α est sous-estimé. (a) et (b) : la concentration spatiale (𝒄 < 𝟏) change drastiquement le nombre d’espèces attendu. ce qui change fortement la forme de la courbe.colSums(BCI) > fisher. Si 𝒄 est supposé égal à 1 par erreur. 15 Leurs résultats (Figure 8) montrent que la non prise en compte de ces deux paramètres aboutit à une sous-estimation systématique de 𝛼. α sera aussi très sous-estimé. 16 . Figure 9 : Comparaison entre le modèle de Fisher et le modèle étendu dans trois parcelles forestières connues. Les courbes légendées Equation 4 correspondent au modèle de Fisher étendu. Les modèles sont ajustés aux données observées par Condit et al. mais avec une certaine variabilité que les auteurs relient à l’échelle spatiale. 1). Figure 10 : Logarithme du nombre d’espèces en fonction du logarithme de la surface échantillonnée (Williamson et al.25 (à partir de données empiriques. (in Schulte et al. 1975 .27.Mesures de la biodiversité Enfin. pas par nécessité théorique). supposant le nombre total d’espèces infini. Jost (2007) montre par un exemple que des interprétations absurdes de l’indice peuvent être faites si l’hypothèse n’est pas respectée..2 et 0. dit loi de puissance : 𝐴𝑆 𝐴 est la surface. La valeur de 𝒛 est 0. ̂ = 𝑐𝐴𝑧 (3) Preston (1962) a montré que si la SAD est log-normale. Les données sont des relevés d’espèces natives sur 104 sites de taille variable à travers le monde. équation (2). l’indice de Fisher repose lourdement sur l’hypothèse que la distribution réelle des espèces est conforme au modèle. Une large méta-analyse conduite par Drakare et al. et a établi que la puissance 𝑧 valait environ 0. alors que l’Equation 5 est le modèle intermédiaire. comme la méta-analyse de la Figure 10.. réserves ou non) sans intérêt ici.3. un facteur d’échelle dépendant de la richesse de l’habitat. 2001. la SAR suit une loi de puissance. fig. La relation d’Arrhenius Arrhenius (1921) a établi le modèle de base. Données de Lonsdale (1999). 𝐴𝑆 est le nombre d’espèces dans 𝐴. Les symboles correspondent à divers types d’habitats (îles ou continent. May et Stumpf.27. (1996). (2006) à partir de 794 SAR d’origine très différentes fournit une moyenne de 0. 2005) Le paramètre le plus variable de la loi de puissance reste donc 𝑐 . au type d’organismes et aux habitats échantillonnés. Les résultats empiriques ultérieurs (May. 2000) ont fourni des valeurs généralement comprises entre 0. 𝑐 et 𝑧 des paramètres. mais aussi à la technique d’échantillonnage. dérivé de la théorie des fractales. toutes déterminées correctement sur le plan botanique et dans lesquels chaque arbre est positionné). Figure 11. l’habitat est dit auto-similaire : l’augmentation du nombre d’espèces ne dépend pas de l’échelle 17 . La loi lognormale est représentée par le trapèze sur la figure a. Figure 12 : Courbes aire-espèces (a) et Paramètre de persistance en fonction de la surface (b) dans 5 forêts tropicales (Plotkin et al. Chaque dispositif mesure 50 ha et toutes les tiges de diamètre supérieur à 1 cm sont cartographiées et déterminées. (1999) ont montré que la loi de puissance était équivalente au modèle d’autosimilarité. 2000). pour une gamme de valeurs de la constante. On définit enfin 𝑎𝑖 = 𝐴𝑖−1𝑆� 𝐴𝑖 𝑆 le facteur de diminution du nombre d’espèces (dit paramètre de persistance) lié à la division par 2 de la taille du rectangle. Ils montrent que le modèle log-normal rend mal compte de la réalité (Figure 12a) pour les petites surfaces. Elle implique que la relation aire-espèces représentée en logarithmes soit une droite. 𝐴𝑖 𝑆 est le nombre d’espèces rencontrées dans 𝐴𝑖 . (2000).Mesures neutres de la diversité 𝛼 ou 𝛾 Figure 11 : Les cinq dispositifs de Plotkin et al. 𝑎.. la relation est une droite (Figure 10) : ̂𝐴 = ln𝑐 + 𝑧ln𝐴 ln𝑆 (4) Plotkin et al. On obtient le rectangle 𝐴𝑖+1 en plaçant deux rectangles 𝐴𝑖 côte à côte (et donc le rectangle 𝐴𝑖−1 en coupant 𝐴𝑖 en deux). (2000) ont eu accès à de grands échantillons (5 placettes de 50 hectares dans l’ensemble du monde tropical. ce qui n’est visiblement pas le cas. On considère un rectangle 𝐴𝑖 dont le rapport longueur sur largeur vaut √2. Harte et al. Représentée en logarithmes. S’il s’agit d’une constante. indépendante de la taille du rectangle. Le paramétrage de c est obtenu par un échantillon d’un hectare. Les travaux ultérieurs lui donneront tort (Williamson et al. Pour la valeur classique de 𝑧 = 0. supposé valide également sur les autres forêts. L’écart-type est représenté (l’intervalle de fluctuation à 95% est de l’ordre de 2 écart-types). 𝑝(𝐴) est un polynôme de degré 𝑛 de 𝐴.125 et 𝑘 = 0. 2001). (2000) ne supposent pas 𝑎𝑖 constant et lui imposent simplement d’être une fonction de la surface. La Figure 13 compare les performances de cette méthode (persistence method). et que leur estimation sur une forêt permettait de prédire avec une très bonne précision la richesse des autres. Le modèle de Gleason Gleason (1922) réfute le travail d’Arrhenius (1921) à partir de l’argument selon lequel le nombre d’espèces doit se stabiliser quand la surface augmente. choisie arbitrairement pour permettre les calculs ultérieurs.0541 à Pasoh). Les données observées sont des tirages aléatoires d’échantillons de la surface souhaitée. Gleason propose une relation dans laquelle le nombre d’espèces (et non son logarithme) croît avec le logarithme de la surface : ̂ = 𝑐𝐴𝑧 𝑒 −𝑘𝐴 (5) Figure 13 : Performance du modèle de Plotkin et al. Les auteurs ont établi que les paramètres 𝑘 et 𝑧 étaient très proches pour les cinq forêts (𝑧 = 0. et dont la forme correspond aux observations de la Figure 12b.25 (loi log-normale) et du modèle de Fisher.25.. L’approximation de degré 0 est la loi de puissance. Elle augmente avec la surface.84. 18 . Les monômes sont d’autant moins importants que leur degré est élevé.Mesures de la biodiversité d’observation Si cette condition est respectée. Après calculs. La Figure 12b présente la valeur de 𝑎𝑖 en fonction de la surface échantillonnée. Les autres SAD concurrentes sont le modèle alpha de Fisher et le modèle Broken Stick de MacArthur. Celle de degré 1 est retenue par les auteurs pour estimer le nombre d’espèces rencontrées sur la surface 𝐴 : Ce modèle contient un paramètre k en plus 𝐴𝑆 de la loi de puissance. La courbe représente le nombre d’espèces rencontrées à Pasoh sur des surfaces de 0 à 50 ha. sans constante. et 𝑎 = 2−𝑧 . Plotkin et al. la relation aire-espèces est 𝐴𝑆 ≈ 𝑐𝐴𝑧 𝑒 −𝑝(𝐴) . le nombre d’espèces suit la loi de puissance. de la loi de puissance 0. 𝑎 = 0. ce qui infirme le modèle d’autosimilarité. Les valeurs issues du modèle ont été obtenues par un paramétrage de 𝒌 et 𝒛 sur 25ha. (2000) face au modèle log-normal. répété 1000 fois pour obtenir un intervalle de confiance. L’intervalle de fluctuation à 95% est ici encore de l’ordre de deux écart-types. à partir d’un échantillon d’un hectare nécessaire pour obtenir le paramètre 𝑐 . au risque de prévoir une richesse beaucoup trop élevée pour de grandes surfaces. Preston (1960) argumente en faveur du modèle d’Arrhenius (et en défaveur de celui de Gleason) aux échelles intermédiaires et montre que la courbe aire-espèces est triphasique (Figure 14). Hubbell (2001. (2000). 2006). chapitre 6) établit que le modèle de Fisher est pertinent à l’échelle de la méta-communauté et donc de la communauté locale en absence de limitation de la dispersion (si le taux de migration m vaut 1. Bordenave (Bordenave et De Granville. qui réfute à la fois Gleason et Arrhenius. 2012). Pour 𝑛 assez grand et sous l’hypothèse de saturation de Hubbell. 1998 . Connor et McCoy (1979) montrent que les régressions de 𝑆 ou ln𝑆 en fonction de 𝐴 ou ln𝐴 ont des performances similaires en terme de qualité d’ajustement (R2). Dans ce cas. (2003) établissent la SAD neutre de façon analytique qui s’ajuste mieux aux données que le modèle log-normal. Dans le cadre de l’approximation précédente. 𝐴𝑆 ̂ = ln𝑐 + 𝑧ln𝐴 (6) échelles. 2008). ou SDI : Species Diversity Index) égal à la pente de la relation de Gleason. y compris de thermodynamique (Würtz et Annila. Volkov et al.Williams (1964) reprend ce modèle et affirme sa validité à partir d’arguments sur la variabilité de l’habitat quand la surface d’échantillonnage augmente (par opposition à la relation d’Arrhenius applicable dans un habitat homogène. la communauté locale est un échantillon de la méta-communauté).. Volkov et al. La SAR est concave sur une échelle log-log (Figure 12 a).. Le meilleur modèle à l’échelle locale est donc celui de Plotkin et al. figure 1) L’échelle plus grande (zone B de la Figure 14) est pour Hubbel un assemblage d’un 19 . 2003. Mais la dispersion est limitée. il est égal à 𝛼. 2011) propose un indice de richesse spécifique (IRS. 𝐴 est proportionnel à 𝛼 + 𝑛 et le modèle de Fisher est équivalent au modèle de Gleason. Sa valeur calculée plus haut pour BCI est 35. très différente de la valeur de 𝜃 du modèle neutre pour les mêmes données (entre 47 et 50. la SAR a la forme de la courbe de la Figure 14. selon les résultats empiriques et des considérations théoriques (Gárcia Martín et Goldenfeld. (2012) valident largement le modèle d’Arrhenius pour des SAR insulaires. Bordenave et al. Le modèle de Fisher (1) peut être écrit sous la forme 𝑆𝑛 = 𝛼 ln(𝛼 + 𝑛) − 𝛼ln(𝛼 ). mais la traduction en SAR n’est pas faite. zone A. mais Triantis et al. Connor et McCoy (1979) discutent de la façon de tester les deux hypothèses mais ne disposent pas des données pour le faire. Ce résultat fait maintenant consensus mais pas la délimitation des trois Figure 14 : Relation aire-espèce triphasique (figure in Grilli et al. il est difficile d’estimer lequel des modèles est le plus adapté aux données : sur 35 jeux de données. et la distribution de la communauté locale est plus compliquée. Empiriquement. L’utilisation de l’indice 𝛼 de Fisher est donc sujette à caution. et l’indice 𝛼 de Fisher est le bon outil de mesure. McGill (2003) montre qu’une SAD log-normale s’ajuste mieux aux données que le modèle neutre selon les résultats de Hubbel. Zone B : relation d’Arrhenius. et due à la distribution log-normale des espèces). Mesures neutres de la diversité 𝛼 ou 𝛾 Synthèse La relation d’Arrhenius est plus robuste que celle de Gleason. ni la forme de la relation aux échelles extrêmes.. mais l’échantillonnage de toute la métacommunauté n’est jamais réalisé (sauf au point marquant le passage de la zone B à la zone C). meilleures seront les estimations de la diversité. l’échantillonnage est continu : s’il existe une structure spatiale comme des agrégats. Influence de la structure spatiale Les modèles classiques de courbes aireespèces supposent un tirage indépendant des individus. La relation d’Arrhenius est donc systématiquement validée à l’échelle régionale (Figure 10). puis la courbe aire-espèces est obtenue par simulation du processus. (2000) proposent une méthode permettant de prendre en compte la structure spatiale pour fournir des modèles de courbes aire-espèces fiables. les tirages étant indépendants. par exemple en forêt.Mesures de la biodiversité certain nombre de communautés composant la métacommunauté (page 186). de ne pas rencontrer une espèce suit une loi binomiale. Intuitivement. Chao et Jost (2012) montrent que le taux de couverture plutôt que la taille de l’échantillon doit être . quand l’échelle est encore plus grande. Plus il est élevé. il suffit de considérer qu’un agrégat surestime le nombre d’arbres de son espèce qui devrait être pris en compte dans le cadre d’un modèle à tirages indépendants. Ses hypothèses sont peu réalistes dans la zone A. Le biais diminue quand la surface d’échantillonnage augmente. de nouvelles communautés sont ajoutées progressivement. La méthode nécessite une carte des individus. La SAR obtenue par simulation suit la loi de puissance d’Arrhenius. On remarquera que la distribution de Fisher. on comprend bien que le nouvel arbre de la même espèce apporte moins d’information. Les paramètres du processus sont estimés à partir du semis de points. (2012) développent un modèle de SAR valable à toutes les échelles. mais il valide la loi de puissance analytiquement à l’échelle intermédiaire. la probabilité que l’arbre suivant soit d’une espèce donnée dépend de ses voisins. (2000) traitent un problème un peu différent : connaissant le nombre total d’espèces dans les dispositifs de la Figure 11. Grilli et al. Plotkin et al. Sur le terrain. dans un cadre particulier où le nombre total d’espèces et leur structure spatiale sont connus. aucune méthode générale permettant de prendre en compte la structure spatiale n’est disponible. Le taux de couverture augmente avec l’effort d’échantillonnage. Pour comparer deux communautés par des courbes de raréfaction. Malheureusement. n’est jamais observée dans la SAR à cause de l’agrégation spatiale : en augmentant la surface d’échantillonnage. le nombre d’espèces augmente à nouveau plus vite parce que d’autres métacommunautés sont intégrées. Plotkin et al. Les effets de l’agrégation peuvent donc être opposés selon la question posée. Enfin. donc de l’arbre précédent. Ce modèle surestime largement la diversité pour les petites surfaces : la probabilité de ne pas rencontrer une espèce agrégative est sous-estimée. Dans tous les cas. ils tracent la courbe aire-espèces théorique issue du modèle de Coleman (1981) qui considère simplement que la probabilité 20 Taux de couverture Good (1953) définit le taux de couverture de l’échantillonnage (sample coverage) comme la proportion des espèces découvertes 𝐶 = ∑𝑆 𝑠=1 𝟏(𝑛𝑠 > 0)𝑝𝑠 où 𝟏 est la fonction indicatrice. ce qui revient à surestimer la taille de l’échantillon ou sous-estimer la richesse pour une taille d’échantillon fixée. validée par Hubbel pour la méta-communauté. Le semis de point est considéré comme le résultat d’un processus de Neyman-Scott (1958) : des centres d’agrégats sont tirés de façon complètement aléatoire et les individus sont répartis autour des centres selon une loi normale en deux dimensions. parce que la taille relative des agrégats diminue. Mesures neutres de la diversité 𝛼 ou 𝛾 Richesse spécifique L’approche utilisée ici est très différente de la précédente.96 pour 𝑛 grand et 𝛼 = 5%. 1979).9226675 Techniques d’estimation non paramétrique Dans le cadre d’un échantillonnage de 𝑛 individus. Chaque individu a une probabilité 𝑝𝑠 d’appartenir à l’espèce 𝑠. Cette approche est bien moins répandue parce qu’elle suppose le bon choix du modèle et est beaucoup plus intensive en calcul. La loi a une forme en cloche assez prononcée qui fait que la probabilité de rencontrer 𝑟 individus d’une espèce est maximum pour 𝑟 = 𝑛𝑝𝑠 . reste assez grande quand 𝑟 varie de ±1 et devient 21 .MC$Ns) [1] 0. (1988) puis Zhang et Huang (2007) proposent l’estimateur suivant : (9) Les termes de la somme décroissent très vite avec 𝜈 . Les estimateurs de la diversité développés plus loin reposent largement sur cette notion pour la correction du biais d’échantillonnage (la sous-estimation systématique de la diversité due aux espèces non observées). Il prend en compte les single1 tons ( 𝑛 𝑠 : le nombre d’espèces observées 2 une seule fois) et les doubletons ( 𝑛 𝑠 : le nombre d’espèces observées deux fois) : 1 1 (𝑛 − 1) 𝑛 𝑠 𝑠 ̂ = 1 − 𝑛 � 𝐶 � 1 2𝑠 ( 𝑛 𝑛 − 1) 𝑛𝑠 + 2 𝑛 (8) Les deux estimateurs sont quasiment identiques dès que 𝑛 est grand. comme les individus sont tirés indépendamment les uns des autres. On sait seulement. classiquement 1. En se limitant à 𝜈 = 1. que le nombre 𝑛𝑠 d’individus de l’espèce 𝑠 observé dans l’échantillon suit une loi binomiale dont l’espérance est 𝑛𝑝𝑠 . Esty (1983) complété par Zhang et Zhang (2009) a montré que l’estimateur était asymptotiquement normal et a calculé ̂: l’intervalle de confiance de 𝐶 Où 𝑡𝑛 1−𝛼⁄2 est le quantile d’une loi de Student à 𝑛 degrés de libertés au seuil de risque 1 1𝑠 �1 − 𝑛𝑠 � + 2 2𝑠 � 𝑛 𝑛 𝑛 𝑛 ̂ ± 𝑡1−𝛼 𝐶 = 𝐶 ⁄2 𝑛 (10) On ne sait rien sur la loi des 𝑝𝑠 . qui calcule les trois estimateurs (celui de Zhang et Huang par défaut) : > library(entropart) > # Chargement du jeu de données > data(Paracou618) > Coverage.N. Le package entropart fournit la fonction Coverage. que Good attribue à Turing.N(Paracou618. L’estimateur du taux de couverture. Les estimateurs les plus connus sont ceux de Chao (1984 pour Chao1) et le jackknife (Burnham et Overton. On ne fait pas de supposition sur la forme de la SAD quand on utilise des méthodes d’estimation non paramétriques. On suppose que la communauté locale est de taille fixe et contient donc un nombre fixe d’espèces. et à une approximation de celui de SPADE en se limitant à 2. est : 1 𝑠 ̂ = 1 − 𝑛 𝐶 𝑛 𝛼. Une alternative consiste à inférer à partir des données les paramètres d’une SAD choisie.identique. l’estimateur se réduit à celui de Good. ̂ = �(−1)𝜈+1 �𝑛� 𝐶 𝜈 𝜈=1 𝑛 −1 𝜈 𝑛𝑆 Chao et al. (7) Un meilleur estimateur (son erreur quadratique moyenne est plus faible) est utilisé dans SPADE. on observe ≥1𝑠 espèces différentes parmi les 𝑆 existantes. et particulièrement le nombre total d’espèces. alors que l’approche par la SAR ne fait pas d’hypothèse sur les limites de la communauté et fournit un nombre d’espèces dépendant de la surface. ̂𝐶ℎ𝑎𝑜2 = l’estimateur est remplacé par 𝑆 + 1𝑠� 1𝑠−1� (𝑛−1) 𝑛 𝑛 𝑠 + 1 )2 (𝑛 − 1)( 𝑛 s 2 2𝑛 𝑛s (16) 2𝑛 .0 Npi=5. L’estimateur est ̂𝐶ℎ𝑎𝑜2 = 𝑆 ≥1 𝑛𝑠 Si aucune espèce n’est observée deux fois. et pratiquement nulle pour des observations multiples). Les estimateurs non paramétriques cherchent à tirer le maximum d’information de la distribution des abondances 𝑛𝑠 pour estimer le nombre d’espèces non observées. mais pas sa distribution : 1 1 1𝑠 𝑠 ̂𝐶ℎ𝑎𝑜1 � = 2𝑠 � � � + � � Var�𝑆 2 2 2 𝑠 𝑠 Figure 15 : Densité de probabilité de la loi de binomiale. Eren et al. 𝑛𝑝𝑠 est grand. La probabilité de les observer est donnée par la loi de binomiale : si 𝑛𝑝𝑠 est proche de 0.8 0. ̂𝐶ℎ𝑎𝑜1 = l’estimateur est remplacé par 𝑆 ≥1 1 (1 𝑠 + 𝑠 𝑠 − 1)⁄2 (Chao. Chao (1987) utilise une méthode différente pour obtenir un estimateur du nombre minimum d’espèces tenant compte du nombre 𝑛 d’individus échantillonnés : ≥1 ̂𝐶ℎ𝑎𝑜1 ) Var(𝑆 𝑛 𝑡1−𝛼 ⁄2 �𝑙𝑛�1+ 2� ̂𝐶ℎ𝑎𝑜1 − ≥1𝑠� �𝑆 (15) Chao1 et Chao2 Chao (1984) estime le nombre d’espèces non observées à partir de celles observées 1 ou 2 fois. l’espérance du nombre d’observations.7 Npi=0.1 0 0 1 2 3 4 5 r 6 7 8 9 10 La variance de l’estimateur est connue.0 0. 2004). Si aucune espèce n’est observée deux fois. (2012). est petit. ce qui est rarement le cas en écologie. 𝑧𝑠 le nombre d’espèces observées 𝑧 fois. valide à condition que les singletons et doubletons représentent une part importante de l’information. pour différentes espèces plus ou moins rares (valeurs de 𝒏𝒑𝒔 ).2 0. la probabilité de rencontrer l’espèce une fois est de l’ordre de 10%. L’échantillon peut être une surface ou un nombre d’individus. en ordonnée la probabilité.5 Npi=1. (2012) calculent l’intervalle de confiance à 95% : ≥1 𝑠� 1𝑠 − 1� 1𝑠�2 1𝑠 − 1� + 2 4 4 � 1𝑠� + ≥1 4 𝑠 ≥1 2 (13) Où : 𝑠 + ̂ 𝐶ℎ𝑎𝑜1 − ≥1𝑠 𝑆 𝑐 ≤ 𝑆 ≤ ̂𝐶ℎ𝑎𝑜1 − ≥1𝑠 �𝑐 𝑠 + �𝑆 (14) 𝑐 = 𝑒 Cet intervalle de confiance est plus petit quand la valeur maximum théorique du nombre d’espèces est connue. La difficulté est due aux espèces pour lesquelles 𝑛𝑝𝑠 .4 0. le nombre d’observations dans l’échantillon. Il s’agit d’un estimateur minimum.3 0.9 0. 2 3 ≥1 � 1𝑠� 𝑠 + 2 2 𝑠 2 (11) P(ni)=r Npi=0. En abscisse. la probabilité d’observer un individu est faible (Figure 15 : pour 𝑛𝑝𝑠 = 0. 1 0. la probabilité de ne pas rencontrer l’espèce est de l’ordre de 1%).5 0. Si aucune espèce n’est observée deux fois : ̂𝐶ℎ𝑎𝑜1 � = Var�𝑆 1 1 1𝑠 + �2 � � 4 𝑠 4 (12) Pour les espèces fréquentes.1. 22 .1 0. Sa formule est donnée en équation 8 de Eren et al.0 Npi=2.Mesures de la biodiversité rapidement très faible quand 𝑟 s’éloigne de 𝑛𝑝𝑠 (Figure 15). et les espèces sont observées systématiquement (Figure 15 : pour 𝑛𝑝𝑠 = 5.6 ̂𝐶ℎ𝑎𝑜1 = 𝑆 ≥1 𝑠 est le nombre d’espèces différentes observé. est le nombre d’espèces dites abondantes. Les intervalles de confiance de chaque estimateur sont calculés par bootstrap : même quand la variance d’un estimateur est connue. et ACE pour une estimation non biaisée de la richesse. 2010) disponible sur internet 4 . Le guide de l’utilisateur présente quelques estimateurs supplémentaires et des directives pour choisir. jackknife (ordre 1 et 2) et bootstrap (non détaillée ici). sa loi ne l’est généralement pas. specpool() est basé sur les incidences des espèces dans un ensemble de sites d’observation et donne une estimation unique de la richesse selon les méthodes Chao2.html 23 . 0� − 1) + Chao et Shen (2010) conseillent d’utiliser le 2 deuxième estimateur dès que 𝛾 �𝑟𝑎𝑟𝑒𝑠 dépasse 0.L’estimateur ACE Chao et Lee (1992) développent l’estimateur ACE (Abundance-based coverage estimator) à travers l’estimation du taux de couverture 𝐶 . 𝜈 ̂𝑟𝑎𝑟𝑒𝑠 � ∑𝜅 �1 − 𝐶 𝜈=1 𝜈 (𝜈 − 1) 𝑛𝑠 � . sauf pour le jackknife d’ordre 2. ≤𝜅 𝑛𝑠 le nombre d’espèces dites rares. Chao (1984) a montré que les estimateurs jackknife pouvaient être retrouvés par approximation de l’indice Chao1. appelés jackknife à l’ordre 𝑗. généralement à 10. Les estimateurs et leurs intervalles de confiance peuvent également être calculés sous R. la limite des espèces rares 𝜅 doit être augmentée. la valeur limite de 𝜈 notée 𝜅 est fixée arbitrairement. Il est conseillé d’utiliser Chao1 pour une estimation minimale.tw/softwareCE. 4 Lorsque l’hétérogénéité est très forte.stat.nthu. observées 𝜅 ̂𝑟𝑎𝑟𝑒𝑠 est le taux de couverfois ou moins. prenant en compte les valeurs de 𝑗 1 𝑛𝑠 à 𝑛𝑠 .edu. Le package vegan dispose pour cela de deux fonctions specpool() et estimateR(). Si ce n’est pas le cas. L’estimateur ACE utilise toutes les valeurs de 𝜈𝑠 correspondant aux espèces rares : concrètement. http://chao. 𝐶 ture ne prenant en compte que les espèces rares. L’écart-type de l’estimateur est également fourni par la fonction.8. L’estimateur ACE donne normalement une valeur plus grande que Chao1. L’estimateur du coefficient de variation est : 2 𝛾 �𝑟𝑎𝑟𝑒𝑠 = max � ≤𝜅 ∑𝜅 𝜈 𝑛𝑠 𝜈=1 𝜈 (𝜈 − 1) 𝑛𝑠 𝜅 𝜈 𝜈 ̂𝑟𝑎𝑟𝑒𝑠 (∑𝜅 𝐶 𝜈=1 𝜈 𝑛𝑠 )(∑𝜈=1 𝜈 𝑛𝑠 + ̂𝑟𝑎𝑟𝑒𝑠 𝐶 ≤𝜅 𝑛𝑠 + ̂𝑟𝑎𝑟𝑒𝑠 𝐶 1 𝑛𝑠 𝛾 �𝑟𝑎𝑟𝑒𝑠 (17) Calcul Ces estimateurs peuvent être calculés de façon relativement simple à l’aide du logiciel SPADE (Chao et Shen. 0� 𝜅 𝜈𝑠 − 1) ̂𝑟𝑎𝑟𝑒𝑠 (∑𝜈=1 𝜈 𝑛 𝐶 L’estimateur jackknife La méthode jackknife a pour objectif de réduire le biais d’un estimateur en considérant des jeux de données dans lesquels on a supprimé un certain nombre d’observations (ce nombre est l’ordre de la méthode). plus le nombre d’espèces non observées sera grand. et le calcul analytique de l’intervalle de confiance n’est pas possible. L’estimateur prend en compte le coefficient de variation de la distribution des fréquences (𝑝̂𝑠 ) : plus les probabilités sont hétérogènes. un autre estimateur est plus performant : 2 𝛾 �𝑟𝑎𝑟𝑒𝑠 2 = max �𝛾 �𝑟𝑎𝑟𝑒𝑠 �1 − 1. observées plus de 𝜅 fois. Finalement : ̂𝐴𝐶𝐸 = 𝑆 >𝜅 𝑛𝑠 >𝜅 𝑛𝑠 Burnham et Overton (1979) ont utilisé cette technique pour obtenir des estimateurs du nombre d’espèces. Les estimateurs du premier et du deuxième ordre sont les plus utilisés en pratique : 1 (𝑛 − 1) 𝑛 s 𝑛 1 2 (2𝑛 − 3) 𝑛 s (𝑛 − 2)2 𝑛 s ≥1 ̂ 𝑆𝐽2 = 𝑛s + − ( 𝑛 𝑛 𝑛 − 1) Mesures neutres de la diversité 𝛼 ou 𝛾 ̂𝐽1 = 𝑆 ≥1 𝑛s + (18) Augmenter l’ordre du jackknife diminue le biais mais augmente la variance de l’estimateur. 841763 S. Cette surface est ensuite prise pour référence pour une nouvelle extrapolation avec une nouvelle valeur de 𝑧.000000 S.chao1 12.214286 se. (2004) développent une méthode permettant l’extrapolation de la richesse mesurée sur de petites surfaces (48 placettes de 0.000000 84.ACE 122.] 232 256 > # Vérification.9991 On utilise la fonction estimateR pour calculer la richesse des 2 premiers carrés : > estimateR(BCI[1:2. 2011) permet de calculer les estimateurs jackknife d’ordre supérieur à 2 et surtout choisit l’ordre qui fournit le meilleur compromis entre biais et variance. La valeur de 𝑧 est constante pour des variations de surface limitées. et extrapolant vers une surface plus grande.659395 > # librairie SPECIES > library(SPECIES) > # Distribution du nombre d'espèces (vecteur: > # noms = nombre d'individus > # valeurs = nombres d'espèces ayant ce nombre d'individus) > Ns <. avec un intervalle de confiance calculé en supposant que la distribution est normale (±1. 1𝑠 = 19) : > specpool(BCI) Species jack1 jack1.chao1 117.se All 225 236. DistNs).473684 117.ACE 5.]) 1 2 S.integer(names(DistNs)). Exemple : On utilise les données de Barro Colorado Island (BCI).571998 La valeur du jackknife 1 fournie par specpool() est fausse. Le tableau d’entrée est un dataframe contenant. en partant du nombre d’espèces mesuré sur les petites placettes. le nombre d’espèces dans une surface 𝐴1 est 𝐴1 𝑆 Le package SPECIES (Wang.Mesures de la biodiversité estimateR() est basé sur les abondances des espèces et retourne un estimateur de la richesse spécifique par site et non global comme specpool.848959 117.578970 17. équation (18) : > sum(DistNs)+DistNs[1]*(sum(BCI)1)/sum(BCI) 1 243. Ns. ses effectifs par carré.164414 $CI lb ub [1. ncol=2) > jackknife(DistNs. Partant de la relation d’Arrhenius (1921) vue précédemment. Estimation à partir de placettes distantes Krishnamani et al. En indiçant les surfaces de 0 à 𝑛. On charge le tableau de données : > library(vegan) > data(BCI) $Nhat [1] 244 $SE [1] 6.tapply(Ns.colSums(BCI) > DistNs <.6053 6.736054 5. La fonction jackknife() de SPECIES donne le bon résultat.obs 93.317307 se.96 écarttype au seuil de 95%). L’idée est donc de procéder par étapes. length) > # Mise au format requis (matrice: > # colonne 1 = nombre d'individus > # colonne 2 = nombres d'espèces ayant ce nombre d'individus) > DistNs. la taille des Western Ghats en Indes). on obtient : = (𝐴1 ⁄𝐴0 ) 𝑧 𝐴0 𝑆 (19) (20 𝐴𝑛 𝑆 = (𝐴𝑛 ⁄𝐴𝑛−1 )𝑧𝑛−1 (𝐴𝑛−1 ⁄𝐴𝑛−2 )𝑧𝑛−2 … (𝐴1 ⁄𝐴0 ) 𝑧0 ) 24 . pour chaque espèce d’arbres (DBH ≥ 10 cm).25 ha) à de très grandes zones (60 000 km².SPECIES) $JackknifeOrder [1] 1 c'est-à-dire le nombre d’espèces dans la surface 𝐴0 plus petite multipliée par le rapport des surfaces à la puissance 𝑧.SPECIES <matrix(c(as. Comparaison des fonctions sur l’ensemble du dispositif BCI ( ≥1𝑠 = 225. La parcelle a été divisée en carrés de 1ha. Mesures neutres de la diversité 𝛼 ou 𝛾 Figure 16 : Arbre de décision du meilleur estimateur du nombre d’espèces. À l’intérieur de chaque placette. Au-delà de 96%. et donc que la relation soit linéaire.5% de la communauté). et ajustant lnχ à ln(𝐴⁄𝑑2 ) sur des plages de distances convenables pour que 𝑧 reste constant. incohérents (intervalle des estimations supérieur à 50% de leur moyenne). le nombre d’espèce observé est plus performant parce que les jackknifes surestiment 𝑆.Il reste à évaluer les différentes valeurs de 𝑧. Si les résultats sont cohérents. dans le domaine de validité du jackknife 1 (74% à 96%) qui est donc le bon estimateur.9). choisir un estimateur jackknife d’ordre d’autant plus faible que la complétude est grande. on préférera jackknife 1 ou 2. Cette méthode permet l’extrapolation à de très grandes surfaces de mesures de richesse faites sur de petites placettes à condition qu’elles soient assez nombreuses et éloignées les unes des autres. le critère majeur est l’équitabilité (voir page 39). Pour certaines plages de distances [𝑑𝑚𝑖𝑛 . les estimateurs jackknife 2 à 4 sont performants. Si elle est faible (de l’ordre de 0.6). Dans tous les cas. La complétude est 225⁄244 = 92%.8-0. ou évaluer le nombre d’espèces perdues en réduisant la surface d’une forêt. Le choix dépend principalement de la complétude (coverage sur la figure). Choix de l’estimateur Des tests poussés ont été menés par Brose et al. A plus grande distance. 25 . 𝑑𝑚𝑎𝑥 ] vérifiant 2 𝐴⁄𝑑𝑚𝑖𝑛 ≪ 1 (placettes éloignées). faible : 0. c'est-à-dire deux fois la fraction d’espèces communes entre deux placettes : 𝜒 = 2 � 1𝑆 ∩ 2𝑆��� 1𝑆 + 2𝑆�. S’ils sont Exemple de BCI : le nombre d’espèces estimé par jackknife 1 est 244. Les auteurs appellent cette proportion couverture (coverage). l’équation (19) est suffisante. l’ordre diminuant avec l’intensité d’échantillonnage (forte : 10%.5-0. L’arbre de décision est en Figure 16. (2003) pour permettre le choix du meilleur estimateur de la richesse en fonction de la complétude de l’échantillonnage ≥1𝑠⁄𝑆. La complétude est inférieure à la couverture : toutes les espèces sont le même poids alors que les espèces manquantes sont plus rares et pénalisent moins le taux de couverture. Le terme completeness a été proposé par Beck et Schwanghart (2010) pour éviter la confusion avec le taux de couverture défini par Good (vu page 23). L’indice dépend principalement de la surface des placettes 𝐴 et de leur éloignement 𝑑. Prédiction de la richesse d’un nouvel échantillon � déLa prédiction du nombre d’espèces 𝑆′ couvert dans une nouvelle placette d’un habitat dans lequel on a déjà échantillonné est une question importante. Pour une forte équitabilité (0. par exemple pour évaluer le nombre d’espèces préservées dans le cadre d’une mise en réserve. les auteurs utilisent l’indice de Sørensen. in Brose et al. Une première estimation est nécessaire par plusieurs estimateurs. 𝜒 est proportionnel à (𝐴⁄𝑑 2 ) 𝑧 . (2003). La valeur de 𝑧 peut donc être calculée en comptant le nombre d’espèces communes entre chaque paire de placettes. les estimateurs jackknife sont les meilleurs. La courbe obtenue est en Figure 17.ll) (21) 1𝑠� � 𝑛 2 ou ACE. 10000) 7 2 3 Le taux de couverture de l’inventaire de BCI est très proche de 100%.Mesures de la biodiversité > Sprime <. (2003) proposent un estimateur et le confrontent avec succès à des estima0̂ teurs antérieurs.40577 Figure 17 : Nombres de nouvelles espèces découvertes en fonction de l’effort d’échantillonnage supplémentaire (données de BCI).ll <prestondistr(colSums(BCI)) > veiledspec(mod. On note 𝑛 𝑆 l’estimateur du nombre d’espèces non observées dans le ̂ l’estimateur de son premier échantillon. et 𝐶 taux de couverture. suite du code de la page 23 : combien de nouvelles espèces seront découvertes en échantillonnant plus ? 1 2 4 8 16 32 64 128 256 512 2048 Frequency 26 . donc peu de nouvelles espèces seront découvertes en augmentant l’effort d’échantillonnage. sans regroupement par octaves.000000 5. Shen et al.function(Nprime) NonObs*(1-(1-(1-C)/NonObs)^Nprime) > curve(Sprime. 1.931018 > plot(mod.SPECIES)$Nhatlength(Ns)) [1] 19 > # Taux de couverture > (C <. Sprime(x) 4 5 6 Inférence du nombre d’espèces à partir de la SAD 0 2000 4000 x 6000 8000 10000 0 1 Distribution de Preston Preston (1948) fournit dès l’introduction de son modèle log-normal une technique d’estimation du nombre total d’espèces par la célèbre méthode des octaves. ou un autre estimateur : dans tous 0̂ ̂ − ≥1 les cas 𝑛 𝑆 = 𝑆 𝑛𝑠 . Elle est disponible dans le package vegan : > library(vegan) > data(BCI) > veiledspec(colSums(BCI)) Extrapolated Observed Veiled 235. > # Espèces non observées > (NonObs <jackknife(DistNs. est également possible : > mod.ll) Extrapolated Observed Veiled 230.Coverage.9991146 > # Nouvelles espèces en fonction du nombre de nouveaux individus 0̂ peut être obtenu par Chao1 ( 𝑛 𝑆 = 2𝑠 2 𝑛 ) 30 Species 0 5 10 15 20 25 35 Exemple de BCI.N(Ns)) 1 0. L’estimateur du nombre d’espèces du nouvel échantillon de 𝑛′ individus est : ̂ 𝑛′ 1 − 𝐶 0̂ � = 𝑛 𝑆′ 𝑆 �1 − �1 − 0 � � ̂ 𝑛𝑆 0̂ 𝑛𝑆 L’ajustement direct du modèle aux données. Seulement 7 nouvelles espèces seront observées en échantillonnant 10000 arbres supplémentaires (environ 25 ha en plus des 50 ha de la parcelle qui contiennent 225 espèces).40577 225.0000 10.931018 225. Ns. > # Calcul long (15 minutes) > pcg(DistNs.Maximum de vraisemblance d’une distribution de Fisher Norris et Pollock (1998) supposent que la distribution des espèces suit le modèle de Fisher (voir page 14) et infèrent le nombre d’espèces par maximum de vraisemblance non paramétrique (ils ne cherchent pas à inférer les paramètres de la loi de probabilité de 𝑝𝑠 mais seulement à ajuster au mieux le modèle de Poisson aux valeurs de 𝑝̂𝑠 observées). 𝐾 est une constante. ̂ = 𝑆 𝑛 𝐾 + 𝑛 (22) Enfin. En fonction de l’effort d’échantillonnage 𝑛. en contradiction avec les modèles présentés plus haut (Fisher. Le calcul est possible avec la librairie SPECIES de R : > library(SPECIES) > # Distribution du nombre d'espèces (vecteur: > # noms = nombre d'individus > # valeurs = nombres d'espèces ayant ce nombre d'individus) > Ns <.colSums(BCI) > DistNs <.SPECIES) MLE= 239 suivent une loi gamma et en estimant aussi ses paramètres. > DistNs. 1913) proposé par Clench (1979). évalué en temps (il s’agit de la collecte de papillons).SPECIES) MLE= 239 Soberón M. Son défaut est qu’il nécessite un très long temps de calcul (plusieurs heures selon les données).tapply(Ns. Arrhenius) qui prévoient que le nombre d’espèces augmente indéfiniment. Wang (2010) perfectionne la technique d’estimation en supposant que les 𝑝𝑠 27 . Le modèle le plus connu est celui de Michaelis-Menten (Michaelis et Menten. que Clench relie à la difficulté de collecte. Ces modèles sont efficaces empiriquement mais manquent de support théorique pour justifier leur forme.] > unpmle(DistNs. Wang et al. Les calculs n’aboutissent pas si la queue de distribution n’est pas regroupée (il existe 108 valeurs différentes de 𝑛𝑠 dans l’exemple de BCI : aucune des fonctions de SPECIES ne fonctionne en l’état). le nombre d’espèces découvert augmente jusqu’à une asymptote égale au nombre d’espèces total : 𝑛𝑠 Le problème de cette méthode d’estimation est qu’elle diverge fréquemment. et Llorente B. 2] <sum(DistNs. ncol=2) > # Regroupement de la queue de distribution : la longueur du vecteur est limitée à 25 pour alléger les calculs.SP ECIES)[1].SPECIES[25.SPECIES) MLE= 236 Selected alpha model: Inf Mesures neutres de la diversité 𝛼 ou 𝛾 Inférence du nombre d’espèces à partir de courbes d’accumulation Cette approche consiste à extrapoler la courbe aire-espèces. (1993) développent un cadre théorique plus vaste qui permet d’ajuster la courbe d’accumulation à plusieurs modèles.SPECIES[25:dim(DistNs. Il est disponible dans SPECIES : fonction pcg.SPECIES[1:25.2]) > DistNs. length) > # Mise au format requis (matrice: > # colonne 1 = nombre d'individus > # colonne 2 = nombres d'espèces ayant ce nombre d'individus) > DistNs. (2005) ont amélioré sa stabilité en pénalisant le calcul de la vraisemblance : > pnpmle(DistNs. La souplesse de la loi gamma permet d’ajuster le modèle à des lois diverses et l’estimateur de Wang est très performant.integer(names(DistNs)). DistNs).SPECIES <DistNs.SPECIES <matrix(c(as. cumsum) > # Nombre d’espèces cumulées > nEspeces <.8 > # Courbe ajustée > x <. nEspeces). Le nombre de taxon de chaque niveau est lié à celui du niveau précédent. qui ne se trouve même pas dans l’intervalle de confiance à 95%. Le modèle est ajusté par nlsfit. ordres.5 % 97. Cette méthode est applicable jusqu’au niveau du genre (Figure 18. de départ doivent être fournies pour 𝐾 et 𝑆 𝐾 est la valeur de 𝑛 correspondant à ̂ 𝑛𝑠 = 𝑆⁄2.5 % 223. le nombre de taxons de niveaux supérieurs (phylums. > Ajustement du modèle > (nlsfit <. classes.univlyon1.0 232. tableau 1) en font une revue et proposent une méthode nouvelle.2987 100 120 140 160 200 0 5000 10000 nArbres 15000 20000 Le nombre d’espèce estimé est inférieur au nombre observé.1/nArbres plot(y ~ x) lm1 <. newdata = list(nArbres = x))) Combien y a-t-il d’espèces différentes sur Terre ? La question de l’estimation du nombre total d’espèces génère une abondante littérature. le nombre total d’espèces sante.] 2.nls(nEspeces ~ S * nArbres/(K + nArbres). Le modèle de Michaelis-Menten ne convient pas. 1.apply(BCI. A à E).1/nEspeces x <. 1934) : � 1 𝐾 1 1 �= � �+ ̂ ̂ 𝑛 𝑠 𝑆 𝑆 𝑛 (23) Le nombre d’espèce est estimé par l’inverse de l’ordonnée à l’origine du modèle. > (S <. start = list(K = max(nArbres)/4. il est plus simple de passer par une transformation linéaire du modèle (Lineweaver et Burk.apply(Cumul. La droite est 5 Fiche TD de J. Des valeurs ̂. function(x) length(x[x>0])) > plot(nArbres. to=max(nArbres). Mora et al.Mesures de la biodiversité L’estimation empirique du modèle de Michaelis-Menten peut être faite avec R 5.pdf 28 . Dans chaque règne. G sous la forme du relation linéaire entre le logarithme du logarithme du nombre de taxons et le rang (1 pour phylums.002 > 1/confint(lm1)[1. ce qui est représenté par la Figure 18. (2011. familles et même genres) est estimé par des modèles prolongeant jusqu’à leur asymptote les valeurs connues en fonction du temps.R. nEspeces) Pour calculer l’intervalle de confiance.lm(y ~ x) abline(lm1$coef) 220 nEspeces 180 On voit assez clairement que le modèle s’ajuste mal quand il est représenté sous cette forme. data = list(nArbres.cumsum(rowSums(BCI)) > # Cumul de l’inventaire > Cumul <. 2. y = predict(nlsfit.0217 211. Les 50 carrés de BCI sont utilisés pour fabriquer une courbe d’accumulation : > data(BCI) > # Cumul du nombre d’arbres > nArbres <. > > > > > y <. S = max(nEspeces)))) K S 1251.fr/R/pdf/tdr47. Pour 𝑆 inventoriées est un bon choix. length=255) > lines(x = x. Lobry : http://pbil. 𝑛⁄4 est une approximation suffî .seq(from=0.1/lm1$coef[1]) (Intercept) 217. 5 pour genres). mais le nombre d’espèces intervient clairement dans sa valeur : pour une régularité identique. Sa valeur diminue avec la régularité de la distribution : 𝐸 = 0 si une seule espèce a une probabilité de 1. souvent appelée « indice de concentration de Simp- Le nombre total d’espèces estimé est 8. 29 . si ce n’est leur vérification empirique. Il est compris dans l’intervalle [0. l’indice augmente avec le nombre d’espèces. Deux autres formes de l’indice sont utilisées. Aucune justification de ce résultat majeur n’est donnée par les auteurs. (2011). 2001 par exemple). fig. Une façon alternative de décrire la méthode est de dire que le nombre de taxons du niveau 𝑛 + 1 est égal à celui du niveau 𝑛 à la puissance 𝑘. est : 2 𝐸 = 1 − � 𝑝𝑠 𝑠=1 𝑆 (24) Figure 18 : Évolution du nombre de taxons connus en fonction du temps et valeur estimée du nombre total (ligne horizontale grise. L’indice de Simpson (1949). Animalia seulement. tableau 2). 1. (2011. Il est parfois interprété comme un indice d’équitabilité (Morin et Findlay. La valeur 1 est atteinte pour un nombre infini d’espèces. ou Gini-Simpson. la probabilité que deux individus soient de la même espèce. 1[. tous règnes confondus. 2011). In Mora et al.7 millions. Indice de Simpson Définition Mesures neutres de la diversité 𝛼 ou 𝛾 On note 𝑝𝑠 la probabilité qu’un individu tiré au hasard appartienne à l’espèce 𝑠. dans la fourchette des estimations précédentes (de 3 à 100 millions). Le nombre d’espèces connues est trop faible pour utiliser cette méthode (F). 𝐸 = 1 − 1⁄𝑆 si les 𝑆 espèces ont la même probabilité 𝑝𝑠 = 1⁄𝑆 . Il est obtenu par extrapolation de la relation du nombre de taxons d’un niveau à celui du niveau supérieur (G). Tableau 1 : Nombre d’espèces actuellement inventoriées et nombre estimé par Mora et al. et nécessitant près de 500 ans d’inventaires au rythme actuel des découvertes (May. de probabilités nulles. La pente de la droite de la figure est ln𝑘. Tout d’abord.prolongée jusqu’au rang 6 pour obtenir le nombre d’espèces. Il peut être interprété comme la probabilité que deux individus tirés au hasard soient d’espèces différentes. A à E). Mesures de la biodiversité son » : 2 𝐷 = � 𝑝𝑠 𝑠=1 𝑆 (25) La fonction Simpson.P(Ps) [1] 0. Shannon et Weaver.P de la librairie entropart : > library(vegan) > data(BCI) > Ps <. une forme dite « réciproque ».N de entropart accepte comme argument un vecteur d’abondances (et non de probabilités) et propose par défaut la correction de Lande > Simpson. Lande. 1948 . Les produits de combinaisons se simplifient pour donner l’équation (30). 𝐻 = − � 𝑝𝑠 ln 𝑝𝑠 𝑠=1 𝑆 𝐸 ∗ est en réalité la mesure d’équitabilité fondée sur l’indice de Simpson. plus rare : 𝐸 ∗ = 1⁄𝐷 𝑆 (26) Indice de Shannon Définition L’indice de Shannon (Shannon.colSums(BCI)/sum(BCI) > Simpson. La probabilité qu’une plante choisie au hasard appartienne à l’espèce 𝑠 est notée 𝑝𝑠 . index = "simpson") – disponible en chargeant la librairie vegan de R ou avec la fonction Simpson. est dérivé de la théorie de l’information. et on enregistre la liste ordonnée des espèces des 𝑛 plantes. L’estimateur du maximum de vraisemblance de l’indice est : 2 � = 1 − � 𝑝̂𝑠 𝐸 𝑠=1 ≥1 𝑠 (27) (29) Le calcul de l’indice de Simpson peut se faire avec la fonction diversity – syntaxe : diversity(x.9737209 Enfin. aussi appelé indice de Shannon-Weaver ou ShannonWiener. On note 𝐿 le nombre de listes respectant ces conditions : 𝐿 = 𝑛! ∏𝑆 𝑖=1(𝑛𝑝𝑠 )! (30) Biais d’échantillonnage � est légèrement biaisé parce L’estimateur 𝐸 que toutes les espèces n’ont pas été échantillonnées. noté 2𝐸 (voir page 40). 1996) : 𝑛 2 �=� 𝐸 � �1 − � 𝑝̂𝑠 � 𝑛 − 1 𝑠=1 ≥1 Démonstration : Le nombre de positions possibles dans la liste pour les individus de la première es𝑛 pèce est �𝑛𝑝 �. il est prudent de vérifier que la formule de calcul correspond bien au nom annoncé. le nombre de plantes de l’espèce 𝑠 est 𝑛𝑝𝑠 .9736755 Considérons une placette forestière contenant 𝑆 espèces végétales différentes. On prélève 𝑛 plantes. le nombre est 𝑛−𝑛𝑝1 −⋯−𝑛𝑝𝑠−1 � �. Un estimateur non biaisé est (Good. La nomenclature est assez confuse pour toutes les formes de l’indice. 1953 . 𝑛𝑝 𝑖 1 𝑠 (28) La correction par 𝑛⁄(𝑛 − 1) tend rapidement vers 1 quand la taille de l’échantillon augmente : l’estimateur est très peu biaisé. 1963).N(colSums(BCI)) [1] 0. Si 𝑛 est suffisamment grand. Pour 𝑛𝑝2 ème la s espèce. 30 . Le nombre de positions 1 pour la deuxième espèce est �𝑛−𝑛𝑝 �. On utilise l’approximation de Stirling. 1966a). c'est-à-dire la quantité d’information contenue dans l’ensemble des lettres. Shannon a utilisé un logarithme de base 2 pour que 𝐻 soit le nombre moyen de questions binaires (réponse oui ou non) nécessaire pour identifier l’espèce d’une plante (un caractère utilisé dans une chaîne dans le contexte du travail de Shannon). Ce résultat est connu sous le nom de formule de Brillouin (1962). présenté en détail par Conceição et Ferreira (2000). d’autant plus que le nombre d’espèces total est grand mais d’autant moins que l’échantillonnage est important.alpha (colSums(BCI))+1)-digamma(1) [1] 4. ln 𝑛! ≈ 𝑛 ln 𝑛 − 𝑛.P de la librairie entropart : > Ps <. Biais d’échantillonnage Basharin (1959) a montré que l’estimateur de l’indice de Shannon était biaisé parce que des espèces ne sont pas échantillonnées.148323 La sous-estimation est assez sévère sur cet exemple. La formule (31) est celle de l’indice de Theil (1967). Si 𝑆 est le nombre d’espèces réel et 𝑛 le nombre d’individus échantillonnés. À l’origine. à condition que la distribution de l’abondance des espèces soit log-normale : � = 𝜓(𝛼 𝐻 � + 1) − 𝜓(1) (33) � est 𝜓(∙) est la fonction digamma. pour obtenir après simplifications : ln 𝐿 = −𝑛 � 𝑝𝑠 ln 𝑝𝑠 𝑠=1 𝑆 Le calcul de l’indice de Shannon peut se faire avec la fonction diversity – syntaxe : diversity(x. Leur valeur est le nombre de chaînes de caractères différentes que l’on peut obtenir avec l’ensemble des lettres disponibles. L’indice de Shannon donne une mesure de la biodiversité en tant que quantité d’information. Les logarithmes naturels. index = "shannon") – disponible en chargeant la librairie vegan de R ou avec la fonction Shanon. à l’origine utilisé pour mesurer les inégalités de revenu puis pour caractériser les structures spatiales en économie. on peut donc le diviser par n et on obtient l’indice de biodiversité de Shannon. La valeur estimée à partir des données est donc trop faible. Ces indices ont été définis en choisissant des lettres au hasard pour former des chaînes de caractères.colSums(BCI)/sum(BCI) > Shannon. de base 2 ou 10 ont été utilisés par la suite (Pielou. leur probabilité d’occurrence est faible (loi des grands nombres) et elles peuvent être négligées. le biais réel est inconnu. Chao et Shen (2003) établissent un estimateur non biaisé à partir du taux de couverture de ̂: l’échantillonnage 𝐶 31 𝑠 (32) . le biais est : � � − 𝐻 = − 𝔼�𝐻 𝑆 − 1 + 𝑂(𝑛−2 ) 2𝑛 (34) 𝑂(𝑛−2 ) est un terme négligeable. Comme le nombre d’espèces 𝑆 n’est pas observable. L’indice est proportionnel au nombre de plantes choisies. L’estimateur du maximum de vraisemblance de l’indice est : � = − � 𝑝̂𝑠 ln 𝑝̂𝑠 𝐻 𝑠=1 ≥1 Bulmer (1974) établit une relation entre l’indice de Shannon et l’indice 𝛼 de Fisher.On peut maintenant écrire le logarithme de 𝐿 : ln 𝐿 = ln 𝑛! − ∑𝑆 𝑠=1 ln 𝑛𝑝𝑠 .P(Ps) [1] 4. 𝐻 = ln 𝐿⁄𝑛 est l'indice de Shannon.270409 Mesures neutres de la diversité 𝛼 ou 𝛾 (31) Il est possible d’obtenir des listes de plantes ne respectant pas les probabilités individuelles. et 𝛼 l’estimateur de l’indice de Fisher (voir page 14) : > digamma(fisher. mais comme on suppose 𝑛 assez grand. Mesures de la biodiversité ≥1 ̂ 𝑝̂𝑠 ln�𝐶 ̂ 𝑝̂𝑠 � 𝐶 � = −� 𝐻 ̂ 𝑝̂𝑠 �𝑛 1 − �1 − 𝐶 𝑠=1 𝑠 (35) Multiplier les fréquences observées par le taux de couverture permet d’obtenir un estimateur non biaisé des probabilités prenant en compte les espèces non observées.0 0. lty=2) . Correction = "ChaoShen") [1] 4. 0. La fonction Shannon.6 0. Le problème traité est la nonlinéarité de l’indice de Shannon par rapport aux probabilités qui entraine un biais 32 0.N de entropart accepte comme argument un vecteur d’abondances (et non de probabilités) et permet la correction de Chao et Shen.0 Le biais peut être évalué par simulation 7 : 10000 tirages sont réalisés dans une loi normale d’espérance 𝑝𝑠 choisie et d’écarttype 0.4 x 0. Beck et Schwanghart (2010) montrent que la correction du biais est efficace. À cause de la concavité. puis un autre jusqu’à ce que 𝐻 = ln 𝐿⁄𝑛 n’augmente plus : la diversité augmente dans un premier temps mais se stabilise quand l’effet des espèces ajoutées est compensé par celui de la diminution de l’équitabilité due aux espèces présentes dans tous les relevés.3 0. Code R : > curve(-x*log(x).N(colSums(BCI). vés disponibles. Le biais est la différence entre 6 Figure 19 : courbe 6 de – 𝒙𝐥𝐧𝒙 entre 0 et 1. 0.0001. même à des niveaux de complétude de l’échantillonnage (voir page 25) très faibles. .function (p) { + Ps <. Chaque estimateur 𝑝̂𝑠 fluctue autour de 𝑝𝑠 mais vaut 𝑝𝑠 en moyenne. À partir de ce seuil. Biais. 0. Le terme au dénominateur est la correction de Horvitz et Thompson (1952) : chaque terme de la somme est divisé par la probabilité d’observer au moins une fois l’espèce correspondante. L’indice de Shannon est concave (Figure 19) donc son estimateur (32) est biaisé négativement.8 1. La fonction logarithme fournit un exemple simple : l’espérance de ln(𝑝𝑠 ) n’est pas le logarithme de l’espérance de 𝑝𝑠 parce que la fonction ln est concave. 2008 en fait une revue).1 0.2 0.95) > abline(h=0.p <. estimée par sa moyenne calculée en ajoutant tous les rele�.p à chaque valeur de Ps + sapply(Ps. > Shannon. p.rnorm(10000.function (Ps) { + # Applique Biais. ln(𝑝̂𝑠 ) est en moyenne inférieur à ln(𝑝𝑠 ) : cette relation est connue sous le nom d’inégalité de Jensen (1906).2 0.p) + } > curve(Biais. l’augmentation de ln𝐿 par individu ajouté est calculée pour chaque relevé supplémentaire.01.0 0. -x * log(x) Pielou (1966b) a développé une autre méthode de correction de biais lorsque de nombreux relevés de petite taille sont disponibles. ln𝐿 est calculé pour un relevé choisi aléatoirement puis les données du premier relevé sont ajoutées à celles d’un autre.01) + p*log(p)-mean(Ps*log(Ps)) + } > Biais <. Son espérance. Il tend vers 1 quand la taille de l’échantillon augmente. la littérature de physique statistique s’est abondamment intéressée à cette question (Bonachela et al. même sans prendre en considération les espèces non observées. 1) 7 Code R : > Biais.. est 𝐻 Enfin.275285 d’estimation.05. 1963) pour la mesure de la diversité.6 0. Figure 20 : biais de −𝒑 Les textes fondateurs sont Davis (1941) et surtout Theil (1967) en économétrie. La présence de 𝑟𝑠 dans l’échantillon est peu étonnante si 𝑝𝑠 est grande : elle apporte peu d’information supplémentaire par rapport à la simple connaissance des probabilités. si 𝑝𝑠 est petite. 𝑝𝑆 }. Schürmann suggère d’utiliser 𝜉 = 𝑒 −1⁄2 comme meilleur compromis.276094 Mesures neutres de la diversité 𝛼 ou 𝛾 Biais(x) -0. dont la somme est l’information de l’échantillon. Schürmann (2004) l’a généralisée pour définir une famille de corrections dépendant d’un paramètre 𝜉 : � = −� 𝐻 𝑠=1 ≥1 𝑡 − (−1)𝑛𝑠 � 𝑑𝑡� 0 1 + 𝑡 1 𝑛𝑠 −1 (37) 𝑠 𝑛𝑠 �𝜓(𝑛) − 𝜓(𝑛𝑠 ) 𝑛 − (−1)𝑛𝑠 � 0 1 −1 𝑛𝑠 −1 𝑡 𝜉 (38) 𝑑𝑡 � 1 + 𝑡 On considère maintenant un échantillon de valeurs de 𝑟. La valeur du biais en fonction de 𝑝𝑠 est en Figure 20.276599 > Shannon. 𝑟2 .−𝑝𝑠 ln 𝑝𝑠 (connu) et la moyenne des 1000 valeurs de −𝑝̂𝑠 ln 𝑝̂𝑠 (la probabilité est estimée par sa réalisation à chaque tirage). dont on connaîtrait la densité de probabilité.N permet toutes ces corrections : > # Grassberger 1988 > Shannon. … . En revanche.276491 > Shannon. décroissante quand la probabilité augmente. et 𝒫 = {𝑝1 .2 0.N(colSums(BCI). Le biais de l’indice de Shannon est la somme des biais pour toutes les probabilités spécifiques de la communauté étudiée. Les probabilités sont connues a priori. Le biais d’estimation diminue avec 𝜉 mais l’erreur quadratique augmente. Tout ce qui suit est vrai aussi pour des valeurs de 𝑟 continues. On définit donc une fonction d’information.0010 Entropie : introduction Définition de l’entropie 0. 33 . 𝑠 Grassberger (2003) l’a perfectionnée : 𝑛 � = − � 𝑠 �𝜓(𝑛) − 𝜓(𝑛𝑠 ) 𝐻 𝑛 𝑠=1 ≥1 𝜓(𝑛𝑠 ) est la fonction digamma.N(colSums(BCI). Chaque valeur observée dans l’échantillon apporte une certaine quantité d’information. Correction = "Grassberger") [1] 4.8 -0. et Shannon (1948 . 𝑝2 . 𝐼 (𝑝𝑠 ).0000 -0. … .N(colSums(BCI). Correction = "Grassberger2003") [1] 4. Correction = "Schurmann") [1] 4. Considérons une expérience dont les résultats possibles sont {𝑟1 . La probabilité d’obtenir 𝑟𝑠 est 𝑝𝑠 . la présence de 𝑟𝑠 est surprenante. Une revue est fournie par Maasoumi (1993). 𝑟𝑆 }.0004 -0.4 x 0. et son calcul est toujours l’objet de recherches.0008 Grassberger (1988) a fourni la correction de référence : � = −� 𝐻 𝑠=1 ≥1 �𝒔 𝐥𝐧 𝒑 �𝒔 entre 0 et 1.0006 -0.0002 0. La fonction Shannon. 𝑠 (−1)𝑛𝑠 𝑛𝑠 �ln(𝑛) − 𝜓(𝑛𝑠 ) − � 𝑛 𝑛𝑠 + 1 (36) Enfin.0012 -0. de 𝐼 (0) = +∞ (ou éventuellement une valeur strictement positive finie) à 𝐼 (1) = 0. 0. 1.8 1. 𝐻 (𝒫 ) est appelée entropie. add=TRUE) Le code R nécessaire pour réaliser la figure est: 34 . On définit le gain d’information 𝐼 (𝑞𝑠 .10)) > curve(-log(x). connaissant les probabilités a priori.4 p 0. Si 𝒫 est la distribution des probabilité des espèces dans une communauté. alors 𝐻 (𝒫 ) est l’indice de Shannon. Elles sont différentes des probabilités 𝑝𝑠 . 𝑝𝑠 ) = 𝐻 (𝒬 . 𝒫 ) seront nécessaires.6 0.0 Figure 21 : Fonctions d’information utilisées dans le nombre d’espèces (trait plein). que le gain d’information soit donc nul. 1. lty=1.Mesures de la biodiversité Entropie relative 10 0. de la valeur de 𝐻 ● I(p) 0 2 4 6 8 Quelques formes possibles de 𝐻 (𝒬. l’entropie est nulle. mais bien d’autres formes de 𝐼 (𝑝𝑠 ) sont possibles. p. alors 𝐻(𝒫 ) est l’indice de Simpson. L’information apportée par l’observation d’espèces rares décroît du nombre d’espèces à l’indice de Simpson. 0. l’indice de Shannon (pointillés longs) et l’indice de Simpson (pointillés). ∑𝑆 𝑠=1 𝑞𝑠 𝐼 (𝑞𝑠 . L’entropie est maximale quand les résultats sont équiprobables. d’espèces 𝑆 moins 1. des tests de significativité � (𝒬. est souvent appelée entropie relative. par exemple parce que l’expérience ne s’est pas déroulée exactement comme prévu. La quantité totale d’information fournie par l’expérience. lty=2.2 0. 1−𝑝𝑠 𝑝𝑠 . ylab="I(p)". appelée parfois deuxième mesure de Theil (Conceição et Ferreira. Elle peut être vue comme une distance entre la distribution a priori et la distribution a posteriori. ylim=c(0. 𝐻 (𝒫 ) est l’indice de Shannon. 1. 𝒫 ) sont : La divergence de Kullback-Leibler (Kullback et Leibler. add=TRUE) > curve(1-x. Si 𝐼 (𝑝𝑠 ) = 1 − 𝑝𝑠 . Si le résultat est certain (une seule valeur 𝑝𝑆 vaut 1). Si 𝐼 (𝑝𝑠 ) = −ln(𝑝𝑠 ). Si on choisit 𝐼 (𝑝𝑠 ) = −ln(𝑝𝑠 ).0 0. 34). Il est possible que les distributions 𝒫 et 𝒬 soit identiques. mais les estimateurs empiriques n’étant pas exactement égaux entre eux. 𝒫 ). La quantité d’information attendue de l’expérience est ∑𝑆 𝑠=1 𝑝𝑠 𝐼 (𝑝𝑠 ) = 𝐻 (𝒫 ). C’est une mesure de l’incertitude (de la volatilité) du résultat de l’expérience. 2000. 0. lty=3. qui inverse simplement les rôles de 𝑝 et 𝑞 : 𝑆 𝑞𝑠 𝑝𝑠 (39) 𝑝𝑠 𝑞𝑠 (40) 8 > curve((1-x)/x. Patil et Taillie (1982) montrent que : ● Considérons maintenant les probabilités 𝑞𝑠 formant l’ensemble 𝒬 obtenues par la réalisation de l’expérience. alors 𝐻 (𝒫 ) est le nombre 𝐿 = � 𝑝𝑠 ln 𝑠=1 Sa proche parente. xlab="p". 𝑝𝑠 ) comme la quantité d’information supplémentaire fournie par l’observation d’un résultat de l’expérience. 1951) connue par les économistes comme l’indice de dissimilarité de Theil (1967) : 𝑆 𝑇 = � 𝑞𝑠 ln ● 𝑠=1 ● ● Si 𝐼 (𝑝𝑠 ) = Ces trois fonctions d’information sont représentées en Figure 21 8. Ces résultats avaient déjà été obtenus avec une autre approche par MacArthur (1965) et repris par Adelman (1969) dans la littérature économique. L’entropie relative est essentielle pour la définition de la diversité 𝛽 présentée dans le chapitre suivant. 2 𝐷 = 1⁄(1 − 𝐸 ). 𝑝2 . 1920). ignorée dans 𝐻 qui est une mesure neutre (toutes les espèces y jouent le même rôle). Les nombres de Hill sont le nombre d’espèces équiprobables donnant la même valeur de diversité que la distribution observée. (41) On peut montrer que 𝑇 = 𝐻0 et 𝐿 = 𝐻−1 . 1 0 . La valeur maximale est atteinte si toutes les probabilités sont égales. d’ordre 𝑞 : 𝑆 Il montre que 𝑅𝑞 respecte les 3 axiomes.● 1 𝑞𝑠 𝑞 𝐻𝑞 (𝒬 . où 𝒫 = {𝑝1 . … . Le remplacement d’un individu d’une espèce fréquente par un individu d’une espèce plus rare augmente l’entropie à condition que 𝑅(𝒫 ) soit concave. 𝑝𝑆 } : ● ● ● La symétrie : les espèces doivent être interchangeables. 2001). cette propriété est connue sous le nom de Pigou-Dalton (Dalton. Hurlbert reprochait à la littérature sur la diversité sa trop grande abstraction et son éloignement des réalités biologiques. En se limitant à la diversité 𝛼 .. Tsallis (1988) propose une classe de mesures appelée entropie généralisée. Dans la littérature économique sur les inégalités. 1993). on peut remarquer que l’indice de Shannon est la divergence de Kullback-Leibler entre la distribution observée et l’équiprobabilité des espèces (Marcon et al. 2012). aucune n’a de rôle particulier et leur ordre est indifférent. 35 𝐷 est le nombre d’espèces. 𝒫 ) = �� 𝑞𝑠 � � − 1� 𝑞(𝑞 + 1) 𝑝𝑠 𝑠=1 L’entropie généralisée (Maasoumi. 𝐷 = 𝑒 𝐻 . La mesure doit être continue par rapport aux probabilités. Mais l’efficacité implique la spécialisation. notamment en fournissant des exemples dans lesquels l’ordre des communautés n’est pas le même selon l’indice de diversité choisi. ● Mesures neutres de la diversité 𝛼 ou 𝛾 Patil et Taillie (1982) ont montré de plus que : L’introduction d’une espèce dans une communauté augmente sa diversité (conséquence de la décroissance de 𝑔(𝑝𝑠 )). Ils sont des transformations simples des indices classiques : ● ● ● 𝐷 = �� 𝑝𝑠 � 𝑠=1 𝑆 𝑞 1 1−𝑞 (43) (42) Rényi pose également les axiomes pour une mesure d’entropie 𝑅(𝒫 ). ● Entropie et biodiversité : historique MacArthur (1955) est le premier à avoir introduit la théorie de l’information en écologie (Ulanowicz. Les premiers travaux consistant à généraliser l’indice de Shannon sont dus à Rényi (1961). l’exponentielle de l’indice de Shannon. MacArthur s’intéressait aux réseaux trophiques et cherchait à mesurer leur stabilité : l’indice de Shannon qui comptabilise le nombre de relations possibles lui paraissait une bonne façon de l’évaluer. l’inverse de l’indice de concentration de Simpson. L’entropie d’ordre 𝑞 de Rényi est : 1 𝑞 𝑅𝑞 = ln � 𝑝𝑠 1 − 𝑞 𝑞=1 𝑆 Hill (1973) transforme l’entropie de Rényi en « nombres de Hill ». définie par Havrda et Charvát (1967) pour la première fois et redécouverte plusieurs fois. qui en sont simplement l’exponentielle : 𝑞 Le souci de Hill est de rendre les indices de diversité intelligibles après l’article remarqué de Hurlbert (1971) intitulé « le nonconcept de diversité spécifique ». MacArthur a abandonné cette voie. 𝑥 donc 𝑒𝑞 n’est pas défini pour 𝑥 > 1⁄(𝑞 − 1).0 -8 -6 -4 -2 Le nombre d’espèces moins 1 est 0𝐻 .4 p 0. 0. Simpson). q) et expq(x. Enfin. sa décomposition sera présentée en détail dans le chapitre suivant. Ces résultats ont été complétés par d’autres et repris en écologie par Keylock (2005) et Jost (2006. 𝒒 = 𝟏 (pointillés longs) : logarithme naturel .6 0.2 0. d’où son nom « entropie HCDT » (voir Mendes et al. la courbe est une droite . 2008. L’entropie d’ordre 𝑞 s’écrit : 𝑥+𝑦 𝑥 = 𝑒𝑞 𝑒𝑞 𝑦 1+(1−𝑞 )𝑥 (49) . Son biais d’estimation peut être corrigé globalement. après introduction du formalisme adapté (les logarithmes déformés). Enfin. 𝒒 = 𝟐 (pointillés courts) : la courbe a la même forme que le logarithme naturel pour les valeurs positives de 𝒒 .. le logarithme déformé est subadditif : lnq (𝑥𝑦) = lnq 𝑥 + lnq 𝑦 − (𝑞 − 1)�lnq 𝑥��lnq 𝑦� (47) Ses propriétés sont les suivantes : Logarithmes déformés L’écriture de l’entropie HCDT est largement simplifiée en introduisant le formalisme des logarithmes déformés (Tsallis. Figure 22 : Valeur du logarithme d’ordre 𝒒 de probabilités entre 0 et 1 pour différentes valeurs de 𝒒 : 𝒒 = 𝟎 (trait plein). 𝒒 = −𝟏 (pointillés alternés) : la courbe est convexe pour les valeurs négatives de 𝒒. L’indice de Gini-Simpson est 2𝐻 . Le logarithme d’ordre 𝑞 est défini par : 𝑥 1−𝑞 − 1 lnq 𝑥 = 1 − 𝑞 (45) 1 = −𝑥 𝑞−1 lnq 𝑥 𝑥 lnq (𝑥𝑦) = lnq 𝑥 + 𝑥 1−𝑞 lnq 𝑦 𝑥 𝑥 1−𝑞 lnq � � = lnq 𝑥 − � � lnq 𝑦 𝑦 𝑦 lnq (48) Et : 𝑒𝑞 Le logarithme déformé converge vers le logarithme naturel quand 𝑞 → 1 (Figure 22). lim𝑥→+∞ �lnq 𝑥� = 1⁄(𝑞 − 1). Shannon.0 Entropie HCDT L’entropie HCDT est particulièrement attractive parce que sa relation avec la diversité au sens strict est simple. Ces fonctions sont implémentées dans le package entropart : lnq(x. Sa fonction inverse est l’exponentielle d’ordre 𝑞 : 36 Pour 𝑞 > 1. et non seulement pour les cas particuliers (nombre d’espèces. L’indice de Shannon est 1𝐻 . page 451 pour un historique complet) : 𝑞 𝑥 𝑒𝑞 = [1 + (1 − 𝑞 )𝑥 ]1−𝑞 1 (46) Tsallis a montré que les indices de Simpson et de Shannon étaient des cas particuliers d’entropie généralisée. 1994). 2007).Mesures de la biodiversité notamment par Daróczy (1970). q).8 1. Là encore : ● ● ● 1 𝑞 𝐻 = �1 − � 𝑝𝑠 � 𝑞 − 1 𝑠=1 𝑆 (44) 0 lnq(p) -10 0. Le biais d’échantillonnage est sensible (voir page 30). 2 𝐷 est l’inverse de l’indice de concentration de Gini-Simpson donne moins d’importance aux espèces rares. En conséquence.P(Ps. de même niveau de diversité 𝐷. celle du collectionneur qui considère que l’existence d’une espèce supplémentaire a un intérêt en soi. submitted). comme l’entropie de Rényi en est le logarithme naturel. Le biais d’échantillonnage est incontrôlable : l’espèce la plus rare n’est pas dans l’échantillon tant que l’inventaire n’est pas exhaustif.1.5 > Tsallis. Hoffmann et Hoffmann (2008) critiquent cette définition totalitaire 9 et fournissent une revue historique plus lointaine sur les origines de ces mesures. Il est bien adapté à une approche patrimoniale. ∞ 𝐷 = 1⁄𝑑 est l’inverse de l’indice de Berger-Parker (Berger et Parker. En raison de leurs propriétés.P de la librairie entropart : > Ps <. les nombres de Hill respectent le principe de réplication (Chao et al.colSums(BCI)/sum(BCI) > q <. 2010. Comme les espèces rares sont difficiles à échantillonner.715954 𝑞 communauté. Jost (2007) les appelle « vraie diversité ». 𝑞 𝑞 ● 𝐻 = lnq 𝐷 = 𝑒𝑞 𝑞 𝐻 𝑞 𝐷 (51) L’entropie est utile pour les calculs : la correction des biais d’échantillonnage notamment. section 3 pour une discussion et un historique) : si 𝐼 communautés de même taille. le biais d’échantillonnage est très petit (page 31). par exemple parce qu’elle peut contenir une molécule valorisable. qui donne plus ou moins d’importance aux espèces rares : ● Entropie et diversité On voit immédiatement que l’entropie de Tsallis est le logarithme d’ordre 𝑞 du nombre de Hill correspondant. Mesures neutres de la diversité 𝛼 ou 𝛾 L’intérêt de ces approches est de fournir une définition paramétrique de la diversité. Quoiqu’il en soit. Hill (1973) l’appelle « le nombre d’espèces très abondantes ». Les nombres de Hill. Il est adapté à une approche d’écologue. quel que soit leur effectif en termes d’individus. ou « nombres d’espèces équivalentes » ou « nombres d’espèces efficaces » permettent une appréhension plus intuitive de la notion de biodiversité (Jost. et sa résolution a généré une littérature en soi (voir page 13 et suivantes).. q) [1] 1. 1970) 37 −∞ . mais sans espèces en commun sont regroupées dans une métaJost (2009) reconnaît qu’un autre terme aurait pu être choisi (« diversité neutre » ou « diversité mathématique » par exemple). 9 ● ● ● 𝐷 = 1�min(𝑝𝑆) est l’inverse la proportion de la communauté représentée par l’espèce la plus rare (toutes les autres espèces sont ignorées).𝑞 𝐻 = 𝑞 − � 𝑝𝑠 𝑠 lnq 𝑝𝑠 (50) Cette forme est bien plus simple que celle de l’équation (44) et s’interprète comme une généralisation de l’entropie de Shannon (Marcon et al. intéressé par les interactions possibles : le nombre de combinaisons d’espèces en est une approche satisfaisante. Le calcul de 𝐻 peut se faire avec la fonction Tsallis. 0 𝐷 est le nombre d’espèces (alors que 0𝐻 est le nombre d’espèces moins 1) est la mesure classique qui donne le plus d’importance aux espèces rares : toutes les espèces ont la même importance. 1 𝐷 est l’exponentielle de l’indice de Shannon donne la même importance à tous les individus. le biais d’échantillonnage est très important. 2006). la diversité de la métacommunauté doit être 𝐼 × 𝐷. et influent peu sur l’indice. notamment de décomposition (voir le chapitre suivant).. Il comptabilise les interactions possibles entre paires d’individus : les espèces rares interviennent dans peu de paires. N(colSums(BCI). contrairement aux estimateurs des probabilités.N et Diversity. L’estimateur est 𝑞 � linéaire par rapport à 𝑝 𝑠 : le problème est donc résolu par la construction de 𝑞 l’estimateur non biaisé de 𝑝𝑠 . 1988) parce que 𝑞𝐻 .colSums(BCI)/sum(BCI) > q <.Mesures de la biodiversité Le calcul de 𝑞𝐷 peut se faire avec la fonction Diversity.5 > Diversity. Un compromis raisonnable consiste à utiliser le plus grand des deux estimateurs.P(Ps. Celle de Grassberger (1988) qui prend en compte la non-linéarité de l’estimateur. Quand 𝑞 est grand (au-delà de 2).57724 qui est la proportion de la communauté représentée par l’espèce la plus abondante : 𝑑 = max(𝑝𝑆 ). les espèces rares non observées ont une grande importance alors que 𝑞𝐻 est presque linéaire : la correction de Grassberger disparaît quand 𝑞 = 0. q=1) [1] 4.99514 Biais d’échantillonnage La correction du biais d’échantillonnage pour l’entropie HCDT repose sur deux approches : ● ● Celle de Chao et Shen (2003). Le domaine de validité des deux corrections est différent.P de la librairie entropart : > Ps <. L’estimateur de Chao et Shen est : � = −� 𝐻 ≥1 Celui de Grassberger est : � 1 − ∑𝑠=1 𝑝 𝑠 �= 𝐻 𝑞 − 1 𝑞 � Où 𝑝 = 𝑛 −𝑞 � 𝑠 𝑞 𝑠 𝑠 ≥1 ̂ 𝑝̂𝑠 � 1 − �1 − 𝐶 𝑠=1 𝑠 ̂ 𝑝̂𝑠 lnq �𝐶 ̂ 𝑝̂𝑠 � 𝐶 𝑛 (52) Γ(⋅) est la fonction gamma. Les fonctions Tsallis. q=1) [1] 71. l’entropie. Toutes les autres espèces sont ignorées.. La conversion de l’estimateur débiaisé de l’entropie en estimateur de la diversité pose un nouveau problème puisque 𝑞𝐷 n’est pas une transformation linéaire de 𝑞𝐻 . étendue audelà de l’entropie de Shannon (Marcon et al. 38 Γ(𝑛𝑠 −𝑞+1) Γ(𝑛𝑠 +1) + (−1)𝑛 Γ(1+𝑞 ) sin 𝜋𝑞 𝜋(𝑛+1) (53) � . submitted) qui prend en compte les espèces non observées. q) [1] 49.N(colSums(BCI).1. Ce dernier biais peut être négligé (Grassberger.276599 > Diversity. l’influence des espèces rares est faible. Quand 𝑞 est petit.N de entropart acceptent comme argument un vecteur d’abondances (et non de probabilités) et proposent par défaut la correction combinant Chao et Shen et Grassberger > Tsallis. est la valeur moyenne de l’information de nombreuses espèces indépendantes et fluctue donc peu à cause de l’échantillonnage. la correction de Chao et Shen devient négligeable alors que la non-linéarité augmente. = 𝑘𝐷 �1 − �1 − 𝑘𝐷 1 �� 𝑘 (55) Dans deux cas particuliers.seq <. les nombres équivalents d’espèces de Hurlbert sont identiques aux nombres de Hill : 2𝐷 = 2𝐷 et 0 ∞𝐷 = 𝐷 . 1995).0 0. 2. 10 50 L’équation doit être résolue pour obtenir 𝑘𝐷 à partir de la valeur de 𝑘𝑆 estimée.5 2.seq. . main="") Hurlbert fournit un estimateur non biaisé de son indice (𝑛 est la taille de l’échantillon. (2012) ont développé un test statistique pour comparer la diversité de deux communautés pour plusieurs valeurs de 𝑞 simultanément. il n’y a pas de relation d’ordre (Tothmeresz. L’indice peut être converti en nombre équivalent d’espèces (Dauby et Hardy. Une communauté peut être déclarée plus diverse qu’une autre si son profil de diversité est au-dessus de l’autre pour toutes les valeurs de 𝑞 . Si les courbes se croisent. N=Ns.N(N.0 Chaque terme de la somme est la probabilité d’observer au moins une fois l’espèce correspondante. 39 � = � �1 − � 𝑠=1 𝑆 𝑛 − 𝑛𝑠 𝑘 ��� �� 𝑘 𝑛 (56) . L’augmentation de la valeur de 𝑘 permet de donner plus d’importance aux espèces rares. function(q. 𝑛𝑠 le nombre d’individus de l’espèce 𝑠) : 𝑘𝑆 Dauby et Hardy (2012) montrent que cet estimateur est très peu sensible à la taille de l’échantillon. La correction du biais d’échantillonnage est la plus grande de Chao-Shen et Grassberger. Leinster et Cobbold (2011). q. type="l". Tothmeresz (1995) et Kindt et al. Pallmann et al. et obtient de meilleurs résultats sur ce point que les estimateurs de Chao et Shen pour l’indice de Shannon ou du nombre d’espèces. x=q.5 1. (2006). lwd=2. col="black". numériquement pour 𝑘 > 3.seq(0. c'est-à-dire la valeur de la diversité 𝑞𝐷 en fonction de l’ordre 𝑞 (Figure 23) pour comparer plusieurs communautés.1) > Ns <. après Patil et Taillie (1982). Correction="Best") > plot(y=UBdiversity. Correction).Profils de diversité Indice de Hurlbert Définition Mesures neutres de la diversité 𝛼 ou 𝛾 200 L’indice de Hurlbert (1971) est le nombre d’espèces observées dans un échantillon de taille 𝑘 choisie : 𝑘 𝑘 𝑆 = �[1 − (1 − 𝑝𝑠 ) ] 𝑠=1 𝑆 Diversité 100 150 (54) 0. Biais d’échantillonnage Code R : > q. xlab="q". ylab="Diversité".colSums(BCI) > UBdiversity <. N. Correction) Diversity. recommandent de tracer des profils de diversité. 2012) notés 𝑘𝐷 à partir de la relation : 𝑘𝑆 Figure 23 : Profil de diversité 10 calculé pour BCI.sapply(q.0 q 1.seq. Mesures de la biodiversité Le calcul de la diversité de Hurlbert est possible avec le logiciel BiodivR 11 (Hardy. lity pouvant être utilisé dans un sens plus large) : 𝑞 Équitabilité La régularité d’une distribution est une notion intuitivement assez simple : la faiblesse de l’écart entre la distribution réelle et une distribution parfaitement régulière. Invariance d’échelle : l’équitabilité ne dépend que des fréquences. vérifiant 𝑝𝑠 = 1⁄𝑆 (Lloyd et Ghelardi. construite en classant les espèces de la moins fréquente à la plus fréquente. 1996 . Une revue critique en est faite par Tuomisto (2012) qui argumente en faveur d’une définition stricte de l’équitabilité (evenness en Anglais. D’autres mesures d’équitabilité existent (Smith et Wilson. http://ebe. 2010). Les espèces sont classées par fréquence croissante. La valeur maximale de l’indice de Shannon est obtenue quand la distribution est parfaitement régulière. Cette définition respecte tous les critères de Dalton (1920) : ● 𝐸 = 𝑞 0𝐷 𝐷 (58) Une expression de l’équitabilité est souvent donnée à partir de l’indice de Shannon (Lloyd et Ghelardi. Ricotta.. equitabi11 Figure 24 : Courbes de Lorenz de plusieurs jeux de données.ac. Ils observent que l’équitabilité est minimale pour une valeur particulière de 𝑞 qu’ils notent 𝑞 ∗ et explo∗ rent les propriétés de 𝐸𝑞∗ et 𝑞 𝐻 . et en traçant le cumul des fréquences en fonction du rang (Figure 12) : une communauté parfaitement équitable est représentée par la bissectrice. La limite de cette approche est l’absence de correction des biais d’échantillonnage et surtout la mauvaise définition de l’équitabilité (voir cidessous). 1975). 2003). Ricotta et al. L’équitabilité diminue quand une espèce rare est ajoutée. et la courbe représente la fréquence cumulée des espèces. plus le jeu de données est inéquitable. parfois appelé « indice de Pielou » : 𝐸𝐻 = 𝐻𝑚𝑎𝑥 𝐻 (57) ● ● ● Invariance par duplication : l’équitabilité ne change pas si chaque espèce est remplacée par plusieurs nouvelles espèces ayant la même abondance. 2001 . Plus la courbe est loin de la bissectrice. Pielou. c'est-à-dire la valeur de 𝐸𝑞 en fonction de 𝑞 . 1964). On a donc défini l’indice. 1964 . Mendes et al. pas des abondances absolues. L’équitabilité d’ordre 𝑞 est le rapport de la diversité d’ordre 𝑞 sur la richesse. (2008) généralisent l’indice de Pielou en remplaçant l’indice de Shannon par l’entropie de Tsallis (ils définissent 𝐸𝑞 = 𝑞𝐻⁄ 𝑞𝐻𝑚𝑎𝑥 ) et tracent des profils d’équitabilité.html Un critère supplémentaire établi par Smith et Wilson (1996) est la compatibilité avec la courbe de Lorenz (1905). 𝐸𝐻 est compris entre 0 (une seule espèce a une probabilité de 1) et 1 (toutes les espèces ont la même probabilité). la surface entre la courbe réelle et la bissectrice est très utilisée en économie pour mesurer l’inégalité sous le nom d’« indice de Gini » 40 .ulb. Figure extraite de Tuomisto (2012). 1966a. Alors : 𝐻𝑚𝑎𝑥 = ln𝑆. L’équitabilité diminue quand un individu est transféré d’une espèce rare à une espèce fréquente.be/ebe/Software. 1912 . 2012) mais n’est pas compatible avec la courbe de Lorenz et n’est pas invariant par duplication parce qu’il ne normalise pas une diversité mais une entropie. Une mesure d’équitabilité compatible doit être plus grande pour une communauté si sa courbe de Lorenz est plus proche de la bissectrice. Mesures neutres de la diversité 𝛼 ou 𝛾 41 . l’ordre de leurs équitabilités est imprévisible. L’utilisation de 𝑞𝐸 est donc bien préférable. Ceriani et Verme. 2012). L’indice de Pielou est le plus utilisé dans la littérature (Tuomisto. 1𝐸 = 𝑒 𝐻 ⁄𝑆 remplaçant avantageusement 𝐸𝐻 .(Gini. Si les courbes de deux communautés se croisent. . Des exemples montrent comment calculer cette diversité. 2010a). (2012). 2010 . 2010 . 𝑤𝑖 : poids de la communauté 𝑛 : nombre total d’individus échantillonnés 43 . > Paracou618. conclu par Chao et al. en relation avec les changements de milieu. p. Simp𝑞 son) et diversité leur nombre équivalent 𝐷. 2010b). 2010). … Total : méta-communauté 𝑛𝑠𝑖 : nombre d’individus de l’espèce 𝑠 dans la Espèce 𝒔 𝑝̂𝑠𝑖 = 𝑛𝑠𝑖 ⁄𝑛+𝑖 est l’estimateur de la probabilité 𝑝𝑠𝑖 qu’un individu de la communauté 𝑖 soit de 𝑛𝑠+ = � 𝑛𝑠𝑖 𝑝𝑠 = � 𝑤𝑖 𝑝𝑠𝑖 𝑖 𝑖 … Total 𝑛+𝑖 : nombre d’individus de la communauté. 2010 . 2010 . Veech et Crist. appartenant à une méta. et une revue a été faite par Tuomisto (2010a. les individus seront échantillonnés dans des communautés. Jost. l’espèce 𝑠. 2010 . Wilsey. Tuomisto (2010a) passe en revue l’ensemble des définitions de la diversité 𝛽 dans un article ardu mais très complet.MC. La traduction de cette notion intuitive en une définition sans ambiguïté est encore une question de recherche et de débats. Les parcelles de Paracou sont dans l’objet Paracou618. Le Tableau 2 résume les notations. principalement à l’aide du package entropart. Dans la littérature.MC Pour simplifier l’exposé. qui est généralement une des mesures vues dans le chapitre précédent. Ricotta. d’où un abondant débat sur l’indépendance souhaitée mais pas toujours observée entre les valeurs de diversité 𝛼 et 𝛽 (Baselga. 2010a. ou le degré de différentiation des communautés. 2010). appliquée à la diversité 𝛾. Jost. 2010b . Communauté 𝒊 communauté 𝑖. Toutes ont en commun : ● Définitions de la diversité 𝛽 Enfin. Le package contient les données d’inventaire de deux hectares du dispositif de Paracou : > library(entropart) > # Chargement du jeu de données > data(Paracou618) Les données sont organisées dans le package sous la forme d’un objet MetaCommunity qui contient notamment la matrice des 𝑛𝑠𝑖 .communauté. la diversité 𝛽 est toujours une mesure dérivée (Ellison. toute ambiguïté sera évitée en appelant entropie les indices de diversité qui sont 𝑞 des mesures d’entropie 𝐻 (Shannon. Une définition de la mesure de diversité. c'est-àdire calculée à partir des diversités 𝛼 et 𝛾. 320) comme le niveau de changement dans la composition des communautés. Veech et Crist.DIVERSITÉ 𝛽 ET DÉCOMPOSITION La notion de diversité 𝛽 a été introduite par Whittaker (1960. Un forum a été consacré à la question dans Ecology (Baselga. Enfin. La diversité de différentiation (differentiation diversity). De façon équivalente. notée 𝛽 et une composante intragroupes notée 𝛼 . Sa décomposition est détaillée cidessous. respecte finalement tous les critères imposés ou souhaités. Marcon et al. indépendamment de toute référence hors de la communauté. Une revue sur les avantages de la décomposition additive est proposée par Veech et al. ● Marcon et al. notée 𝛾 en une composante intergroupes. L’indice de Shannon. toutes les diversités étant positives ou nulles. C’est également une diversité proportionnelle. qui traite des données récoltées sur une unité spatiale. Il a posé le principe que la diversité 𝛾 devait être le produit des diversités 𝛼 et 𝛽 . le nombre d’espèces efficaces dans les communautés. 1972) est l’auteur de ce concept. 2012). Une définition de la diversité 𝛼. De cette façon.Mesures de la biodiversité ● ● L’utilisation des nombres de Hill. Il note que « la partition serait plus facilement interprétable si les différentes composantes de la diversité pouvaient être exprimés au moyen de la même formule » (ce qui n’est en fait jamais le cas). la mesure locale de la diversité 𝛼 et la définition de la diversité 𝛽 comme rapport des diversités 𝛾 et 𝛼 permet de définir la « vraie diversité » (Jost. Tuomisto (2011) milite pour que le terme diversité soit réservé à la vraie diversité (homogène à un nombre d’espèces) et que les autres mesures soient appelées différemment : « entropie » de Shannon ou « probabilité » de GiniSimpson notamment. 2007) 𝛽 qui est un nombre de communautés équivalentes (compositionnal units) similaire au nombre d’espèces équivalentes des diversités 𝛼 et 𝛾. il est possible de définir une diversité totale égale 44 Whittaker (1960. diversité 𝛽 qui se construit par différence ou rapport des diversités 𝛾 et 𝛼 . 2010 . qui mesure à quel point les unités spatiales sont différentes. (2002). (submitted) généralisent ce résultat à toutes les mesures La diversité d’inventaire (inventory diversity). principalement dû à la transformation logarithmique (Jost. comme toutes les mesures passées en revue par Tuomisto : la diversité de Shannon permet d’unifier les deux approches. Une façon de combiner les diversités 𝛾 et 𝛼 pour obtenir la diversité 𝛽 . (2012) montrent que l’entropie de Shannon 𝐻𝛽 est une mesure de diversité de différentiation en donnant sa définition indépendamment de 𝐻𝛼 et 𝐻𝛾 . Lande (1996) a une approche additive et postule que les mesures de diversités doivent être concaves : la diversité d’un jeu de données regroupant plusieurs communautés doit être supérieure ou égale à la somme pondérée des diversités dans chaque communauté. à des définitions imprécises et des démonstrations empiriques remises en question (Baselga. ce qui correspond à la définition de la diversité 𝛽 donnée plus haut La diversité proportionnelle (proportional diversity). couplé à son expression sous forme de nombre de Hill.. 2010a). . ce qui correspond à la définition des diversités 𝛼 et 𝛾. par exemple : 𝛽 = 𝛾 ⁄𝛼 𝛽 = 𝛾 − 𝛼 à la somme pondérée des diversités 𝛼 (intracommunautés) et 𝛽 (inter-communautés). qui peut être par exemple : La diversité locale mesurée dans chaque communauté. Il reste que la décomposition multiplicative permet seule la définition de la diversité 𝛽 en tant que vraie diversité (Chao et al. Jurasinski et al. 2006). Un débat assez stérile est découlé de l’opposition entre les deux approches. (2009) distinguent plusieurs types de mesures de diversité : ● ● Le débat sur la décomposition L’objectif est de décomposer la diversité totale. 2006. Veech et Crist. Les diversités 𝛼 et 𝛾 sont les compléments à ln𝑆 des indices de dissimilarité de Theil (39). La décomposition ou le regroupement peuvent être effectués sur un nombre quelconque de niveaux. sans rapprochement avec l’indice de Shannon. c'est-à-dire la proportion d’espèces partagées en moyenne par une communauté. qui fourniraient la même valeur de diversité 𝛽 . contenaient chacune 𝑆 espèces équifréquentes. 𝐴/𝑆 serait cet indice de chevauchement. appelée divergence de Jensen-Shannon (Lin. sans la relier à celle de 𝐻𝛼 et 𝐻𝛾 . La forme de 𝐻𝛽 avait été établie par Ricotta et Avena (2003). l’idée de la décomposition de la divergence de Kullback-Leibler. L’indice de chevauchement 𝐶𝑞𝑁 Cette mesure n’a de sens que comparée nombre de communautés (noté 𝑁 ici et non I pour conserver le nom de l’indice établi dans la littérature). Chao et al. la diversité 𝛾 du niveau inférieur devenant diversité 𝛼 pour le niveau supérieur. Enfin. a été publiée par Ludovisi et Taticchi (2006). 45 La mesure de diversité 𝑞𝐷𝛽 est le nombre équivalent de communautés totalement distinctes qui fourniraient le niveau de diversité 𝑞 𝐷𝛽 . 𝑞 𝐷𝛾 = 𝑞𝐷𝛼 𝑞𝐷𝛽 (59) 𝐶𝑞𝑁 a été défini à l’origine pour 𝑞 ≥ 2. dont 𝐴 seraient communes à toutes les communautés et les autres représentées .. (2012) l’étendent sans précaution à 𝑞 quelconque. (2008) définissent un indice de chevauchement. mais avec une approche différente. 𝑞 𝐷𝛽 est le « nombre de communautés efficaces » ou « nombres de communautés équivalentes ». ∑𝑗≠𝑖 𝑝𝑠𝑗 1 𝑝𝑠𝑖 = �� ln �1 + � ln𝑁 𝑁 𝑝𝑠𝑖 𝑠=1 𝑖=1 𝐻𝛽 =1− ln𝑁 𝐼 (61) Décomposition de l’indice de Shannon La décomposition explicite (Tableau 3) est due à Marcon et al. (2012) : la diversité 𝛽 est la divergence de Kullback-Leibler entre la distribution des espèces dans chaque parcelle et la distribution moyenne. Les méta-communautés peuvent à leur tour être regroupées à un niveau supérieur. 2012) : 𝐶𝑞𝑁 = �� 𝑞 1 � 𝐷𝛽 𝑆 𝑞−1 Diversité 𝛽 et décomposition Décomposition multiplicative de la diversité Jost (2007) et Chao et al. divergences de Kullback-Leibler entre les distributions des espèces et leur équiprobabilité. Sa valeur peut être négative pour 𝑞 < 1. Plutôt qu’une simple normalisation suggérée par Jost (2007). Si les 𝑁 communautés de mêmes diversités 𝛼 et 𝛾 que les données. page 35). c'est-à-dire le nombre de communautés de poids égal ne possédant aucune espèce en commun. Pour 𝑞 ≠ 1 (Chao et al. on se limitera donc à 𝑞 ≥ 1. Chao et al.de diversités dérivées de l’entropie généralisée de Tsallis. Ce sont des nombres équivalents d’espèces (cf. dans une seule. 1991). (2012) ont montré que la décomposition des nombres de Hill en éléments indépendants est multiplicative : 𝑞 Et : 𝐶1𝑁 1 𝑞−1 1 𝑞−1 − � � ���1 − � � � 𝑁 𝑁 (60) 𝐷𝛼 et 𝑞𝐷𝛾 sont les nombre de Hill d’ordre 𝑞 égaux aux diversités 𝛼 et 𝛾. 4471751 0.MC(Paracou618. et les valeurs extrêmes sont éliminées. Correction = "None") $Communities P006 P018 0. observée de 𝐻 en général au-delà de la borne supérieure.5771645 $Total [1] 0. 𝒏𝒔𝒊 ⁄𝒏+𝒊 ) et 𝐻 La simulation est répétée un grand nombre de fois.4514132 $Total [1] 0. > # Pas de correction du biais d’échantillonnage > BetaEntropy. les 251ème et 9750ème valeurs simulées définissent les bornes de l’intervalle de confiance de l’hypothèse nulle. dont les différences ne sont que des fluctuations dues au hasard. q=1.MC. le taux de couvercommunauté 𝑖 est noté 𝐶 ̂ . q=1.Mesures de la biodiversité Indice 𝑯𝜶 Distribution observée Fréquence des espèces dans la communauté Distribution attendue Fréquences égales. Les indices 𝑯𝜶 et 𝑯𝜸 sont les compléments au logarithme du nombre d’espèces de cette divergence. par exemple 10 000. Il peut arriver que les deux communautés soient plus semblables que sous l’hypothèse 46 . Au seuil de risque 𝛼 = 5%.MC applique cette correction : > BetaEntropy. 𝑯𝜸 Fréquence des espèces dans la méta-communauté Fréquences égales.2949188 0. L’estimateur sans biais de 𝐻 𝛽 ture total 𝐶 𝑖 est : ̂𝑖 𝑛𝑠𝑖 𝐶 𝑛 𝑛+𝑖 ̂ 𝑠𝑖 ̂ ≥1 𝐶𝑖 𝑛 ln 𝑛𝑠+ 𝑆 ̂ +𝑖 𝐶 𝑛 �𝑖𝛽 = � 𝐻 𝑛𝑠𝑖 𝑛 ̂ 𝑖=1 1 − �1 − 𝐶𝑖 𝑛 � +𝑖 (62) ● Tous les estimateurs de diversité doivent être débiaisés (voir page 31).MC.3499358 0. Le test est réalisé de la façon suivante : ● Biais d’échantillonnage L’estimateur du taux de couverture de la ̂𝑖 . hors formule Formule �𝑖𝛼 = − � 𝑝̂𝑠𝑖 ln𝑝̂𝑠𝑖 𝐻 �𝛼 = � 𝑤𝑖 𝐻 �𝑖𝛼 𝐻 𝑖 𝑠 𝑠 𝑯𝜷 Fréquence des espèces dans la communauté Fréquence totale des espèces �𝑖𝛽 = � 𝑝̂𝑠𝑖 ln 𝐻 𝑖 Tableau 3 : Définition explicite de la diversité de Shannon en tant que divergence entre une distribution observée et une distribution attendue.MC calcule l’entropie 𝛽 de la métacommunauté (l’argument 𝑞 = 1 permet de choisir l’entropie de Shannon). ℳ (𝑛+𝑖 . Sous l’hypothèse nulle. hors formule �𝛾 = − � 𝑝̂𝑠 ln𝑝̂𝑠 𝐻 𝑠 �𝛽 = � 𝑤𝑖 𝐻 �𝑖𝛽 𝐻 𝑝̂𝑠𝑖 𝑝̂𝑠 Calcul sous R : La fonction BetaEntropy.MC(Paracou618. les observations 𝑞 �𝑠𝑖 sont des réalisations des mêmes probabilités 𝑝𝑠 . Correction="ChaoShen") $Communities P006 P018 Les effectifs de chaque communauté 𝑖 sont tirés dans une loi multinomiale �𝛽 est calculé. Calcul sous R : BetaEntropy. L’hypothèse nulle est rejetée si la valeur �𝛽 n’est pas dans cet intervalle.3618884 Tests Test de significativité L’objectif est de tester si deux communautés ne sont pas simplement deux échantillons d’une même communauté. Si l’intervalle de confiance ne contient pas 0. Correction des biais Diversité 𝛽 et décomposition Intervalle de confiance de 𝐻𝛽 L’intervalle de confiance de l’estimateur de 𝐻𝛽 peut être calculé de la même manière en simulant les communautés par des tirages dans des lois multinomiales suivant leurs fréquences : ℳ (𝑛+𝑖 . Calcul sous R : la fonction DivEst produit un graphique avec l’intervalle de confiance : > DivEst(q = 1. c'est-à-dire que les fréquences varient moins que dans le tirage d’une loi multinomiale. Décomposition de l’entropie généralisée La décomposition additive de l’entropie selon Lande (1996) doit être la suivante : 𝑞 Density 10 15 0 1. Lorsque les données sont issues de communautés réelles. Deux façons de pondérer la somme émergent de la littérature (Chao et al. souvent choisi égal au nombre d’individus de la communauté divisé par le nombre total ou à la surface de chaque groupe. (2012) effectuent la deuxième correction par un recentrage de la distribution de 𝐻𝛽 simulée autour de sa valeur observée débiaisée. tant que 𝑝𝑠 = ∑𝑖 𝑤𝑖 𝑝𝑠𝑖 . La distribution de l’estimateur sous l’hypothèse nulle ne peut pas être débiaisée complètement : elle est systématiquement surestimée. La diversité 𝛼 est la somme pondérée des diversités 𝛼 des groupes constituant la population totale. La correction du biais des tirages recentre leur distribution autour des valeurs originales des communautés non débiaisées. Graphic = TRUE) Beta Diversity Les simulations nécessaires aux tests créent un biais d’échantillonnage : les espèces les plus rares dans les communautés souvent éliminées par les tirages. l’égalité des distributions est rejetée. DivEst corrige les biais. 1986) : les communautés réelles ne pouvant pas être exactement identiques. mais qui peut être arbitraire.nulle. La définition classique est selon Routledge (1979) : 𝐻𝛾 = 𝑞𝐻𝛼 + 𝑞𝐻𝛽 5 (63) 47 . le sens même de ce type de test est remis en question (Jones et Matloff. ce qui permet d’obtenir l’intervalle de confiance de l’estimateur de 𝐻𝛽 .50 1. 2012). Paracou618. 𝒏𝒔𝒊 ⁄𝒏+𝒊 ).MC.60 Diversity 1. Le poids de chaque groupe est 𝑤𝑖 .. Simulations = 1000. la valeur attendue en cas d’égalité des communautés est 1.65 Par défaut. Marcon et al. Les résultats sont présentés sous forme de diversité et non d’entropie. Il n’existe pas de correction analytique pour corriger successivement le biais dû aux simulations (dû à la perte des espèces rares des communautés réelles) puis celui dû à l’échantillonnage des communautés elles-mêmes (dû à la nonobservation des espèces rares de la communauté). si deux communautés ont été créées artificiellement avec le même nombre d’individus de chaque espèce par exemple. il suffit d’augmenter la taille de l’échantillonnage pour prouver leur différence.55 1. qu’il note 𝐻𝐵 . La population totale étant partitionnée. submitted) permet de décomposer la diversité d’ordre quelconque quel que soit le poids des communautés. De même. doit avoir la même forme pour la diversité 𝛽 . la composante intra-groupe de la mesure 𝐻𝛼 est égale à la somme pondérée des mesures dans chaque-groupe 𝐻𝛼 = ∑𝑖 𝑤𝑖 𝐻𝑖𝛼 . La remise en cause de ce postulat (Marcon et al. La composante intergroupe 𝐻𝛽 est la mesure d’inégalité entre les groupes. La décomposition n’est pas additive. mais 𝐻𝐵 est indépendant de l’entropie 𝛼. Jost désigne sous le nom de « composante 𝛽 de l’entropie » le logarithme d’ordre 𝑞 de la diversité. Bourguignon (1979) comme Lande (1996) définissent une mesure d’inégalité décomposable comme respectant les propriétés suivantes : ● 𝑤 𝑞 𝐷𝛼 = �� � 𝑖 𝑞 𝑝𝑠𝑖 � ∑𝑖 𝑤𝑖 𝑠 1⁄(1−𝑞 ) (65) Ceci est la décomposition de Jost (2007). mais son utilisation ne garantit pas que la diversité 𝛾 soit supérieure à la diversité 𝛼 si les poids des communautés ne sont pas égaux. La seconde.Mesures de la biodiversité 𝑞 𝑞 𝐻𝛼 = � 𝑤𝑖 𝑖𝐻𝛼 𝑖 𝑠 𝑖 𝑞 La pondération proposée par Jost (2007) est : 𝑞 𝑞 𝐷𝛼 = �� � 𝑤𝑖 𝑝𝑠𝑖 � 𝑤𝑖 𝑞 𝐻 ∑𝑖 𝑤𝑖𝑞 𝑖 𝛼 𝑞 𝑖 𝑞 𝑞 1⁄(1−𝑞 ) (64) 𝑞 𝐻𝛼 = � 𝑖 La première est la pondération naturelle. équation (59) : 𝐻𝛾 = − � 𝑝𝑠 𝑠 Sa fonction d’information a été tracée Figure 21. Pour 𝑞 différent de 1. L’entropie 𝛽 est : 𝑞 𝑖𝐻𝛽 𝑝𝑠 − 1 𝑞 − 1 𝑞−1 (69) = � 𝑝𝑠𝑖 𝑠 𝑝𝑠𝑖 𝑞−1 − 𝑝𝑠 𝑞 − 1 𝑞−1 (70) 48 . résumée dans le Tableau 4. définie pour la diversité 𝛼. La mesure totale 𝐻𝛾 est la somme des mesures intra et intergroupes.. qui pondère par les poids à la puissance 𝑞 . présente des avantages détaillés par Chao et al. Jost (2007) montre que l’indice de Shannon est le seul pouvant être décomposé de cette façon. La décomposition de l’entropie est faite en écrivant le logarithme d’ordre 𝑞 de la décomposition de la diversité. Il est intéressant d’écrire 𝑖 𝐻𝛽 et 𝑞𝐻𝛾 sous la forme d’entropies. 𝐻𝛾 = 𝐻𝛼 + lnq 𝐷𝛽 𝑞 𝑞 − (𝑞 − 1)� 𝐻𝛼 ��lnq 𝐷𝛽 � 𝑞 𝑞 (66) Les deux derniers termes peuvent être regroupés et réarrangés pour obtenir 𝑞𝐻𝛽 conformément à la décomposition additive de l’équation (63) : 𝑞 𝐻𝛽 = � 𝑤𝑖 � 𝑝𝑠𝑖 lnq 𝑖 𝑠 𝑞 L’entropie 𝛽 est la somme pondérée par 𝑤𝑖 (et pas autrement) des contributions de chaque communauté : 𝑞 𝑖𝐻𝛽 𝑝𝑠𝑖 𝑝𝑠 (67) ● ● En passant par les nombres de Hill. 1998). l’entropie 𝛾 est : 𝑞 𝑞 𝑖𝐻𝛽 = � 𝑝𝑠𝑖 lnq 𝑠 𝑞 𝑝𝑠𝑖 𝑝𝑠 (68) 𝑞 La démonstration de Jost repose sur le postulat que la transformation de l’entropie en nombre de Hill.. est une divergence de Kullback-Leibler généralisée (Borland et al. 𝑞𝐻𝛾 peut s’écrire sous la forme 𝑞 𝑞 𝐻𝛾 = − ∑𝑠 𝑝𝑠 ln𝑞 𝑝𝑠 : la formalisation de la décomposition est une généralisation de la décomposition de l’entropie de Shannon. page 34.. pour faire apparaître leur fonction d’information. chaque partition recevant un poids 𝑤𝑖 . L’entropie 𝜶 de chaque communauté se calcule comme l’entropie 𝜸. Paracou618. 2012) si les poids sont très inégaux.MC.3813489 $GammaEntropy [1] 4.518567 $TotalBetaEntropy [1] 0. l’entropie 𝛼 est la moyenne pondérée du nombre d’espèces des communautés moins un ( 0𝐻𝛼 = 𝑆̅ − 1).0175 $TotalAlphaEntropy [1] 4. ce qui complique son interprétation. En termes de diversité : 0 𝐷𝛽 peut être supérieur au nombre de communautés (Chao et al. GammaDiversity.899916 $CommunityAlphaEntropies P006 P018 4. 𝑝𝑠𝑖 𝑝𝑠 𝑞 𝐷𝛾 = 𝑞 𝑞 �� 𝑝𝑠 � 𝑠 1 1−𝑞 𝐷𝛽 = 𝑞𝐻 𝛽 1+(1−𝑞 ) 𝑞𝐻𝛼 𝑒𝑞 = 𝑒𝑞 𝑞𝐻 𝛾 Calcul sous R : Les fonctions AlphaEntropy. BetaEntropy.MC permettent de calculer les entropies et diversités.MC. L’entropie 𝛾 est le nombre d’espèces de la méta-communauté moins un ( 0𝐻𝛾 = 𝑆 − 1).672992 Décomposition du nombre d’espèces Les résultats généraux se simplifient pour 𝑞 = 0..MC. ce qui constitue pour Chao et al.6996 107. Biased = FALSE) $TotalAlphaDiversity [1] 91. GammaEntropy. un argument en faveur de son utilisation.403049 4.MC et AlphaDiversity.70413 $TotalBetaDiversity [1] 1.MC.MC.2786 $CommunityAlphaDiversities P006 P018 81. 0 𝐷𝛽 = 𝑆 𝑆̅ (71) 49 .464258 $GammaDiversity [1] 134.Diversité 𝛽 et décomposition Indice Shannon 1 Entropie 𝐻𝛾 = − � 𝑝𝑠 ln𝑝𝑠 𝑠 𝑖 𝑠 1 Diversité 𝐷𝛾 = 𝑒 1𝐻 𝛾 Entropie généralisée 𝑝𝑠𝑖 1 𝐻𝛽 = � 𝑤𝑖 � 𝑝𝑠𝑖 ln 𝑝𝑠 𝑞 𝑞 1 𝐷𝛽 = 𝑒 1𝐻 𝛽 𝐻𝛽 = � 𝑤𝑖 � 𝑝𝑠𝑖 lnq 𝑖 𝑠 𝐻𝛾 = − � 𝑝𝑠 lnq 𝑝𝑠 𝑠 𝑞 𝑞 Tableau 4 : Entropie et diversité. BetaDiversity. DivPart calcule tout en même temps : > DivPart(q = 1. l’entropie 𝛽 est la différence : 0𝐻𝛽 = 𝑆 − 𝑆̅. La pondération de Jost donne pour le nombre d’espèces le même poids à toutes les communautés et garantit 0𝐷𝛽 ≤ 𝐼 . 𝐸𝛽 n’est pas indépendant de 𝐸𝛼 : seule 50 . et son entropie 𝛽 . pour des raisons différentes.Mesures de la biodiversité Décomposition de l’indice de GiniSimpson L’entropie de Simpson peut aussi être décomposée comme une variance. somme pondérée des entropies 𝛼 des communautés. En génétique. décomposée en 𝐻𝑠 . Synthèse La diversité mesurée par l’entropie généralisée peut être décomposée dans tous les cas de figure. 1973). 𝐸𝛾 étant inférieur ou égal à 1. et la pondération de Jost se confond avec celle de Routledge. égale à la somme pondérée des distances 𝑙 2 entre la distribution des fréquences dans chaque communauté et celle de l’ensemble de la communauté. et Jost propose d’utiliser une transformation de 2𝐷𝛽 comme mesure de différentiation (voir page 45). Jost postule que la diversité 𝛽 de Simpson a la même relation à 𝐸𝛽 que les diversités 𝛼 et 𝛾 : 𝑞 𝐷𝛾 = 𝑞𝐷𝛼 𝑞𝐷𝛽 ⇔ 1 1 1 = 1 − 𝐸𝛾 1 − 𝐸𝛼 1 − 𝐸𝛽 (74) D’où une décomposition additive différente. l’égalité s’écrit 𝐻𝑡 = 𝐻𝑠 + 𝐷𝑠𝑡 (Nei. mais la contribution de chaque communauté est différente : la décomposition de la variance est une façon alternative de décomposer l’entropie. et Hill ne traitait pas la diversité 𝛽 . 𝐺𝑠𝑡 = 𝐷𝑠𝑡 ⁄𝐻𝑡 est la différentiation relative. L’entropie 𝐸𝛽 calculée de cette manière est égale à 2𝐻𝛽 calculée à l’équation (70) pour le cas général. y compris lorsque les poids des communautés ne sont pas égaux. La probabilité qu’un individu appartienne à l’espèce 𝑠 est 𝑝𝑠 . La décomposition entre variance intra et inter-communautés est : 𝑝𝑠 (1 − 𝑝𝑠 ) 𝑖 la décomposition multiplicative permet l’indépendance. et l’exponentielle de la décomposition additive (63) est la décomposition multiplicative (59). 𝐻𝑡 est l’hétérozygotie totale. où la probabilité est 𝑝𝑠𝑖 . l’hétérozygotie moyenne des populations et 𝐷𝑠𝑡 la différentiation absolue entre populations. Elle suit une loi de Bernoulli. L’entropie de Shannon est un cas particulier dans lequel toutes les controverses disparaissent : l’entropie 𝛽 est indépendante de l’entropie 𝛼. valable uniquement pour l’entropie de Simpson. son nombre de Hill est l’exponentielle de l’entropie. qui correspond à sa décomposition générale (66) : 𝐸𝛾 = 𝐸𝛼 + 𝐸𝛽 − 𝐸𝛼 𝐸𝛽 (75) = � 𝑤𝑖 [𝑝𝑠𝑖 (1 − 𝑝𝑠𝑖 ) + (𝑝𝑠𝑖 − 𝑝𝑠 )2 ] (72) Cette égalité peut être sommée sur toutes les espèces pour donner : 𝐸𝛾 = � 𝑤𝑖 𝐸𝛼𝑖 + � 𝑤𝑖 �(𝑝𝑠𝑖 − 𝑝𝑠 )2 = 𝐸𝛼 + 𝐸𝛽 𝑖 𝑖 𝑠 (73) L’entropie 𝛾 de Simpson peut être décomposée en sa diversité 𝛼 . La diversité de Shannon est exceptionnelle parce que. Cette décomposition est remise en cause par Jost (2007. Les formules d’entropie et de diversité sont résumées dans le Tableau 4. Cette variance peut être décomposée entre les communautés. 2008). dont la variance est 𝑝𝑠 (1 − 𝑝𝑠 ). Le nombre équivalent de communautés a une forme légèrement différente d’un nombre de Hill (Tableau 4). Il n’y a en réalité aucune raison pour que le nombre équivalent de la diversité 𝛽 ait la même forme que celle de la diversité 𝛼 : les deux diversités sont par nature très différentes. . en conclusion d’une série d’articles (Pélissier et al. Le partitionnement de la diversité selon Pélissier et Couteron Cadre Diversité 𝛽 et décomposition Un cadre général de partitionnement de la diversité.. mais la contribution de chaque communauté n’est pas la même. d’autant plus que l’ordre de diversité est faible (le biais est négligeable au-delà de l’indice de Simpson). 2003 . 2003 . 𝑞+ℎ = 𝑝+ℎ = 1 1 51 .. 2012). 𝑛𝑠∙ = 𝑛𝑠+� 𝑛 Tableau 5 : Tableau d’occurrence des espèces. est proposé par Pélissier et Couteron (2007). calculer l’entropie 𝛽 par différence et transformer les résultats en nombres équivalents (Marcon et al. indicés par ℎ. 0 sinon. mais pas pour l’entropie 𝛽 à l’exception de Shannon. Couteron et Pélissier. indicatrice de son appartenance à l’espèce 𝑠. Des méthodes de correction existent (voir le chapitre précédent). Les deux décompositions produisent les mêmes valeurs d’entropie 𝛽 . L’entropie peut être décomposée hiérarchiquement sur plusieurs niveaux (Crist et al. Suivant les notations précédentes. ou selon le cas général. la diversité 𝛽 surestimée (Marcon et al. Chaque arbre ℎ apporte une quantité d’information égale à la somme sur toutes les espèces des écarts quadratiques entre la valeur 𝑛𝑠ℎ . Les probabilités d’occurrence des espèces ne sont pas connues mais estimées à partir des données.. Il ne contient que des 0 et des 1.L’entropie de Simpson peut être décomposée de deux façons : comme une variance quand les poids des communautés sont donnés par leurs effectifs. il est possible (Crist et al.. proportionnellement à son effectif. 1986) de tester la significativité de la différence entre communautés. applicable aux trois indices classiques. La méthode générale consiste donc à corriger les entropies 𝛼 et 𝛾.. submitted). Les diversités 𝛼 et 𝛾 sont sousestiméées. 2004). Le Tableau 5 est appelé tableau d’occurrence des espèces. les placettes sont considérées comme le regroupement d’arbres. Les données sont désagrégées jusqu’au niveau de l’individu. 2003) mais controversé (Jones et Matloff. Un arbre moyen s’il pouvait exister appartiendrait partiellement à chaque espèce. Marcon et al. 2012). et la valeur 𝑛𝑠∙ correspondant à l’arbre moyen : Parcelle 𝒋 Arbre 𝒉 Forêt 𝒌 … … … … Total Placette 𝒊 Famille 𝒖 … Total Genre 𝒕 … Espèce 𝒔 … 𝑛𝑠ℎ = 1 si l’arbre ℎ appartient à l’espèce 𝑠. Chaque arbre (colonne) a une seule valeur 1 dans la cellule correspondant à son espèce. Une meilleure approche consiste à calculer l’intervalle de confiance de la diversité 𝛽 due à l’incertitude sur les estimateurs de probabilités. Enfin. alors que la diversité 𝛼 est résiduelle. La diversité totale est 𝑇𝑆𝑆⁄𝑛. Dans la placette 𝑖 : 𝑠 ℎ∈ℐ (76) Si le poids 𝑤𝑠 vaut toujours 1. 52 . Le poids 𝑤𝑠 = 1 pour toutes les espèces règle le problème. Le modèle est alors celui de la décomposition de l’indice de Simpson présenté plus haut.Mesures de la biodiversité ∑𝑠(𝑛𝑠ℎ − 𝑛𝑠∙ )2. 𝑇𝑆𝑆⁄𝑛 est l’indice de Simpson. Nous nous intéresserons ici à la décomposition de la diversité totale 𝛾 en diversités 𝛼 et 𝛽 . en prenant pour référence la fréquence des espèces à l’intérieur de chaque placette. on obtient l’indice de Shannon. 𝑤𝑠 . notée 𝑀𝑆𝑆. dépend de la distribution totale des espèces. la diversité 𝛽 est la partie expliquée par le modèle (les différentes communautés sont les paramètres explica- La diversité 𝛽 est calculée de façon similaire par la différence entre les fréquences des espèces dans chaque placette (∑ℎ∈ℐ 𝑛𝑠ℎ )⁄𝑛 et leur fréquence après regroupement 𝑛𝑠∙ . sommée sur tous les arbres. et 𝑤𝑠 = 1⁄𝑤𝑠∙ donne le nombre d’espèces moins 1. est notée 𝑇𝑆𝑆 : 𝑇𝑆𝑆 = � 𝑤𝑠 �(𝑛𝑠ℎ − 𝑛𝑠∙ )2 𝑠 ℎ tifs). 𝑅𝑆𝑆𝑖 = � 𝑤𝑠 � �𝑛𝑠ℎ − Décomposition L’intérêt de la méthode est de permettre l’utilisation de modèles linéaires et des outils informatiques associés classiques pour décomposer la diversité de différentes manières (Pélissier et Couteron. notée 𝑅𝑆𝑆. ∑ℎ∈ℐ 𝑛𝑠ℎ � 𝑛 2 (77) Le problème est que le poids attribué à chaque espèce. La diversité 𝛼 est calculée de la même manière. 2007). Si 𝑤𝑠 = ln(1⁄𝑛𝑠∙ )⁄(1 − 𝑛𝑠∙ ). La somme peut être pondérée pour donner une importance plus ou moins grande des espèces selon leur fréquence : ∑𝑠 𝑤𝑠 (𝑛𝑠ℎ − 𝑛𝑠∙ )2. Dans ce cadre. 𝑅𝑆𝑆 n’est donc pas une diversité 𝛼 puisque sa valeur dépend de données extérieures à la placette. La mesure totale. Dans R. ● Une distance est euclidienne si elle peut être représentée par des figures géométriques. 𝑚). Enfin. Le package contient les données d’inventaire de deux hectares du dispositif de Paracou et la taxonomie des espèces concernées : > library(entropart) > # Chargement du jeu de données > data(Paracou618) Une distance vérifie en plus : ● La dissimilarité d’un individu avec luimême est nulle : 𝑑 (𝑘. Pour une similarité le lien est d’autant plus fort que sa valeur est grande. 𝑚) ≤ 𝑑(𝑘. 𝑚)�. Les distances obtenues en mesurant les longueurs 53 . L’inégalité triangulaire : 𝑑(𝑘. l’idée qu’une communauté de 𝑆 espèces toutes de genres différents est plus diverse qu’une communauté de 𝑆 espèces du même genre est satisfaisante. 𝑑(𝑙. 𝑙 ) = 0 ⇒ 𝑘 = 𝑙 . Des exemples montrent comment calculer cette diversité. puis de construire des mesures de diversité en rapport (Cousins. 𝑙 ) + 𝑑(𝑙. 𝑙 ). toutes les espèces sont équidistantes les unes des autres. 1983). 𝑘) La distance entre deux individus différents est strictement positive : 𝑑(𝑘. Un indice de dissimilarité 𝑑 (on peut dire une dissimilarité) vérifie (𝑘 et 𝑙 sont deux individus) : ● ● ● De nombreuses mesures de diversité ont été créées et plusieurs revues permettent d’en faire le tour (Ricotta. On peut rendre toute distance euclidienne par ajout d’une constante (Cailliez. utiliser is. une distance est ultramétrique si 𝑑(𝑘. Pavoine et Bonsall. Intuitivement.euclid() pour vérifier qu’une distance est euclidienne. principalement à l’aide du package entropart. Il s’agit donc de caractériser la différence entre deux classes d’objets. 1991). Cadre Dissimilarité et distance Une similarité ou dissimilarité est toute application à valeurs numériques qui permet de mesurer le lien entre les individus d’un même ensemble ou entre les variables. qu’elles appartiennent au même genre ou à des familles différentes. 𝑘) = 0. sans que certaines soient plus différentes que d’autres. 𝑙 ) = 𝑑(𝑙. La dissimilarité est symétrique : 𝑑(𝑘. et cailliez() pour la transformation. Les mesures présentées ici sont les plus utilisées. 2011). 2007 . et notamment celles qui peuvent être ramenées aux mesures classiques en fixant une distance égale entre toutes les espèces. La dissimilarité entre deux individus différents est positive : 𝑑(𝑘. 𝑙 ) ≥ 0.DIVERSITÉ FONCTIONNELLE ET PHYLOGÉNÉTIQUE Les mesures neutres de la diversité considèrent que toutes les classes auxquelles les objets appartiennent sont différentes. 𝑚) ≤ max�𝑑 (𝑘. De nombreux indices de dissimilarité ne vérifient pas cette propriété. Par exemple. page 56 : la distance entre les espèces 1 et 2 est 𝑏 + 𝑐 + 𝑑. étendue par Podani (1999) à d’autres types de variables. etc. La première étape consiste donc à choisir un ensemble de traits pertinents et à les mesurer de façon standardisée (Cornelissen et al. Chaque espèce ou individu est représenté par ses valeurs de traits dans un espace multidimensionnel. Un dendrogramme fonctionnel n’a pas d’interprétation aussi claire qu’un arbre phylogénétique qui représente le processus de l’évolution. Toute la stratégie relative à la photosynthèse peut être par exemple assez bien résumée par la masse surfacique des feuilles (Wright et al. La formule de Gower. Le vecteur de traits est considéré comme un proxy de la niche écologique. dont la valeur est comprise entre 0 et 1 : ● ● ● ● Pour une variable quantitative. La prise en compte de variables qualitatives ou de rangs et la possibilité de données manquantes pose un problème pratique de construction du dendrogramme. plus fréquemment. Les individus proches dans l’espace des traits sont donc considérés comme proche écologiquement. Distance phylogénétique La façon la plus évidente de définir une distance entre espèces est d’utiliser la taxonomie. La distance définie est ultramétrique. un arbre est construit par classification automatique hiérarchique. et ne sont pas toujours ultramétriques.. sans datation précise (mais avec des calages partiels à partir de fossiles). voir page 56) à l’ajout ou au retrait d’un trait ou d’une espèce. La façon exacte de mesurer les longueur de branche est illustré par la Figure 26. ce trait est décorrélé de la densité du bois (Baraloto et al. sans regroupement par espèce.. 2003). La phylogénie idéale contiendrait l’histoire évolutive de toutes les espèces et les distances seraient les temps de divergence depuis le premier ancêtre commun. 2004). les phylogénies sont établies à partir d’un nombre de marqueurs génétiques limités. la stratégie d’échantillonnage est à soigner particulièrement (Baraloto et al. Les valeurs manquantes sont simplement ignorées et n’entrent pas dans la moyenne.Mesures de la biodiversité des branches d’un dendrogramme (arbre) résultant d’une classification hiérarchique sont ultramétriques. Dans tous les cas. Podani et Schmera (2006) suggèrent d’utiliser une classification hiérarchique par UPGMA (Sokal et Michener. une autre (par exemple 2) à deux espèces de la même famille.. Les variables ordonnées sont remplacées par leur rang et traitées comme les variables quantitatives Pour des variables qualitatives. 1958) qu’ils montrent être la plus robuste (pour le calcul de FD. 2010a). Une matrice de dissimilarités est construite de cette façon. Les distances entre les points peuvent être calculées directement dans l’espace des traits ou. 54 . Elles peuvent prendre en compte chaque individu. la dissimilarité vaut 0 ou 1. En pratique. la distance est une mesure de la divergence évolutive.. traité par Gower (1971). Dans des communautés très diverses. 2010b). Il peut être interprété comme la représentation à des échelles de plus en plus grossières en allant vers le haut de l’arbre de regroupements fonctionnels dans des niches de plus en plus vastes. la différence de valeur entre deux espèces est normalisée par l’étendue des valeurs de la variable. calcule la dissimilarité entre deux espèces par la moyenne des dissimilarités calculées pour chaque trait. La taxonomie peut être remplacée avantageusement par une phylogénie. en attribuant une distance arbitraire (par exemple 1) à deux espèces du même genre. mais. Distance fonctionnelle L’approche fonctionnelle est différente. en forêt tropicale. et donc de considérer la diversité phylogénétique comme proxy de la diversité fonctionnelle. Les mesures de divergence sont des fonctions croissantes de la dissimilarité entre les espèces. parfaitement régulier. L’arbre A. L’utilisation de la diversité phylogénétique comme proxy de la diversité fonctionnelle est maintenant déconseillée (Pavoine et Bonsall. la régularité maximale n’est pas obtenue pour des effectifs identiques. Webb (2000) a montré que des communautés d’arbres tropicaux avaient une moins grande diversité phylogénétique locale qu’attendue sous l’hypothèse nulle d’une distribution aléatoire des espèces. Pavoine et Bonsall. Elle mesure la façon dont les espèces occupent uniformément l’espace des niches (Pavoine et Bonsall. 2011). une typologie des mesures de diversité émerge. trois vecteurs d’abondance (P1 à P3) sont de moins en moins réguliers : dans les cas C et D. Dans un arbre parfai- Figure 25 : Régularité contre irrégularité (Regularity vs. 1) 55 . Dans un arbre parfaitement régulier.. Skewness). et a supposé que la cause en était le filtrage environnemental local. mais en augmentant les effectifs des espèces originales (voir Maximum théorique. Cette notion est simple dans un espace multidimensionnel (par exemple. Les arbres de A à D sont de plus en plus irréguliers. généralement considérées par paire. Dans un arbre phylogénétique. Dans un arbre phylogénétique. page 57). fig. la tentation a été grande de considérer que la phylogénie contenait plus d’information fonctionnelle que ce qui pouvait être mesuré. Typologie des mesures À partir de la littérature (Ricotta. Elle étend les notions classiques de richesse et équitabilité. La richesse est l’accumulation de classes différentes dans les mesures classiques. Swenson et Enquist (2009) ont montré que la relation entre les deux diversités était faible. 2011). La phylogénie étant donnée. complété éventuellement par les abondances. est le cadre des mesures classiques de la diversité.Diversité fonctionnelle et phylogénétique Équivalence des deux diversités L’approche fonctionnelle étant particulièrement complexe et lourde à mettre en œuvre (notamment pour la mesure des traits sur chaque individu). l’espace des traits fonctionnels). La discipline appelée écologie phylogénétique des communautés cherche encore à comprendre quels traits sont conservés et lesquels sont convergents (Cavender-Bares et al. La régularité est une notion plus complexe (Figure 25). 2011). sous l’hypothèse de conservation phylogénétique des traits fonctionnels. la régularité se réduit à l’équitabilité. 2007 . La figure est issue de Pavoine et Bonsall (2011. Certaines sont pondérées par les abondances. et PD sont des mesures de richesse. agissant sur les traits et observables par la phylogénie. FD. d’autres non. 2009). la longueur des branches représente un temps d’évolution : la richesse en est la somme. la régularité de l’arbre est un premier critère. l’indice de Rao (1982) donne la dissimilarité moyenne entre deux individus choisis au hasard. Formalisation Les espèces sont prises deux à deux et sont donc indicées ici par 𝑠′ et 𝑠′′ Figure 26 : Mesure de la diversité fonctionnelle FD d’une communauté hypothétique de 7 espèces. La ligne pointillée horizontale représente la méthode plus ancienne de regroupement des espèces à un niveau arbitraire (Petchey et Gaston. Étant donné un arbre contenant toutes les espèces ou tous les individus étudiés. Principe À partir de relevés fournissant la fréquence de chaque espèce par communauté et d’une matrice de dissimilarité entre paires d’espèces. PD ou FD sont égaux à la somme de la longueur des branches (Figure 26). les espèces sont liées à la même racine (on dira que l’arbre est parfaitement régulier). Indice de Rao L’indice de Rao est une mesure de divergence pondérée. la diversité fonctionnelle (Petchey et Gaston.P : > # Vecteur des probabilités > Ps <.P(Ps. c'est-à-dire que toutes 56 Discussion La définition de la distance est essentielle : . Il n’est pas nécessaire à ce stade que Δ soit une distance. la dissimilarité entre l’espèce 𝑠′ et l’espèce 𝑠′′. figure 1) On note Δ la matrice de dissimilarité dont les éléments sont 𝑑𝑠′𝑠′′ .Mesures de la biodiversité tement régulier. Les mesures d’entropie phylogénétique peuvent être corrigées. Ces mesures sont influencées par la richesse et la régularité. FD est la somme des longueurs des branches (𝒂 + 𝒃 + ⋯ + 𝒌 + 𝒍).MC$Ps > PDFD. L’indice de Rao est souvent appelé entropie quadratique en raison de sa forme mathématique.Paracou618. 2002). FD et PD Les indices les plus simples sont la diversité phylogénétique (Faith. 2002. mais il n’existe pas de technique de correction dans la littérature. Paracou618. 𝒫 est le vecteur des probabilités dont 𝑝𝑠’ et 𝑝𝑠′′ dont des éléments : L’indice de Rao est : 𝐻Δ (𝒫 ) = � � 𝑝𝑠′ 𝑝𝑠′′ 𝑑𝑠′𝑠′′ 𝑠′ 𝑠′′ (78) Dans le cas particulier ou toutes les branches sont de longueur 1.Taxonomy) [1] 395 Biais d’échantillonnage Les mesures de diversité fonctionnelle et phylogénétique sont sujettes aux biais d’échantillonnage. l’indice de Simpson est une mesure de divergence pondérée. L’entropie phylogénétique permet d’unifier ces notions. 1992) et sa transposition. PD et FD sont égales à la richesse spécifique. Le package entropart fournit la fonction PDFD. frame (Paracou618. Sa valeur peut être interprétée comme la probabilité qu’une paire d’individus choisie au hasard soit de deux espèces différentes.MC$Psi).876405 > apply(Paracou618.. Ce résultat est contraire aux propriétés attendues d’un indice de diversité.52255 S1 13.P(Ps.820856 P018 2. Rao.Taxonomy) [1] 0. on obtient l’indice de GiniSimpson(Gini.P. L’indice atteint alors son maximum pour des fréquences d’autant plus grandes que l’espèce est originale (Pavoine et al.csv contient une espèce par ligne.57748 Sr 10.frame(Ps). L’estimation empirique de l’indice se fait simplement en estimant les probabilités par les fréquences.88627 Me 14.963457 1. 1912 . Paracou618. mais il est probablement très faible. par analogie avec l’estimateur de l’indice de Simpson : les espèces rares interviennent peu.Paracou618. vaut �2𝑑𝑠′𝑠′′ pour des raisons propres à ADE4) au lieu de l’arbre lui-même : > divc(as.71211 73. Paracou618.454455 1. L’originalité n’est pas intéressante dans une taxonomie : une phylogénie doit être créée pour illustrer cette notion.data. traits. (2005a) ont défini l’originalité d’une espèce comme sa fréquence maximisant l’entropie quadratique. et un certain nombre de valeurs de traits en colonnes.71081 68. 1949).Taxonomy) P006 P018 2.305796 La matrice de distances est créée par classification automatique hiérarchique.traits. Les auteurs ont établi que l’utilisation de distances ultramétriques corrige ce défaut. choisir 𝑑𝑠′𝑠′′ = (𝑦𝑘 − 𝑦𝑙 )2 ⁄2 rend l’indice de Rao égal à la variance de 𝑌.03988 Le package ADE4 permet le calcul avec la fonction divc qui utilise un format différent pour les probabilités et surtout la matrice des racines carrées du double des distances de l’objet phylog (chaque élément de $Wdist Gm 1. Rao.Taxonomy$Wdist) divc peut traiter plusieurs communautés simultanément .gf/IMG/csv/rao.MC$Psi.MC$Ps > Rao.9593776 Le résultat est un data frame nommé traits à 8 lignes (espèces) et 6 colonnes (traits) : > # Aperçu > traits[1:4.10341 97. 2. sachant la matrice de distances entre espèces. Le fichier rao.ecofog.data.Taxonomy$Wdist) diversity P006 2. Dans un espace unidimensionnel où la valeur 𝑦𝑠 associée à l’espèce 𝑠 est une variable quantitative 𝑌.names=1. Les espèces les plus originales sont celles ayant le moins d’espèces proches dans la classification.493502 1. identifiée par le champ Code.Diversité fonctionnelle et phylogénétique ● ● Pavoine et al.820856 2. 1:3] SLA Am Ess 10.P : > # Vecteur des probabilités > Ps <.876405 Maximum théorique Pavoine et al. Le biais d’estimation n’a pas été étudié. (2005b) ont montré que l’utilisation de distances ordinaires fait que la valeur maximale de l’entropie quadratique pour un effectif donné est obtenue en éliminant les espèces intermédiaires en ne retenant que les espèces extrêmes (le résultat est évident en une dimension : la variance est maximale en ne retenant que les valeurs extrêmes d’un échantillon).csv2 ("http://www. Paracou618. en fixant 𝑑𝑠′𝑠′′ = 1 si deux espèces sont différentes.P peut être utilisé avec la fonction apply : > divc(as.27473 63. Paracou618.csv". header=T)-> traits Calcul sous R Le package entropart fournit la fonction Rao. row. > # Lecture des données : traits pour 34 espèces > read. 2005a). Simpson. 57 . 5 pour l’entropie quadratique. h=-1) La fonction a pour paramètres l’objet phylog contenant la classification et le numéro de la méthode de calcul à utiliser. phyf) CvsN Thick SLA N Ef Gm Am Vm N Sr Me Ess S1 Sr Bg Dg Ess SLA Me Thick Am CvsN S1 Bg Gm Figure 27 : ACP sur les traits foliaires Ef Vm pcaf est une liste qui contient les résultats de l’ACP. à utiliser pour la classification : -1.dudi. 2005b). Sa représentation graphique est faite par dotchart.5 -0.Mesures de la biodiversité > # ACP sur les traits foliaires > pcaf <.5 Dg > # CAH Ward des traits foliaires > hf <.pca(traits. originality(phyf. les deux premiers axes de l’ACP rendent compte de presque toute l’inertie. scale=T.phylog(pcaf$tab[names (phyf$leaves).hclust2phylog(hf) > # Affichage avec poids des variables. Dans cet exemple.phylog : 58 . Le nuage de points est pratiquement contenu dans un plan alors que sa représentation en distance ultramétrique est une hypersphère en 7 dimensions (voir Pavoine et al. scannf=FALSE. "ward") Figure 29 : Classification automatique des espèces.phylog Cluster Dendrogram 10 La limite des distances ultramétriques est leur tendance à déformer le jeu de points.phylog(phyf..5 2.hclust(dist(pcaf$tab). 5)) Height 2 4 6 8 Ess Vm 0 Me Dg S1 Bg Sr Ef dist(pcaf$tab) hclust (*.5 1. "ward") Figure 28 : Classification automatique des espèces > # Figure 28 > plot(hf. Figure 29.]. nf=2) # Figure 27 > scatter(pcaf) d= Le résultat de la classification est un objet hclust qui doit être transformé en phylog pour la suite de l’analyse : > # Transformation de l'arbre du format hclust au format phylog > phyf <. représentée par table.5 0. Le calcul de l’originalité des espèces utilise la fonction originality : > dotchart. > table. 744483 P4 4. ].gf/IMG/csv/rao.897210 P3 5. 2009)..sum)) Sr Ess Me S1 Bg Ef Vm Dg 284 228 139 91 173 169 141 221 > divc(as. Si la distance utilisée n’est pas ultramétrique... peut être décomposée en une somme (pondérée) de diversités intra et une diversité inter (Pavoine et al.MARGIN=1. row. Calculer 𝑝⋅ en sommant les communautés. 𝒫𝑗 � = 2𝐻Δ � Pour obtenir tous les éléments de l’équation (80) : ● 𝐻Δ (𝒫) : diversité totale. > (read.effectifs. 𝒫𝑗 � 𝑗 (80) > divc(effectifs [names (phyf$leaves). de la même façon qu’on calcule la diversité entre espèces d’une communauté : 𝐻Δ (𝒫 ) = � 𝑤𝑖 𝐻𝛥 (𝒫𝑖 ) 𝑖 𝑖 𝒫𝑖 + 𝒫𝑗 � − 𝐻Δ �𝒫𝑗 � 2 − 𝐻Δ �𝒫𝑗 � (79) ● + � � 𝑤𝑖 𝑤𝑗 𝐷𝐻𝛥 �𝒫𝑖 .870667 Elle est définie par Rao (1982) comme la différence entre l’entropie quadratique du mélange des deux communautés et celles des deux communautés prises individuellement. Il contient 4 communautés.names=1. effectifs. phyf$Wdist) diversity tabF 5. phyf$Wdist) diversity P1 5. fournie par divc : 59 . La divergence entre communautés est construite à partir des entropies de chacune : l’entropie 𝛽 est définie comme la différence entre les entropies 𝛾 et 𝛼. le concept d’originalité n’a pas de sens dans ce cas. header=T)-> effectifs) P1 P2 P3 P4 Ess 97 36 34 61 Me 62 24 49 4 S1 4 6 6 75 Sr 71 78 99 36 Vm 76 29 34 2 Bg 58 49 47 19 Ef 9 34 91 35 Dg 98 14 95 14 -1 0 1 2 3 Figure 30 : Originalité des espèces L’originalité (Figure 30) ne repose que sur l’arbre.csv".data. L’exemple suivant utilise les communautés du fichier rao. il existe plusieurs distributions possibles d’espèces qui maximisent la diversité (Pavoine et Bonsall.ecofog.csv : > # Vecteur contenant 8 espèces. Décomposition La diversité de la méta-communauté.csv2 ("http://www. Elle peut être utilisée pour calculer un indice de diversité entre communautés.816719 P2 5. ].790586 𝐻Δ (𝒫𝑖 ) : diversité de chaque communauté.frame(tabF).Diversité fonctionnelle et phylogénétique QEbased Le deuxième terme de la somme est la diversité inter-communautés. 2004) en définissant une dissimilarité entre les communautés 𝑖 et 𝑗 : 𝐷𝐻Δ �𝒫𝑖 . Calculer ensuite l’entropie quadratique avec divc : > (tabF<-apply(effectifs [names (phyf$leaves). C’est un indice de Rao : les poids des communautés sont équivalents aux tableaux de fréquences et les dissimilarités entre communautés sont équivalentes aux dissimilarités entre espèces de l’équation (78). pas sur la fréquence des espèces. 4888729 0.MetaCommunity(effectifs.3157902 (81) Izsák et Pavoine (2011) proposent deux variantes de l’indice de Rao dans lesquelles la distance entre espèces dépend de leurs probabilités : L1 = � � 𝑝𝑠′ 𝑝𝑠′′ (𝑝𝑠′ − 𝑝𝑠′′ )2 𝑠′ 𝑠′′ 𝑠′ 𝑠′′ Cette partition suppose que les poids des communautés sont proportionnels à leur nombre d’individus (Rao.2362187 $GammaEntropy [1] 5. La partition peut être faite avec la fonction DivPart : > # Création d'une métacommunauté. Normalize=FALSE) $TotalAlphaEntropy [1] 5.897210 5. colSums(effectifs)) > DivPart(q=2.790586 L2 = � � 𝑝𝑠′ 𝑝𝑠′′ (ln𝑝𝑠′ − ln𝑝𝑠′′ )2 (82) FAD et MFAD Les indices FAD et MFAD sont des mesures de divergence non pondérées. Hardy et Jost (2008) montrent que les deux pondérations sont valides mais l’absence de cadre général assurant que la diversité 𝛾 de Rao est supérieure à la diversité 𝛼 motive Guiasu et Guiasu (2011) à proposer une alternative à l’indice de Rao. l’indice de Gini-Simpson quadratique pondéré. Villeger et Mouillot. Ils ne prennent pas en compte la fréquence des espèces. phyf$Wdist) P1 P2 P3 P2 0. mais dont les autres propriétés restent à explorer.4698121 P3 0.870667 Alternatives Guiasu et Guiasu (2011) proposent l’indice 𝐺𝑆𝑊 introduit plus haut : GSW = � � 𝑑𝑠′𝑠′′ 𝑝𝑠′ 𝑝𝑠′′ (1 − 𝑝𝑠′ 𝑝𝑠′′ ) 𝑠′ 𝑠′′ La fonction disc calcule �2𝐷𝐻Δ �𝒫𝑖 . dont la concavité est démontrée (ce qui implique que 𝛾 ≥ 𝛼 ).6487916 P4 1.Mesures de la biodiversité ● La variabilité inter-communautés peut être calculée par divc en utilisant la distance fournie par disc. À un facteur de normalisation près.. 𝑑𝑘𝑙 est la distance entre deux espèces indicées par 𝑘 et l. poids égaux aux effectifs > MC <. phyf$Wdist)) diversity colSums(effectifs) 0. ].frame (colSums(effectifs)). MFAD (Schmera et al. en définissant la matrice des poids (égale aux effectifs) : > divc(as.8776582 1. (1999). Sa version normalisée.] . disc(effectifs[names(phyf$leaves). 2009) est : MFAD = ∑𝑘 ∑𝑙 𝑑𝑘𝑙 𝑆 (84) Les deux indices ont été développés pour l’écologie fonctionnelle. Hardy et Senterre (2007) décomposent (par différence entre 𝛾 et 𝛼) l’indice de Rao de communautés de poids égaux. alors : FAD = � � 𝑑𝑘𝑙 𝑘 𝑙 (83) FAD est très sensible au nombre d’espèces. 1982 . FAD a été proposé par Walker et al. MC. 𝒫𝑗 � : > disc(effectifs[names (phyf$leaves).816719 5.744483 4. ce résultat sera obtenu dans le cadre plus général de la décomposition de l’entropie phylogénétique (page 63).data. à partir d’une matrice de distances dans l’espace des traits (non ultramétrique). Tree=phyf. ce sont des cas particuliers de l’indice de Rao pour des effectifs égaux. 60 . 2008).634448 $CommunityAlphaEntropies P1 P2 P3 P4 5. La pondération peut en fait être quelconque tant que l’arbre est ultramétrique.2362187 $TotalBetaEntropy [1] 0.0018983 0. . 𝑞𝐻 peut être calculée avec ces valeurs de probabili𝑞 tés. Figure 31. avec des probabilités égales à celle de l’espèce 1.5506 Mesures d’entropie phylogénétique Généralisation de l’entropie HCDT Hp et I1 Simultanément.Paracou618. figure 1a). on définit pour la branche 𝑏 : 𝑝(𝑏).FAD/length(Tree$leaves)) [1] 621. Figure 31. Étant donné une phylogénie. sera détaillée dans le paragraphe suivant. la racine de l’arbre est fixée à 𝑡0 = 0. L’entropie HCDT ( 𝑞𝐻 de l’équation (44)) est calculée à chaque période. et celle de l’espèce 4. à la deuxième période (𝑇2 ). La présentation de Allen et al. À partir de la racine de l’arbre. (2009) découpent l’arbre phylogénétique en périodes. Par exemple. celle de Pavoine et al. On notera cette valeur d’entropie 𝑘𝐻 où 𝑘 le quantième de la période.. 61 Nous suivrons plutôt les notations de Chao et al. plus générale. une nouvelle période est définie à chaque ramification d’une branche quelconque. la somme des probabilités des feuilles de la branche. sur la figure. comme celle de la Figure 26. est donnée ici. la somme de celles des espèces 2 et 3.Diversité fonctionnelle et phylogénétique Le calcul sous R est simple avec un arbre au format phylog d’ADE4 : > Tree <. L’indice d’entropie phylogénétique est : 𝐻𝑝 = − � 𝑙 (𝑏) 𝑝(𝑏) ln 𝑝(𝑏) b Figure 31 : Arbre phylogénétique hypothétique (Chao et al..sum(Tree$Wdist^2/2)) [1] 264159 > (MFAD <. (2009) et Allen et al. Pavoine et al. L’arbre comprend 𝐾 = 3 périodes. Les débuts et fins de périodes sont notés 𝑡𝑘 . (2010) en numérotant les périodes à partir du présent et en notant 𝑇𝑘 leur durée. la branche 𝑔 a une valeur 𝑝(𝑔) égale à la somme des probabilités d’occurrence des espèces 4 et 5 alors que 𝑝(𝑖 ) est seulement la probabilité de l’espèce 5. (85) Dans un arbre parfaitement régulier. Pavoine et al. 2010. la première période se termine quand les branches des espèces 2 et 3 se rejoignent. (2009) ont proposé la généralisation de l’indice de Shannon à la diversité phylogénétique. 𝑙 (𝑏) la longueur la branche. l’arbre a trois feuilles.Taxonomy > (FAD <. L’arbre est ultramétrique. toutes les branches sont de longueur 1 et 𝐻𝑝 est l’indice de Shannon. apportent peu de diversité supplémentaire par rapport à une situation où les deux espèces seraient confondues (et leurs effectifs ajoutés).N(Paracou618. correspondant aux limites (Cuts) 1.N pour � (𝑇) à partir d’un vecteur de procalculer 𝑞 𝐻 62 Chao et al. 2. mais en moyen𝑞 nant la diversité à chaque période 𝑘𝐷 de façon à respecter le principe de réplication (voir page 37) : 𝑞 � 𝑩𝑇 est l’ensemble des branches de l’arbre. corrigé du biais d’échantillonnage utilise le code suivant : > data(Paracou618) > PhyloEntropy. Shimatani (2001). 𝐻 (𝑇) est 𝐻𝑝 et 2𝐻 Rao.9234575 $Total [1] 0. Nous le normalisons par la hauteur totale de l’arbre (𝑇) pour définir 𝑞 � 𝐻(𝑇) : 𝑞 � babilité ou d’abondances. On peut les interpréter intuitivement comme une somme pondérée par la longueur des périodes des valeurs de l’entropie à chaque période. toutes les classes sont présentes. indexée par 𝑖 . et 𝐼𝑞 = 𝑞𝐻. Les probabilités associées aux branches. toutes les branches sont de longueur 1. va en décroissant) et la valeur de 𝑞 𝐻 𝑞 Entropie et diversité L’entropie 𝑞 � diversité de la même façon que 𝑞𝐷 = 𝑒𝑞 (Marcon et Hérault. généralisent les mesures Les indices 𝑞𝐻 d’entropie classique à la diversité phylogé� (𝑇) + 1� est égal à PD ou nétique : 𝑇� 0𝐻 1� � (𝑇) est l’indice de FD. comme les espèces 2 et 3 de la Figure 26. Le calcul de l’indice de Rao.9863382 0.Taxonomy) $Cuts 1 2 3 0. Exemple : le package contient les données d’inventaire de deux hectares du dispositif de Paracou et la taxonomie des espèces concernées.9710063 0. c'est-à-dire l’égalité (86) pour le cas particulier 𝑞 = 2.Mesures de la biodiversité L’indice 𝐼𝑞 de Pavoine et al. Chaque branche. Dans le dernier cas. se situe dans une période : toutes les branches de la période 𝑘 sont de même longueur 𝑇𝑘 . submitted-b) : 𝑞 � 𝐻(𝑇) peut être transformée en 𝑞 𝐻 𝐷 (𝑇) = 𝑒𝑞 𝑞 � 𝐻 (𝑇 ) (87) Biais d’échantillonnage La correction du biais d’échantillonnage applicable à l’entropie généralisée l’est aussi à chaque période de l’arbre.MC$Ns.N est appliquée à chaque période. 2 et 3 dont l’entropie � (𝑇).P et PhyloEntropy. la diversité est donc maximale. 𝑝𝑖 . Le package entropart fournit les fonctions PhyloEntropy. Deux classes peu distantes. la correction de Tsallis. contrairement aux espèces 4 et 5. (2009) est la somme des 𝑞 𝑘 𝐻 pondérée par la durée de chaque période. Les biais sont de moins en moins importants quand on se rapproche de la racine de l’arbre (il est de moins en moins probable de ne pas observer une classe quand les classes sont de plus en plus vastes). Paracou618. les classes se confondent et la diversité diminue progressivement. En remontant dans l’arbre. À la dernière période (près des feuilles). 𝐻 (𝑇) = � 𝐾 𝑘=1 𝑇𝑘 𝑞 𝐻 𝑇 𝑘 (86) � (𝑇). La fonction retourne la valeur de 𝑘𝐻 dans chaque intervalle (l’arbre est ici une taxonomie espèce-genre-famille. sont la somme des probabilités des espèces situées 𝐷 (𝑇) = � � 𝑖∈𝑩𝑇 𝑇𝑖 𝑞 𝑝 � 𝑇 𝑖 1 1−𝑞 (88) . puis Ricotta (2005) avaient montré que l’indice de Rao est la somme pondérée sur chaque période de l’indice de Simpson. il n’y a qu’une seule période.9602673 Dans un arbre parfaitement régulier. (2010) obtiennent ce résultat sans recourir à l’entropie. 291119 $GammaDiversity [1] 55.P et PhyloDiversity. dernière période seule. À la suite de l’exemple précédent.22132 51. 𝑝𝑘𝑢𝑖 la même probabilité dans la communauté 𝑖 . en bas à gauche. Attention : les entropies ont un comportement linéaire : elles s’additionnent tout au � (𝑇). Paracou618.N de entropart permettent de calculer 𝑞 � (𝑇). En haut : arbre entier.13383 $CommunityAlphaDiversities P006 P018 37.06463 $Total [1] 25. arbre sans la première période. l’entropie 𝛼 est la somme pondérée de celles des communautés. 𝐷 les résultats sont présentés sous forme de diversité au lieu d’entropie : > PhyloDiversity.N( Paracou618. En combinant l’équation (86) et le Tableau 4. l’arbre possède 9 branches dont les probabilités sont notées en dessous de leur nœud basal. 2. Figure 31. Biased = FALSE. on obtient : 𝑞 � 𝐻𝛾 (𝑇 ) 𝑞 � 𝑞 � = 𝐻 𝛼 (𝑇) + 𝐻𝛽 (𝑇 ) La fonction DivPart de entropart permet de décomposer l’entropie. en bas à droite.MC$Ns.Diversité fonctionnelle et phylogénétique sur les feuilles liées à la branche. 1 𝑇𝑘 𝑝𝑘𝑢𝑖 𝑞 = � 𝑤𝑖 � � 𝑝𝑘𝑢𝑖 lnq 𝑇 𝑝𝑘𝑢 𝑞 � = � 𝑤𝑖 𝑖𝐻 𝛽 (𝑇 ) = � 𝑤𝑖 � 𝑖 𝑘 𝑇𝑘 𝑞 𝐻 𝑇 𝑖𝑘 (91) 1 1 Figure 32 : Notations pour la décomposition de l’entropie phylogénétique.49020 13. Décomposition L’entropie phylogénétique est une combinaison linéaire de l’entropie HCDT donc sa décomposition est identique (Marcon et Hérault.Taxonomy) $Cuts 1 2 3 73. comme pour la décomposition de l’indice de Shannon.MC. Les résultats contiennent la valeur de la diversité : > data(Paracou618) > DivPart(q = 1. Les long de l’arbre pour donner 𝑞𝐻 𝑞 diversités 𝑘𝐷 calculées à chaque période ne peuvent pas être sommées sur le modèle de � (𝑇) n’est pas la l’équation (86) : 𝑞𝐷 moyenne pondérée des diversités aux différentes périodes. submitted-b). sauf dans le cas particulier 𝑞 = 1 où. Tree=Paracou618.16819 L’entropie 𝛽 est : 𝑞 � 𝐻𝛽 (𝑇) 𝑖 𝑖 𝑘 𝑢 où 𝑝𝑘𝑢 est la probabilité d’observer une des espèces de la branche 𝑢 de l’arbre à la période 𝑘 (Figure 32) dans la méta communauté. Paracou618.754255 $TotalBetaEntropy [1] 0. il en est la moyenne géométrique pondérée. la pondération est libre mais doit respecter 𝑝𝑠 = ∑𝑖 𝑤𝑖 𝑝𝑠𝑖 : 𝑞 � 𝐻𝛼 (𝑇) �𝛼 (𝑇) = � 𝑤𝑖 𝑖𝐻 𝑖 𝑞 (90) 63 .70238 $TotalBetaDiversity [1] 1.2555089 $GammaEntropy [1] 4. Les fonctions PhyloDiversity.19676 34.Taxonomy) $TotalAlphaDiversity [1] 42.31045 $TotalAlphaEntropy [1] 3.009764 (89) L’entropie 𝛾 est celle de la méta communauté. ylab = expression(paste(beta. angle=135. density=10) Figure 34 : Arbre phylogénétique hypothétique non ultramétrique (Chao et al. la longueur moyenne des remplacé par 𝑇 branches pondérée par la fréquence des espèces.0 1. Neutre$TotalAlphaDiversity. le rectangle le plus large. Les surfaces des deux rectangles sont identiques. L’arbre de la Figure 34 peut être découpé en périodes mais les deux premières (𝑇1 : seule l’espèce 2 est présente . Biased = FALSE)) > plot(c(0. Chao et al. " / ". figure 1b). La différence de taille entre les rectangles hachurés et les rectangles transparents est due à la prise en compte de la phylogénie. la hauteur du rectangle serait égal à leur nombre (2 ici). Dans ce cas. lty=2) > (Phylo <. y compris s’il n’est pas ultramétrique. Neutre$GammaDiversity.616882 3. Paracou618.5 Figure 33 : Représentation graphique de la diversité des deux parcelles du jeu de données Paracou618. Si les communautés étaient complètement différentes.MC$Ncommunities).0 0. Le rectangle plus haut a pour largeur et longueur les diversités 𝜶 et 𝜷. Cette généralisation est très discutable : son sens n’est pas clair sur le plan de la mesure de la diversité au-delà du parallélisme de la forme mathématique. 𝑞 1 La Figure 33 12 donne une représentation graphique de la décomposition de la diversi12 Code pour réaliser la figure : > data(Paracou618) > q <. 1. 𝒒 = 𝟏). les rectangles hachurés la diversité phylogénétique (l’arbre est la taxonomie des espèces. Les rectangles transparents représentent la diversité neutre. Biased = FALSE. Paracou618. " diversity"))) > rect(0. 0. " diversity")). 𝑇2 : les espèces 1 et 2 sont présentes) sont incomplètes au sens où la somme des probabilités n’y est pas égale à 1 donc �∑ 𝑝𝑖 �1−𝑞 ne définit pas une diversité à ces périodes.Mesures de la biodiversité $CommunityAlphaEntropies P006 P018 3. La diversité 𝛾 (rectangles de hauteur 1) est égale au produit des diversités 𝛼 et 𝛽 (côtés du rectangle plus haut).MC. type = "n".MC. Neutre$GammaDiversity). gamma. Phylo$TotalAlphaDiversity.937894 diversity té. 𝑇 est � .1 > (Neutre <. 1. Pavoine et Bonsall (2009) traitent en détail les résultats aberrants que cause un arbre 64 . Dans chaque cas. 0. (2010) définissent la diversité phylogénétique selon l’équation (86) quelle que soit la forme de l’arbre.5 2. de hauteur 1. 0. 2010. Neutre$TotalBetaDiversity.DivPart(q. représente la diversité 𝜸. lty=2) > rect(0.. c(0. xlab = expression(paste(alpha. Phylo$GammaDiversity. 1. Tree=Paracou618. Phylo$TotalBetaDiversity. 0.Taxonomy)) > rect(0. Paracou618. density=10) > rect(0.0 Arbres non ultramétriques 0 20 40 60 80 100 120 / diversity 0.DivPart(q. Diversité fonctionnelle et phylogénétique non ultramétrique dans le cas particulier de l’entropie de Rao. Dans l’état actuel des connaissances, aucune méthode n’est applicable de façon satisfaisante aux arbres non ultramétriques. 2 ∑𝑘 ∑𝑙 �𝑑𝑘𝑙 − 𝑑̅ � Λ = 𝑆(𝑆 − 1) + (92) Cadotte et al. (2010) proposent 6 autres mesures de régularité. Comme le montrent Mérigot et Gaertner (2011), les mesures de régularité n’ont absolument pas les mêmes propriétés que les mesures de diversité : elles peuvent par exemple augmenter quand on retire des espèces originales. Régularité L’indice Λ+ (Clarke et Warwick, 2001) mesure la variance des distances entre paires d’espèces : 65 CONCLUSION La biodiversité peut être mesurée de façon claire et rigoureuse en utilisant l’entropie phylogénétique. Diversité phylogénétique PD / FD Entropie phylogénétique I1 / Hp Rao transformation en diversité au sens strict permet d’interpréter les valeurs sous une forme unique : un nombre équivalent d’espèces et un nombre équivalent de communautés. Le package entropart permet de calculer avec R la diversité d’une méta-communauté à partir de données d’abondances et d’un arbre phylogénétique ou fonctionnel. D’autres mesures de diversité ont été présentées ici, d’autres encore peuvent être trouvées dans la littérature. Elles ont en général un moins bon support mathématique, surtout les mesures de diversité 𝛽 , ne peuvent pas être décomposées, corrigées ou interprétées. La diversité de Hurlbert possède toutes ses propriétés et une correction très efficace du biais d’estimation, mais elle n’est pas généralisée à la diversité phylogénétique. La recherche sur la mesure de la diversité est très active, ce document évolue donc régulièrement pour prendre en compte les avancées récentes. q quelconque q =0, 1 ou 2 Richesse Entropie de Tsallis Shannon Simpson Diversité neutre Figure 35 : Arbre phylogénétique hypothétique non ultramétrique (Chao et al., 2010, figure 1b). Cette mesure généralise les indices de diversité classique (Figure 35), traduit clairement la correspondance entre l’entropie et la diversité au sens strict, intègre si nécessaire la distance entre espèces, peut être décomposée et corrigée des biais d’estimation. Sa 67 . A. Kon. Journal of Ecology 9(1): 95–99. et De Granville. A. Diversity of planktonic foraminifera in deep-sea sediments. Academic Press. C. J. et McKane. S. G. Bordenave. R. Ecology 84(9): 2364-2377. J. et Schwanghart. Patino. B. Alonso. Journal of Mathematical Physics 39(12): 6490-6501.. P. De Granville. Decomposable Income Inequality Measures.. Berger. J. Ecology Letters 7(10): 901-910. Domenach.. M. Entropy estimates of small data sets. Bonachela. (2011).. T. Borland. Bonal. Berlin Brillouin. M. Comparing measures of species diversity from incomplete inventories: an update. et Chave. B. Paine.. Methods in Ecology and Evolution 1(1): 38-44. Econometrica 47(4): 901920. Roggy. G. et Tsallis. Y. (2004). C. Decoupled leaf and stem economics in rain forest trees. J. A. (2008). Springer. Baraloto. J. Beauchene. Oxford Brose.. Paine. S. E. Theory of Probability and its Applications 4(3): 333-336. B. (2010). R. D. C. L. T. (1998). The Review of Economics and Statistics 51(1): 99-101. (1979). (2009). C.. Ecology Letters 13(11): 1338-1347. Hérault. et Williams. Information gain within nonextensive thermostatistics. Martinez. Revue d'Ethnobiologie 40(1-2): 433-446. W. (2010a). L. Botanical Journal of the Linnean Society 167(1): 94-130. Science 168(3937): 1345-1347. (1969). (1962). J. Bonal. (1928). J. Suriname. et Steyn.. B. F. Les mesures de la biodiversité : un outil de conservation en forêt guyanaise. C. American Naturalist 174(2): 236-243. A.. J. et Chave. (1998). J. Multiplicative partition of true diversity yields independent alpha and beta components.. A. L. Baselga. Science and information theory. Comment on the "H" Concentration Measure as a Numbers-Equivalent. L. Plastino. E. D. C. G. K. Journal of Physics A: Mathematical and Theoretical 41(202001): 1-9. et Bar-Yam. U.. (2003). J. (1921). J.BIBLIOGRAPHIE Adelman. (2010b). F. A New Phylogenetic Diversity Measure Generalizing the Shannon Index and Its Application to Phyllostomid Bats. Arrhenius. Pflanzensoziologie: Grundzüge der Vegetationskunde. N. Ecology 91(7): 1974-1981. W. additive partition does not... Basharin. et Parker. (2010). Herault. H. A. Braun-Blanquet. Poorter. Baraloto. (1970). Estimating species richness: Sensitivity to sample coverage and insensitivity to spatial patterns. Functional trait variation and sampling strategies in species rich plant communities. D. Sampling Hubbell's neutral theory of biodiversity. 69 .. P.. A. On a Statistical Estimate for the Entropy of a Sequence of Independent Random Variables. H. Bourguignon. Allen. Functional Ecology 24: 208-216. Beck. Hinrichsen. M.. et Muñoz. J. O. Bordenave. J. (1959). Quantitative botanical diversity descriptors to set conservation priorities in Bakhuis Mountains rainforest. JATBA. D. M.. B. Species and Area. Patiño. Chao. (2003). C. (1974). Vitousek. Biometrics 64(4): 11781186. H. Ecology Letters 12(7): 693-715. Chao. R. Chiu. Journal of the American Statistical Association 87(417): 210-217. E. P.. E.Mesures de la biodiversité Bulmer. A. A. Chao. Proposing a resolution to debates on diversity partitioning. S. (1984). Y.html. M. et Diaz.stat. Burnham. S. Chao. A. et Chazdon. A. Regetz. Nonparametric estimation of Shannon's index of diversity when there are unseen species in sample.. T. A Two-Stage Probabilistic Approach to Multiple-Community Similarity Indices.-J. S. Cadotte. Chao. et Warwick.. Chao. T.. Chiang.. P. P. Ecology 93(12): 2533-2547. (2008). in N. Chapin. (2003). C. R. Hobbie. P. Hooper. J. Biometrics 30(1): 101-110. Chao. L. abundance and evolutionary history. K. K.. T. S. et Hsieh. Coverage-based rarefaction and extrapolation: standardizing samples by completeness rather than size. Environmental and Ecological Statistics 10(4): 429443. M. Phylogenetic diversity measures based on Hill numbers. Balakrishnan. O. (1987). (2004). Vidakovic. J.. M. H. et Jost. Plot sizes used for phytosociological sampling of European vegetation. W.. A further biodiversity index applicable to species lists: variation in taxonomic distinctness.edu. R. A. L. Nonparametric estimation of the number of classes in a population. C. (1983). Robust Estimation of Population Size When Capture Probabilities Vary Among Animals. W.. S. W. (2010). G. U. et Shen... (2012). Read et B. D. (2010). T. Program SPADE: Species Prediction And Diversity Estimation. S. C.. et Otýpková. Chao. The origins of the Gini index: extracts from Variabilità e Mutabilità (1912) by Corrado Gini. et Overton. (2001). Chytrý.tw/softwareCE. Jost.-M. J. A. V. Lavorel. Clarke. Marine Ecology-Progress Series 216: 265-278. (Eds). H. M. L. E. http://chao. S. B. M.. Mack. CARE. Ecology 93(9): 2037-2051. K. Ecology 60(5): 927–936. S. A. New York. (2012). E. F. et Shen. Scandinavian Journal of Statistics 11: 265-270. L. A. (1992). Consequences of changing biodiversity.. Cleland. A. Kozak. Davies. et Jost.-H. A. Ecology Letters 13(1): 96-105.. Program and user’s guide. The analytical solution of the additive constant problem. Psychometrika 48: 305-310. T. C. F. Kembel.nthu. Species richness estimation. Wiley. J. Philosophical Transactions of the Royal Society B 365(1558): 3599-609. Nature 405(6783): 234-242. L. Cailliez. S. Encyclopedia of Statistical Sciences... Journal of Economic Inequality 10(3): 421-443. et Verme. C. (2012).. et Kembel. H.-H. (1979). S. The merging of community ecology and phylogenetic biology. (2010). Phylogenetic diversity metrics for ecological communities: integrating species richness. Ceriani. Zavaleta. (2000). Jiang. Sala... Chao. Estimating the population size for capture-recapture data with unequal catchability. A. 70 . Estimating the Number of Classes Via Sample Coverage. Eviner. T. Journal of Vegetation Science 14(4): 563-570. Cavender-Bares. et Lee. R. V. Chao. M. On Fitting the Poisson Lognormal Distribution to Species-Abundance Data. et Oakley. Chiu. Naylor. Biometrics 43(4): 783-791. L. Z. L.. W. (2009). Fine. Reynolds. H. et McCoy. Ecology 91(7): 1962-1963. D. M. N. The American Naturalist 162(6): 734-743. J. H. Esty. Condit. Gurvich.. (2004). Foster. J. v. How to make regional lists of butterflies: some thoughts. (2003). E. Estimating the Richness of a Population When the Maximum Number of Classes Is Fixed: A Nonparametric Solution to an Archaeological Problem. I. H. G. The imprint of the geographical. The measurement of the inequality of incomes. H. d.. O. E. P. Z. The American Naturalist 113(6): 791-833. K.. B. D. P. (1996). Couteron. C. (1979). Ecography 35(7): 661672. R. Steege. Conservation evaluation and phylogenetic diversity.. Coleman.. t. K. Additive apportioning of species diversity: towards more sophisticated models and analyses. Chao.. Manokaran. Connor. PLoS One 7(5). J. D. O. E. H. (2003). Garnier. F. Dauby. et Hillebrand. R. H. The Economic Journal 30(119): 348-361. Heijden.. and gamma diversity. A.. The Annals of Statistics 11(3): 905-912. Cousins. M. S. Daróczy. et Poorter. et Summerville. V. et Pélissier. (1991). Davis. Pausas. (2012).. P.. Reich. (1941). Journal of Ecology 84(4): 549-562. Oikos 107(1): 215-221. T. K. Hwang. Sampled-based estimation of diversity sensu stricto by transforming Hurlbert diversities into effective number of species. S.. Buchmann. Diaz. Faith. R. et Colwell.. J. W.. Species diversity measurement: Choosing the right index. J. Texas: 54 p. Cornelissen. M. Generalized information functions. P. G. Information and Control 16(1): 36-51. Journal of the Lepidopterists' Society 33(4): 216-231. Dalton. Lennon. H. UTIP Working Paper. H. On random placement and species-area relations.. P. Ellison. Sukumar. (1979). Partitioning diversity. The Principia Press. J. (1983). Bloomington.. S. Eren. et Ashton. A. 14. S. Species-Area and Species-Individual Relationships for Tropical Trees: A Comparison of Three 50-ha Plots. Hubbell. B.Bibliographie Clench. evolutionary and ecological context on species–area relationships. A handbook of protocols for standardised and easy measurement of plant functional traits worldwide. (1970). T. S. et Ferreira. H. (1981). S.. S. G. H. The theory of econometrics. A. (1920). Partitioning species diversity across landscapes and regions: A hierarchical analysis of alpha. Morgan. Veech. J. R. N. The Statistics and Biology of the Species-Area Relationship. W.. A Normal Limit Law for a Nonparametric Estimator of the Coverage of a Random Sample. et Hardy. beta. D. Lavorel. (1992).. Ecology Letters 9(2): 215-227. Gering. C. E. Conceição. (2010). 71 . R. B. Crist. The Young Person’s Guide to the Theil Index: Suggesting Intuitive Interpretations and Exploring Analytical Applications. J. Trends in Ecology and Evolution 6(6): 190-192. D. (2000). P. Australian Journal of Botany 51(4): 335-380. Mathematical Biosciences 54(3-4): 191-215. (2012). A. Lafrankie. W. (2006).. Austin. Biological Conservation 61(1): 1-10. Indiana Drakare.. P. S. J. (2008). A. Horvitz. Gini. S. Hardy. Gaston. Corbet. J. J. Interpreting and estimating measures of community phylogenetic structuring. (2000). et Thompson. et Senterre. Hill. C. Grassberger. Grilli. Kinzig. (2003). an R Package For Simulating Ecological Drift Under the Unified Neutral Theory of Biodiversity. et Hoffmann. Global patterns in biodiversity. et Colwell. ArXiv Physics e-prints 0307138. Gotelli. (2011). (2010). (1912). et Guiasu. http://ebe. (1973). et Maritan. Journal of Statistical Software 22(12): 1-15.ac. On the Population Frequency of Species and the Estimation of Population Parameters. A program to compute statistically unbiased indices of species diversity within sample and species similarity between samples using rarefaction principles. Is there a “true” diversity? Ecological Economics 65(2): 213-215. Gower. J. Biometrika 40(3/4): 237-264. N. D. R. S. (2007). J. P. Journal of Theoretical Biology 313(0): 87-97.. S. Self-similarity in the distribution and abundance of species. Havrda. H. Hardy.2. 3: 1-158. Natural Science 3(9): 795-801. S. I. J. J. Characterizing the phylogenetic structure of communities by an additive partitioning of phylogenetic diversity. J. Nature 405(6783): 220-227. Hankin. K. et Goldenfeld. J. Harte. Diversity and Evenness: A Unifying Notation and Its Consequences. (2006).be/ebe/Software. Hardy. et Jost. A. Concept of structural α-entropy. F. Banavar. Science 284(5412): 334-336. Spatial aggregation and the species–area relationship across scales. Journal of Animal Ecology 12: 42-58. D.html. O. L. R.Mesures de la biodiversité Fisher. J. (2001). A. J. (2007). On the Relation Between Species and Area. A generalization of sampling without replacement from a finite universe. G. Hoffmann. (1967). Biometrics 27(4): 857-871. A. Ecology 3(2): 158-162. Quantification method of classification processes. B.. H. Gárcia Martín. A General Coefficient of Similarity and Some of Its Properties.ulb. B. N. Studi Economico-Giuridici dell’Università di Cagliari. (1971). Kybernetika 3(1): 30-35. Proceedings of the National Academy of Sciences 103(27): 10310-10315. (1953). BiodivR 1. Journal of Ecology 95(3): 493-506. (2008). C. O.. J. (2012). R. P. A. A. On the origin and robustness of power-law species-area relationships in ecology. R. Physics Letters A 128(6–7): 369-373. O. C. Variabilità e mutabilità. (1952). (1922). Gleason. The weighted quadratic index of biodiversity for pairs of species: a generalization of Rao’s index. Ecology Letters 4(4): 379-391. et Green. et Williams. Quantifying biodiversity: procedures and pitfalls in the measurement and comparison of species richness. M. O. Ecology 54(2): 427-432. Good. Journal of Ecology 96(5): 849-852. R. et Charvát. (1943). Introducing untb. (1988). Journal of the American Statistical Association 47(260): 663-685. J. (1999). Entropy Estimates from Insufficient Samplings. C. Grassberger.. Guiasu. 72 . The relation between the number of species and the number of individuals in a random sample of an animal population. K. Università di Cagliari. Azaele. Finite sample corrections to entropy and dimension estimates. K. (2012). Ecography 27(5): 637-642. et Pavoine. (1906). C. Princeton University Press Hubbell. Sur les fonctions convexes et les inégalités entre les valeurs moyennes. (1951). Entropy and diversity. The Nonconcept of Species Diversity: A Critique and Alternative Parameters. Biodiversity and Conservation 15(4): 12531270. V. R. (2006). Inventory. L. Ecological Indicators 14(1): 1-6. Jost. A. R. L. (2001). (1978). Ecology 52(4): 577-586. Jones. Oikos 76: 5-13. Keylock. A. Models and statistics for species diversity. Journal of Animal Ecology 43(2): 381-399. Jost. L.harvard. P. Partitioning diversity into independent alpha and beta components. Izsák. Estimating species richness at large spatial scales using data from small discrete plots. R. D. et Matloff. G. and proportional diversity: a consistent terminology for quantifying species diversity. Kumar. A. 73 . Kempton. (2004). et Foster. J. Krishnamani. Kullback. L. https://ctfs. Tree diversity in western Kenya: Using profiles to characterise richness and evenness. N. J. L. Statistics and partitioning of species diversity. Kempton. New concentration measures as kinds of the quadratic entropy. P. L. GST and its relatives do not measure differentiation. Jurasinski. Journal of Economic Entomology 79(5): 1156-1160. Jost. Simpson diversity and the Shannon-Wiener index as special cases of a generalized entropy. V. R. R. J. (1974). Biometrics 34: 25-37.. S. A. Jost. R. R. R. (2005). M. (2009). Oikos 113(2): 363-375. Ecology 88(10): 2427-2439. S. Independence of alpha and beta diversities. Acta Mathematica 30(1): 175-193. L. B. Oecologia 159(1): 15-26. S. Molecular Ecology 17(18): 4015-4026. Retzer. (2010). Kempton.. A. Jost. J. R. W. Statistical Hypothesis Testing in Biology: A Contradiction in Terms. The Annals of Mathematical Statistics 22(1): 79-86. and similarity among multiple communities. et Leibler. (1996). et Harte.arnarb. Ecology 91(7): 1969-1994. (2006). et Pavoine. R. Nature 262(5571): 818-820. Kindt. A comparison of three measures of species diversity. Izsák. J. A. et Simons. et Beierkuhnlein. S. Ecological Indicators 11(2): 540-544. The unified neutral theory of biodiversity and biogeography. Log-series and log-normal parameters as diversity discriminators for Lepidoptera. et Taylor. L. Ecological Economics 68: 925-928. S. W. Links between the species abundance distribution and the shape of the corresponding rank abundance curve.Bibliographie Hubbell. H. J.. Mismeasuring biological diversity: Response to Hoffmann and Hoffmann (2008). (2011). Oikos 109(1): 203-207. Barro Colorado Forest Census Plot Data. R. Hurlbert. differentiation. Condit. et Taylor. (1971). (2007). Jensen. On Information and Sufficiency. (2009). S. et Wedderburn. (2008).. Lande. P.edu/webatlas/datasets/bci. C. R. (1986). Van Damme. (2005). (1976). Lineweaver. M. Magurran. E. (1993). The Decomposition of Shannon’s Entropy and a Confidence Interval for Beta Diversity. A. J. Divergence Measures Based on the Shannon Entropy. R. Diamond. E. entropart. O. an R package to partition diversity. R. I. A test of the unified neutral theory of biodiversity. Patterns of species abundance and diversity.. Proceedings of the National Academy of Sciences of the United States of America 43(3): 293-295. McGill. Quarterly Publications of the American Statistical Association 9: 209-219. L. Econometric Reviews 12(2): 137-181. C. Science 290(5499): 2084-2086. (1905). Species-Area Relations in Tropical Forests. May. Methods in Ecology and Evolution. J. I. (1999). R. 74 . Marcon. Generalization of the partitioning of Shannon diversity. Ecological diversity and its measurement. M. Biological Reviews 40(4): 510-533. Herault. The Determination of Enzyme Dissociation Constants. A. Ecological Modelling 192(1-2): 299-313. W. Hurlbert. (1955). G. B. in M. Hérault. et Lang. Partitioning phylodiversity. K. Ugland. R. Lorenz. (2003). Why Worry about How Many Species and Their Loss? PLoS Biol 9(8): e1001130. A... (2012). H. (1957). MacArthur. McGill. Patterns of species diversity. R. (2000). Soykan. Anderson. H.Mesures de la biodiversité Leinster. M. Lin. B. T. et Burk. Ecology 80(5): 1522-1536. P. Fluctuations of Animal Populations and a Measure of Community Stability. J. E. et Stumpf.. (1988). S. Enquist. Princeton. J.. H. U. Global Patterns of Plant Invasions and the Concept of Invasibility. Measuring diversity: the importance of species similarity. D. M. Etienne. (2011).. NJ Marcon. Rossi. (submitted). Maurer. Alonso. (2006). L. A compendium to information theory in economics and econometrics... A. D. Green. Marquet. M. I. Magurran. (1975).. E.. B. Benecha. He. M. Nature 422(6934): 881885.. PLOS One. Ecology and Evolution of Communities. E. Lloyd. P. E. Lonsdale. G. (submitted-a). E. E. Maasoumi. (1991). et Hérault. Marcon.. MacArthur. et Ghelardi. et White. B. Ostling. Journal of the American Chemical Society 56(3): 658-666. H. et Taticchi. K... M. J. Methods in Ecology and Evolution. J. et Hérault. On the Relative Abundance of Bird Species. Scotti.. MacArthur. Princeton University Press. B. (submitted-b). J.. C. Ecology 36(3): 533-536. R.. Dornelas. Marcon. et Lang. A. R. B. Gray. F. Methods of Measuring the concentration of Wealth. Cody et J. V. M. (Eds). C. May. et Cobbold.. B. Investigating beta diversity by Kullback-Leibler information measures. May. Ecology. Journal of Animal Ecology 33(2): 217-225. M.... H. H. A. Oikos 121(4): 516-522. (1964). R. S. M. IEEE Transactions on Information Theory 37(1). M. A. (2011). (1934). Ludovisi. A Table for Calculating the `Equitability' Component of Species Diversity. (1965). Harvard University Press: 81120. J. B. Baraloto. Neyman. M. F. H. D. Dumay. Mason. C.. Agostinho. H. B. D. (2009). (2001).. Pallmann. W. Morin. B. M. (1973). L. B. A.. et Bonsall. Dufour. N. D. et Taillie.-C. O'Hara. BioEssays 33(11): 819-822. K... R. Priesnitz.. P. M. Simpson. et Findlay. From dissimilarities among species to dissimilarities among communities: a double principal coordinate analysis. D. Researches on Population Ecology 41(2): 203-215. Pavoine. S. K. A. J. (2011). Kindt. (1998). Thomaz. M. M. Mérigot. O. et Leprêtre. P. B.ca/bio3515/pdf/presentations/02-Biodiversite. H. Journal of the Royal Statistical Society B 20(1): 1-43. Species abundance distributions: moving beyond single prediction theories to integration within an ecological framework. G... P. Legendre. M. A unified index to measure ecological diversity and species rarity... Tittensor. A comparison of species diversity estimators. Hothorn. L. S. (2008). G. et Gomes. Fischer. B. H. R. Mouillot. (2005). Mora. P. N..pdf. Measuring biodiversity to explain community assembly: a unified approach. Theoretical Population Biology 75(2-3): 153163. Molecular Ecology Resources 12(6): 1068-1078. L. Biological Reviews 86(4): 792-812. Oecologia 142(3): 353-359. Patil. Hierarchical partitioning of evolutionary and ecological patterns in the organization of phylogenetically-structured species assemblages: 75 .org/package=vegan. L. L. Schaarschmidt. and advantages of quadratic entropy. processus. S.. How Many Species Are There on Earth and in the Ocean? PLoS Biol 9(8): e1001127. Biodiversité : tendances et http://simulium.bio.. J. Love. et Scott. (1982). A. Statistical Approach to Problems of Cosmology. et Bonsall. Michaelis. F. Minchin. Ecography 31(4): 450456. A. R. J... Functional regularity: a neglected aspect of functional diversity. Journal of the American Statistical Association 77(379): 548-561. J. H. http://CRAN. P. Ecology Letters 10(10): 995-1015. (2007). H. et Menten. L. Stevens. B. Nei. S.. A. Biochemische Zeitschrift 49: 333-369. (1999). et Gaertner. M. B. S.. (2004). (1958). Norris.uottawa. Incorporation of phylogeny in biological diversity measurement: Drawbacks of extensively used indices. (2012). Diversity as a concept and its measurement. C.-B. Analysis of Gene Diversity in Subdivided Populations. J. C. B. et Chessel. G. et Worm.. et Wilson. vegan: Community Ecology Package. (1913). S. et Wagner. Pavoine. Biological diversity: Distinct distributions can lead to the maximization of Rao's quadratic entropy. S. Non-parametric MLE for Poisson species abundance models allowing for heterogeneity between species. (2012). E.. U. S. (2011). R. Blanchet. Oksanen.. Mouillot. P. (2009). Adl. M. Die Kinetik der Invertinwirkung. L. Environmental and Ecological Statistics 5(4): 391-402.. J.. Evangelista. Pavoine. G. A. et Bonsall.. A. Assessing group differences in biodiversity by simultaneously testing a user-defined selection of diversity indices. S. Mendes. Pavoine. (2011). R. Solymos. L. C. Nacke.Bibliographie P. et Schork.R-project. Simpson. Proceedings of the National Academy of Sciences of the United States of America 70(12): 3321-3323. Journal of Theoretical Biology 228(4): 523–537. et Pollock. Couteron.R-project. Rao. S.. Ricotta. E. C. (1969). Petchey. S. Pavoine. Preston. The measurement of diversity in different types of biological collections. et Dufour. R. Ecology 41(4): 611-627.. Ricotta. (2007). (1999). P. Consistency between ordination techniques and diversity measurements: Two strategies for species occurrence data. P.. Species-diversity and pattern-diversity in the study of ecological succession. W.. (2000). And Rarity. (1948). (2003). Time and Space and the Variation of Species. Ecology Letters 12(9): 898-908. D. D. 76 . University of California Press. F. E. On Measures of Entropy and Information. R Foundation for Statistical Computing. R Development Core Team (2013). The Commonness. species richness and community composition. Condit.. B. (1960). Pielou. Oikos 115(1): 179-185. W. (1966a). F. et Couteron. An operational. Diversity and dissimilarity coefficients: a unified approach. J. E. (2003). Ecology 84(1): 242-251.-B. J. R. et Sabatier. Preston. E. Lee. Podani. et Gaston. C. R. Journal of Ecology 95(2): 294-300. additive framework for species diversity partitioning and beta-diversity analysis. (2005a). Bunyavejchewin. L. J. (1961). Wiley.org. Hubbell. (1966b). R: A Language and Environment for Statistical Computing. Journal of Theoretical Biology 222(2): 189-197. Taxon 48(2): 331-340. C. S. Berkeley. A. D. Yu. Journal of Theoretical Biology 10(2): 370-383. et Schmera. R. J. P. Podani. Pélissier. Functional diversity (FD).. Preston.Mesures de la biodiversité Application to rockfish (genus: Sebastes) in the Southern California Bight. (1975).. Additive partitioning of Rao's quadratic diversity: a hierarchical approach. LaFrankie. et Pontier. C. Ecological Modelling 183(4): 365-371. New York. http://www. Potts. Ecology 43(2): 185-215. Pielou. Proceedings of the National Academy of Sciences of the United States of America 97(20): 10850-10854. Dray. S. O. M. W.. 286 Pielou. Pélissier. R. Pavoine. Manokaran. Rényi. J. R. (2005b). New York Plotkin. S. H. C.. Ecology 29(3): 254-283. Wiley. D. Theoretical Population Biology 21(24-43). Extending Gower's General Coefficient of Similarity to Ordinal Characters. A. C. M. W.. et Ashton. The Canonical Distribution of Commonness and Rarity: Part I. S. (2002). USA. S. N.. K. Ecological Diversity.. Ecology Letters 5: 402-411. Is the originality of a species measurable? Ecology Letters 8: 579–586. B. On dendrogram-based measures of functional diversity. F. of Species. Predicting species diversity in tropical forests. D. A. Ollier. On parametric evenness measures. An Introduction to Mathematical Ecology. (1982). S. 4th Berkeley Symposium on Mathematical Statistics and Probability... Journal of Theoretical Biology 13(C): 131-144.-S. diversity from dissimilarities with Rao's quadratic entropy: Are any dissimilarities suitable? Theoretical Population Biology 67(4): 231-239. Ollier. P. Nowak. Foster. Measuring. (1962). Pielou.. Sukumar. (2005). (2006). C. et Avena. Ecology 90(8): 2161-2170. R. Schmera. et Pacini. (1967). (1958). Schürmann. (2005). 77 . W. Oikos 93(1): 135-147. C. Six types of species-area curves. E. A. Chicago Tothmeresz. et Enquist. J. H. Global Ecology and Biogeography 12(6): 441-447. Scheiner. De Zuliani. (1979). (1963). et Llorente B. Triantis. (2003). (1988). Shimatani. C. Opposing assembly mechanisms in a Neotropical dry forest: Implications for phylogenetic and functional community ecology. et Wilson. C. Journal of Vegetation Science 6(2): 283-290. P. The University of Kansas Science Bulletin 38(22): 1409-1438. J. A semantic taxonomy for diversity measures. On beta diversity decomposition: Trouble shared is not trouble halved. (2003). (1995). H. The Mathematical Theory of Communication. T. et Hawkins. Shannon. A statistical method for evaluating systematic relationships. B. Acta Biotheoretica 55(1): 2333. (2010). Swenson. Journal of Physics A: Mathematical and Theoretical 37(27): L295-L301. D. Smith.. The Bell System Technical Journal 27: 379–423. Shannon. Conservation Biology 7(3): 480-488. R. The island species–area relationship: biology and statistics. J. et Weaver. Journal of Biogeography 39(2): 215-231. O. Aquatic Ecology 43(1): 157-167. Rand McNally and Company. et Whittaker.. E. Oikos 76(1): 70-82. A new family of Fisher-curves estimates Fisher's alpha more accurately. E. R. Schulte. Ecology 84: 798-804. (2004). D. Diversity indices: Which ones are admissible? Journal of Theoretical Biology 76(4): 503-515. C. B. S. et Lin. Measurement of diversity. J. Ricotta. T.. Erős. Ecology 91(7): 1981-1983. A. A measure for assessing functional diversity in ecological communities. Economics and Information Theory. A. C. C. et Podani. Plant Biosystems 137(1): 57 . K. J. On the mutual relatedness of evenness measures. C. et Michener. (2012). Theil. (1996). (1948). Chao. Lantinga.. (1993). F. Soberón M. A Mathematical Theory of Communication. A consumer's guide to evenness indices. E. K. Comparison of different methods for diversity ordering. (2001).Bibliographie Ricotta. An information-theoretical measure of β-diversity. Journal of Statistical Physics 52(1): 479-487. N. (2007). Ricotta. (2009).61. Predicting the number of new species in a further taxonomic sampling. (2001). G. Guilhaumon. Routledge. C. Possible generalization of Boltzmann-Gibbs statistics. B.-F. B. D. (1949). On the measurement of species diversity incorporating species differences. A. Journal of Theoretical Biology 232(3): 305-313. (2009). Nature 163(4148): 688. E. University of Illinois Press Shen.. Sokal. G. Ricotta. J. Tsallis. Simpson. R. Bias analysis in entropy estimation. M... R. M. The Use of Species Accumulation Functions for the Prediction of Species Richness. (2003).-J. 623–656. J. T. Community Ecology 2(1): 51-56. C. Summerville. Defining beta diversity as a function of alpha and gamma diversity. (2005). Tuomisto. D. BMC Bioinformatics 6(1): 300. Ulanowicz. Computers & Chemistry 25(4): 393399. C.. H. O. Ecography 33(1): 23-45. et Crist. H. P. Walker. What are the numbers that experiments provide? Química Nova 17(6): 468471. (2000). Webb. C. Hubbell. Oecologia 167(4): 903-911. (2010b). Oregon and California.. Toward a unified view of diversity partitioning. P.. Veech.-P. H. J. T. The additive partitioning of species diversity: recent revival of an old idea. E. Wang. T. R. R. R. Commentary: do we have a consistent terminology for species diversity? Yes. et Gering. Diversity partitioning without statistical independence of alpha and beta. T. (1965). (2012). Tuomisto. C.. Journal of Ecology 96(5): 845-848. H. S. Vegetation of the Siskiyou Mountains. (2002).-P. Wang. J. J. Ecology 91(7): 1988-1992. R. H. Whittaker. J. Estimating species richness by a Poisson-compound gamma model. (1999). (2003). Tuomisto.-P. Wall. J. Cui. A. Ecology 91(7): 1964-1969. Biometrika 97(3): 727-740. Tuomisto. (2001). 78 . S. SPECIES: An R Package for Species Richness Estimation. K. J. et Crist.Mesures de la biodiversité Tsallis. Exploring the phylogenetic structure of ecological communities: An example for rain forest trees. Evolution of species diversity in land communities. Oikos 99(1): 3-9. Additive partitioning of diversity including species differences: a comment on Hardy & Senterre (2007). Crist. Quantifying beta diversity and related phenomena. Part 1. J. Marion. Whittaker. B. Veech.. et dePamphilis. K. A. (1994).. Whittaker. R. S. Evolution and Measurement of Species Diversity. H. (2010). O. A. Nature 424(6952): 1035-1037. Science 147(3655): 250-260. American Naturalist 156(2): 145-155. J. if we choose to use it. A. Taxon 21(2/3): 213251. (2010a). (2011). Part 2. Oikos 121(8): 1203-1218. Evolutionary Biology 10: 1-67. J. H. Volkov. Dominance and diversity in land plant communities. (1977). Villeger. Zhang. et Langridge. Original Articles: Plant Attribute Diversity. (2010a). Gene capture prediction and overlap estimation in EST sequencing from one or multiple libraries. (2011). A. (2010b).. B. L. (1972). Resilience. I. (2008). O. J. et Maritan. Information theory in ecology. et Mouillot. Kinzig. and Ecosystem Function: The Nature and Significance of Dominant and Minor Species. O. Neutral theory and relative species abundance in ecology. Lindsay. Journal of Statistical Software 40(9): 1-15. C... Ecosystems 2(2): 95-113.. Whittaker. (1960). Banavar. Ecography 33(1): 222. Veech. A diversity of beta diversities: straightening up a concept gone awry. Wang. R. H. Ecological Monographs 30(3): 279-338. An updated consumer’s guide to evenness and related indices. A diversity of beta diversities: straightening up a concept gone awry. J. Ecology 91(7): 1984-1988. J... J. (1964). Bongers. Zhang. H. Flexas.. C. Ackerly. Niinemets. M. Wilsey. (2004). J. Cornelissen. G. I. Roumet. B... L. P. Poot. M. K. Reich. Patterns in the balance of nature. J. B. W. Navas. 79 . et Villar. J... J.. B. An empirical comparison of beta diversity indices in establishing prairies. Chapin... K. Lee. E. M. H. Westoby. A. Z. Osada. H. Lusk. Lee. J. (2009). et Lonsdale. Diemer. P. B.. (2008). Midgley. Turing's formula revisited. Wright. Academic. Zhang. C. C. U.Bibliographie Williams. (2010).. CavenderBares. H.. J. Roots of Diversity Relations. Garnier. Gulias. P.. N... Thomas. The species–area relationship does not have an asymptote! Journal of Biogeography 28(7): 827-830. et Huang.. B. E. Poorter. Nature 428: 821-827. Z. D. M. Annals of Statistics 37(5A): 2582-2595. C.. M. J.-L. V. et Annila. P.. Gaston. Prior... Y. T. Hikosaka. Würtz. S. (2001). Asymptotic Normality of a Nonparametric Estimator of Sample Coverage. Z. Journal of Biophysics 2008: Article ID 654672.. F. D. J.. Veneklaas.. C.. W. Pyankov. Tjoelker. Oleksyn. The worldwide leaf economics spectrum. C.. Baruch. T... M. 324 Williamson. et Zhang. K. J... Lamont. I. Groom. Journal of Quantitative Linguistics 14(2-3): 222-241. (2007). R...