WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Modélisation spatiale hiérarchique bayésienne de l'apparentement génétique et de l'héritabilité en milieu naturel à  l'aide de marqueurs moléculaires


par Ciré Elimane SALL
Université Montpellier II - Doctorat 2009
  

précédent sommaire suivant

4.1.2 Analyse statistique des données

Nous avons étudié la diversité génétique du karité avec les logiciels POP-GENE (Yeh et Boyle, 1997) et FSTAT (Goudet, 2001). Les paramètres standards mesurant la diversité génétique ont été calculés. Ces paramètres sont le nombre d'allèles observés par locus, l'hétérozygotie observée et l'estimation sans biais de l'hétérozygotie attendue sous l'hypothèse de Hardy-Weinberg (Nei, 1987). La similarité génotypique des individus et l'association entre les locus ont été étudiées en effectuant une analyse en composantes principales. En effet, l'analyse en composantes principales (ACP) est une méthode statistique multidimensionnelle qui permet de synthétiser un ensemble de données. Avec un tableau de données constitué de n individus et p variables, l'ensemble des données forme un nuage de m points dans un espace de dimension p et le principe de l'ACP est d'obtenir une représentation approchée du nuage des individus dans un sous-espace de dimension faible k m (Saporta, 1990); ceci s'effectue par projection sur des axes bien choisis en maximisant l'inertie du nuage projeté. L»utilisation de l'ACP nous a permis d'étudier l'association entre les génotypes aux différents locus et l'existence éventuelle de groupes d'individus ayant des génotypes similaires. L'ACP a été réalisée avec le package ade4 du langage de programmation R (Chessel et al., 2004; R Development Core Team, 2008). L'étude de la structuration spatiale est faite, d'une part, selon le phénotype et, d'autre part, selon le génotype. La structure spatiale au niveau phénotypique est caractérisée en donnant la distribution spatiale des arbres en fonction de leur classe de diamètre. La structuration spatiale au niveau génotypique est d'abord évaluée par les FIS. Le paramètre FIS, appelé indice de fixation, mesure la consanguinité intra-population définie par Cockerham (1969) et son expression est :

Ha - Ho
FIS = ,

Ha

avec Ha le taux d'hétérozygotes attendu sous l'hypothèse d'équilibre de Hardy-Weinberg et Ho le taux d'hétérozygotes observé. Cet indice permet donc d'évaluer le déficit d'hétérozygotes dû à l'écart à la panmixie. Le FIS est calculé selon la méthode de Weir et Cockerham (1984) et la valeur critique associée est obtenue par permutations aléatoires des allèles des individus à l'intérieur des échantillons. Le niveau de signification est évalué selon la méthode de correction séquentielle de Bonferroni pour les tests multiples (Rice, 1989). Un FIS significatif est interprété comme un indicateur de la consanguinité dans une population et/ou d'une sous-structuration de la population. La structure génétique spatiale dans un second temps est évaluée à la fois par le test de Mantel, par le corrélogramme de Moran et par l'étude de la relation entre l'apparentement estimé et la distance spatiale. Nous avons, à cet effet, défini 15 classes de distance avec un pas de 10 m par classe. Le coefficient d'apparentement moyen entre les individus de chacune des classes est alors calculé selon trois méthodes différentes (méthode de Lynch et Ritland (1999), méthode de Wang (2002) et méthode de Milligan (2003)). Nous avons étudié la relation entre le coefficient d'apparentement moyen estimé selon ces deux méthodes des moments et le logarithme de la distance entre les individus. Le test de signification de l'estimateur du coefficient d'apparentement moyen par classe de distance est réalisé par permutations aléatoires (1000 permutations) des positions géographiques des génotypes des individus en utilisant le programme SPAGEDI (Hardy et Vekemans, 2002) ; ceci concerne uniquement les estimations données par les deux méthodes basées sur le calcul des moments (Lynch et Ritland (1999), méthode de Wang (2002)). L'estimation de l'apparentement par maximum de vraisemblance (modèle de Milligan (2003)) a été réalisée avec le programme ML-Relate (Kalinowski et al., 2006). L'utilisation du programme SGS (Degen et al., 2001) nous a permis de calculer, pour chaque classe de distance, l'indice d'agrégation (p) qui est basé sur celui de Clark et Evans (1954) afin de déterminer la structure spatiale du karité dans la parcelle en jachère (Ripley, 1981; Degen, 2000). Une valeur de p < 1 indique que la distribution est agrégée, p = 1 pour une distribution aléatoire et lorsque p > 1 la distribution est dite régulière (Hardesty et al., 2005). Le nombre de classes de distance est ajusté pour garantir qu'il y ait un minimum de 30 paires d'individus dans chacune des classes. Ce choix est justifié en raison de la robustesse des tests de permutation (Hardesty et al., 2005). L'indice d'autocorrélation de Moran est calculé pour chaque classe de distance; cet indice est l'une des statistiques de test d'autocorrélation spatiale la plus utilisée (Hardy et Vekemans, 1999). Il est défini pour chaque classe

de distance d par

I(d) =

2 E (ds,ij - ds) (dg,ij - dg)

(n(n - 1) - 2) i<j ós

g

ñm =

nE1 Enjùij(d)(fi - f)(fj - f)

(E7 ETI ùij (d)) (Eni(fi - f)2)

oil n est le nombre d' arbres, fi et fj sont respectivement les valeurs observées aux sites i et j, f est la moyenne des fi et ùij(d) sont les poids associés qui valent 1 si le site i et le site j sont séparés d'une distance comprise dans d et 0 sinon (Hardy et Vekemans, 1999). Pour décrire la structure génétique, la variable f considérée représente la fréquence d'un allèle A donné et cette fréquence peut être définie à différents niveaux : une sous-population, un individu, ou un allèle. Dans la plupart des applications, l'indice I de Moran est utilisé pour décrire la structure génétique d'une population continue et les fréquences alléliques sont définies au niveau individuel. Pour un individu diploïde, les fréquences alléliques sont 0 , 0.5 et 1 pour, respectivement, les génotypes aa, aA, et AA, oil a représente tout autre allèle différent de l'allèle A (Hardy et Vekemans, 1999). L'indice de Moran ainsi calculé correspond à l'estimation moyenne par classe de distance du coefficient d'apparentement de Wright (Cockerham, 1969; Hardy et Vekemans, 1999) qui est la corrélation entre les fréquences alléliques moyennes entre deux individus . Le coefficient d'apparentement de Wright, ñij, entre deux individus diploïdes, i et j, est

ñij =

2èij

v1 + FiV1 + Fj

oil èij est le coefficient d'apparentement et Fi est le coefficient de consanguinité de l'individu i (Hardy et Vekemans, 1999).

L'existence d'une association entre les distances génétiques et les distances géographiques est évaluée par le test de Mantel. Ce test permet de calculer la corrélation entre deux matrices de distance (Rossi, 1996). Dans le cas précis qui nous intéresse, il s'agit des matrices de distance génétique et de distance spatiale et nous voulons savoir si des individus spatialement proches ont tendance à être aussi génétiquement proches. La matrice des distances génétiques qui permet d'estimer la similarité génétique entre les individus a été calculée selon la méthode de Nei (1972). La statistique normalisée de Mantel est donnée par

d'individus (Arnaud et al., 1999). La corrélation obtenue avec les données est comparée aux correlations obtenues lorsque les lignes et les colonnes d'une des deux matrices sont permutées aléatoirement. Il s'agit de simuler des réalisations de l'hypothèse nulle : absence de corrélation linéaire entre les deux matrices. il est possible tester l'hypothèse nulle avec la statistique de Mantel, calculée pour chaque permutation (Rossi, 1996). 1000 permutations seront effectuées.

précédent sommaire suivant