WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Modélisation spatiale hiérarchique bayésienne de l'apparentement génétique et de l'héritabilité en milieu naturel à  l'aide de marqueurs moléculaires


par Ciré Elimane SALL
Université Montpellier II - Doctorat 2009
  

précédent sommaire suivant

Conclusion générale et

perspectives

La génétique quantitative s'intéresse à l'étude de la transmission héréditaire des caractères quantitatifs. Un caractère répond à la sélection lorsque'il a une variabilité génétique héritable et qu'il n'est pas contraint par les corrélations génétiques avec d'autres caractères sous sélection. De manière classique, des dispositifs expérimentaux oil les croisements entre individus sont contrôlés sont mis en place et permettent d'estimer l'héritabilité. Cependant, l'héritabilité d'un caractère mesuré en laboratoire ou en serre est différente de l'héritabilité de ce même caractère mesuré en milieu naturel. Ceci s'explique par les différences environnementales et l'interaction génotype-environnement. Actuellement, des programmes de recherche sont de plus en plus menés avec des dispositifs de sélection participative en milieu naturel. Hors en milieu naturel, comme les croisements ne sont pas contrôlés, l'apparentement n'est pas connu ou, au mieux, il n'est connu que partiellement. La possibilité d'estimer l'apparentement et l'héritabilité des caractères en milieu naturel à l'aide des données moléculaires suscite un intérêt croissant dans différents domaines liés à l'amélioration génétique des populations.

Ce travail de thèse nous a permis tout d'abord de généraliser le modèle de la vraisemblance de Milligan pour l'apparentement. Nous avons montré que le modèle de Milligan s'insère dans un cadre théorique plus large qui est celui de la vraisemblance composite. En effet, le modèle de Milligan pour n individus consiste à écrire le produit des lois jointes des couples de génotypes et revient à écrire la vraisemblance composite par paires. Nous avons défini le modèle de la vraisemblance composite par paires pour l'estimation de l'apparentement. Cependant, les approches classiques pour l'estimation de l'apparentement génétique développées jusqu'ici ne permettent pas de prendre en compte une information exogène comme l'information spatiale. Or, il serait raisonnable de supposer que plus des individus sont spatialement proches plus ils sont génétiquement proches. Nous avons développé un modèle spatial bayésien hiérarchique pour l'estimation de l'apparentement génétique entre

des individus sans connaissance du pedigree à l'aide des données moléculaires. L'avantage de la modélisation bayésienne hiérarchique est qu'elle permet de scinder un problème complexe en une série de problèmes plus faciles à traiter. Nous avons supposé que les individus sont non-consanguins et que le mode d'IBD suit une loi multinomiale et proposé de modéliser le mode d'IBD avec un GLM probit ordinal. L'idée est que deux individus proches spatialement sont aussi proches génétiquement. La prise en compte de l'information spatiale permet de modéliser le mode d'IBD en fonction d'une variable latente gaussienne dont la moyenne dépend de la distance entre les individus. Plus précisément, l'information spatiale permet de discrétiser le mode d'identité par descendance.

Nous avons ensuite proposé un modèle bayésien hiérarchique pour estimer à la fois l'apparentement et l'héritabilité en milieu naturel à l'aide des données moléculaires. L'intérêt de ce modèle est qu'il ne suppose pas, contrairement aux modèles de la vraisemblance pour l'héritabilité développés d'abord par Mousseau et al. (1998) et ensuite par Thomas et al. (2000), que la population a une structure d'apparentement prédéterminée et connue. Un autre avantage du modèle est qu'il permet de bien prendre en compte l'effet de la variabilité de l'estimation de l'apparentement sur celle de l'estimation de l'héritabilité. Ce modèle garantit en outre que la matrice d'apparentement estimée des couples d'individus est une matrice symétrique définie positive, ce qui est attendu comme propriété pour une matrice de variance-covariance.

Trois algorithmes MCMC pour l'inférence bayésienne des paramètres du modèle pour l'estimation de l'apparentement sont proposés. Les deux premiers algorithmes sont de type Métropolis-Hastings avec des lois de proposition différentes. Mais comme la difficulté avec un algorithme de MétropolisHastings réside souvent dans le choix de la loi de proposition appropriée, le dernier algorithme pour l'estimation de l'apparentement proposé est un algorithme de Gibbs qui a donc l'avantage d'être plus facilement mis en oeuvre. Comme pour l'inférence des paramètres du modèle spatial hiérarchique pour l'apparentement, la loi a posteriori conditionnelle complète des seuils n'a pas une forme analytique connue et que les lois a posteriori des autres paramètres sont connues, nous ne pouvons pas employer un algorithme de Gibbs pour l'inférence bayésienne. Un algorithme de Métropolis-Hastings couplé à un algorithme de Gibbs pour l'inférence des paramètres du modèle spatial bayésien hiérarchique pour l'apparentement a été proposé. Une difficulté rencontrée dans l'application du modèle spatial pour l'estimation de l'apparentement, c'est qu'avec peu d'observations, il peut arriver qu'aucun couple de génotypes partageant deux allèles identiques par descendance, donc de mode d'IBD 87, ne soit simulé. Le nombre de modalités observé est réduit à 2, donc le modèle est non-identifiable et les seuils associés sont non-estimables.

67

Pour l'application pratique, le jeu de données dont nous disposons ne comporte qu'une seule variable phénotypique, le diamètre des arbres à 1, 30 mètre de hauteur. Le diamètre des arbres est mesuré sur des individus d'âges différents et comme il varie évidemment en fonction de l'âge de l'individu considéré, l'héritabilité de ce caractère pour des individus mesurés à des âges différents est difficilement interprétable. C'est pourquoi nous n'avons pas appliqué le modèle développé dans ce travail pour estimer à la fois l'apparentement et l'héritabilité. Nous avons pu obtenir finalement d'autres données phénotypiques sur le karité et nous envisageons d'appliquer le modèle spatial pour l'estimation de l'apparentement et de l'héritabilité en milieu natural et valoriser ensuite ce travail par une publication. En outre, il nous faudra effectuer plus de simulations pour pouvoir estimer à la fois l'apparentement et l'héritabilité et bien mesurer l'apport du modèle spatial sur l'estimation de ces paramètres. Il serait aussi intéressant de développer un modèle spatial qui prendrait en compte la dépendance entre les couples d'individus. Nous avons considéré dans ce travail que les fréquences alléliques sont connues. Comme en pratique, elles ne sont souvent pas connues, nous allons développer un algorithme pour estimer à la fois les fréquences alléliques, l'apparentement et l'héritabilité. Nous avons supposé avec le modèle spatial pour l'estimation de l'apparentement que la population est composée d'individus non-consanguins. Cependant cette hypothèse peut se révéler restrictive pour l'application pratique du modèle. Il serait intéressant d'envisager le développement d'un modèle spatial pour estimer l'apparentement génétique d'individus issus d'une population consanguine. Dans ce cas, le modèle ne serait plus ordinal comme tous les 9 modes d'identité par état des allèles peuvent être observés. Le modèle approprié est un modèle multinomial et non un modèle probit. De plus, nous pourrions considérer que les observations sont les génotypes d'un triplet et non d'un couple et employer le modèle de la vraisemblance composite par triplets et non par paires. Cependant ceci augmenterait considérablement le nombre de paramètres du modèle.

précédent sommaire suivant