Modèle polytomique ordonné

Le graphe de jointure d`une polytomie. Nous définissons d`abord un graphe R basé sur la notion de jointure. Une jointure est une paire non ordonnée {G1, G2} où G1, G2 L`opération de jointure j sur {G1, G2} consiste à joindre les racines de G1 et G2 sous un parent commun; Nous dénotent par G1, 2 l`arbre de jointure résultant. Nous appelons le type de jointure de j = {G1, G2}, et dénote par JT (G1, G2), l`étiquette de rapprochement du noeud créé en joignant G1 et G2 (c.-à-d. la racine de G1, 2), où JT (G1, G2) (S, AD, NAD}), respectivement, pour la spéciation, AD et NAD , WRT l`arbre de l`espèce S. Le présent travail est dédié au problème de raffinement de la polytomie. Alors que le coût de mutation de la réconciliation a été utilisé précédemment comme un critère d`optimisation pour choisir un arbre binaire approprié, ici nous utilisons un autre critère, qui est la minimisation des NADs. La tractabilité du problème MinNADref reste ouverte, tout comme le problème de sélectionner, parmi toutes les solutions possibles, ceux conduisant à un coût de rapprochement minimal. Bien que le développement d`un outil de correction d`arbre de gènes ne soit pas le but de cet article, nous montrons comment notre algorithme de raffinement de polytomie peut être utilisé dans ce contexte, en développant un algorithme simple permettant de corriger un seul NAD. Cet algorithme a été appliqué aux arbres d`une précédente libération de l`ensembl, et les arbres corrigés ont été comparés avec les arbres de la libération actuelle de l`ensembl.

Une bonne corrélation entre les deux ensembles d`arbres est observée, ce qui tend à soutenir notre paradigme de correction. Tout en minimisant les NADs ne peut pas être un critère suffisant pour la correction de l`arbre génétique, il devrait plutôt être considéré comme un parmi d`autres, tels que Statistique (Wu et al., 2012), synténique (Lafond et al., 2013) ou basé sur la réconciliation avec l`arbre d`espèces (Chaup et al., 2011 ; Lafond et coll., 2013; Swon et coll., 2010), qui peuvent être intégrés dans un cadre méthodologique pour la correction des arbres génétiques. Notez que le modèle ASY a une vitesse plus élevée vers l`arrière que vers l`avant; comme prévu, nous estimons un taux de membres perdants qui est plus élevé que le taux de les gagner (bien que la différence est étonnamment faible). Est-ce statistiquement pris en charge? Nous pouvons comparer les scores AIC des deux modèles. Pour le modèle ER, AICc = 163,0, tandis que pour le modèle ASY AICc = 162,8. Le score AICc est plus élevé pour le modèle de taux inégaux, mais seulement d`environ 0,2-ce qui n`est pas définitif de toute façon. Donc, sur la base de cette analyse, nous ne pouvons exclure la possibilité que les taux avant et arrière soient égaux. Ainsi, on peut comparer la probabilité de notre modèle MK au modèle de déchet total. Si la valeur de probabilité maximale de q a la même probabilité que notre modèle d`ordures, nous savons que nous sommes sur une crête de la surface de probabilité et q ne peut pas être estimée.

Nous n`avons pas non plus la capacité de faire des déclarations sur l`évolution passée de notre personnage – en particulier, nous ne pouvons pas estimer l`état ancestral de caractère avec n`importe quelle précision. En revanche, si la probabilité du modèle MK est supérieure au modèle de garbage totale, nos données contiennent des informations historiques. Nous pouvons également faire cette comparaison en utilisant AIC, considérant le modèle de garbage totale comme ayant un seul paramètre p. Le problème de raffinement de la polytomie est motivé par le problème de la correction des arbres génétiques. Les nœuds de duplication peuvent être non approuvés pour de nombreuses raisons, l`un d`eux étant le fait qu`ils sont des NADs, pointant vers des désaccords avec l`arbre d`espèces qui ne sont pas dus à la présence de gènes dupliqués. Différentes observations tendent à soutenir l`hypothèse que les noeuds NAD peuvent pointer vers des parties erronées d`un arbre génétique (chauve et El-mabrouk, 2009; Swanson et coll., 2012).