• Logiciel Exogean: Le génome humain décortiqué<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p>

    <o:p> </o:p>

    Exploiter le génome humain est une histoire de méthodes: les voici "revisitées" avec succès par le logiciel Exogean, un pur produit de la bio-informatique. En témoigne la conclusion d'un groupe international d'experts indépendants: sur vingt logiciels d'annotation (outils servant à définir les informations structurantes et fonctionnelles d'un gène), il arrive en tête par son efficacité. L'astuce ? Ce logiciel, qui intègre bien sûr comme informations de base toutes les séquences de l'ADN, modélise non pas les gènes, mais la réflexion et le savoir-faire du biologiste, soit la référence dans l'exploitation du génome humain.<o:p></o:p>

    <?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" /><v:shapetype id=_x0000_t75 stroked="f" filled="f" path="m@4@5l@4@11@9@11@9@5xe" o:preferrelative="t" o:spt="75" coordsize="21600,21600"><v:stroke joinstyle="miter"></v:stroke><v:formulas><v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f></v:formulas><v:path o:connecttype="rect" gradientshapeok="t" o:extrusionok="f"></v:path><o:lock aspectratio="t" v:ext="edit"></o:lock></v:shapetype>
    Représentation d'une section de la double hélice d'ADN
    Représentation d'une section de la double hélice d'ADN<o:p></o:p>


    Hugues Roest-Crollius, du groupe "Dynamique d'organisation des génomes" (Dyogen) à Paris, et un des concepteurs du logiciel, en précise les enjeux: "Après le séquençage, il faut annoter avec le plus de précision chaque gène codant. C'est une étape indispensable pour pouvoir exploiter le matériel biologique." Et ce travail titanesque se heurte à bon nombre d'obstacles. Ne serait-ce que la succession d'introns et d'exons (des petits bouts de séquences codants ou non) au sein des gènes, qui les rend complexes et hautement variables. Ou bien encore la notion de "transcrits alternatifs", c'est-à-dire le fait bien connu désormais que des gènes codent non pas pour une mais pour plusieurs versions d'une même protéine.

    Bref, le challenge, c'est donc de modéliser toute la gamme de ces transcrits. Mais aucun programme informatique – fondé sur un modèle statistique avec ou sans la comparaison de séquences de gènes connus – ne parvenait jusqu'alors à la hauteur de l'annotation "à la main". Entendez un "expérimentateur humain ayant une compréhension globale de la biologie du génome et s'en servant pour trier les données, éliminer la redondance et générer une ou plusieurs structures de transcrit par gène", précise le chercheur.

    Hugues Roest-Crollius a donc joué et décortiqué ce rôle tandis que les informaticiens Sarah Djebali et Franck Delaplace, du laboratoire "informatique, biologie intégrative et systèmes complexes" (Ibisc) en ont formalisé les règles. Résultat: une approche totalement novatrice et parfaitement efficace.

    Comment fonctionne Exogean ? Schématiquement, ce logiciel intègre comme informations de base toutes les séquences de l'ADN et les gènes connus (ARN messagers et protéines) chez l'humain et chez les autres espèces, notamment la souris. Au coeur du processus, se trouve un cadre mathématique appelé "multi-graphes acycliques orientés colorés" (MAOC). Il permet de manipuler virtuellement les gènes et les relations entre eux comme le ferait un expert humain. Au final, on obtient des "objets-gènes" complexes qui synthétisent toutes les informations disponibles dans le logiciel: longueur totale de chaque gène, place des introns, des exons, gamme complète des transcrits, etc. De quoi "booster" la connaissance de notre patrimoine génétique.<o:p></o:p>

    <o:p> </o:p>

    Source: CNRS<o:p></o:p>


    votre commentaire


    Suivre le flux RSS des articles de cette rubrique
    Suivre le flux RSS des commentaires de cette rubrique