Un arbre généalogique qui relie 13 millions de personnes.

C'est le plus grand arbre généalogique au monde et il est devenu un phénomène scientifique. Développé par des chercheurs de Harvard, Columbia, du Technion et du Weizmann, il révèlerait l'histoire migratoire qui s'est réalisée en Europe et en Amérique du Nord.

Des chercheurs ont publié ce qui pourrait être le plus grand arbre généalogique au monde : une base de données généalogique remontant à cinq siècles qui relie 13 millions de personnes liées par le sang ou le mariage. L'arbre a déjà conduit à des idées telles que le lien entre les gènes et la longévité et pourquoi nos ancêtres se sont mariés qui ils ont fait. Et les chercheurs disent que ce n'est qu'un début.

"Cette étude est une utilisation impressionnante et intelligente des données de crowdsourcing pour répondre à un certain nombre de questions scientifiques intéressantes", explique le généticien Peter Visscher de l'Université du Queensland à Brisbane, en Australie, qui n'était pas impliqué dans le travail. La plus grande promesse de l'arbre, lui et d'autres disent, pourrait venir si elle était liée à l'information sur la santé pour explorer le rôle de la génétique dans les maladies.

Le généticien informatique Yaniv Erlich de l'université de Columbia dit avoir pensé au projet il y a 7 ans, après avoir reçu un courriel d'un cousin éloigné via un site Web appelé Geni.com , où les gens partagent leurs arbres généalogiques. Il a envoyé un email au directeur technique de la société qui lui a donné sa bénédiction de télécharger les dizaines de millions de profils publics du site listant le nom, le sexe, la date et le lieu de naissance, la date du décès et les proches parents. Déterminer comment donner un sens aux données, vérifier les relations et corriger les erreurs a pris du temps - son équipe a présenté une première version de l'arbre lors d'une réunion il y a plus de 4 ans - et ils ont ensuite ajouté plus de données, leur donnant un point de départ. 86 millions de profils.

Depuis la  publication en ligne d'une preprint il y a  un an, les chercheurs et collaborateurs de Columbia ont comparé leurs données à 80 000 enregistrements de décès du Vermont avec des informations sur l'éducation - dont 1000 personnes dans les données Geni.com - au cas où les personnes s'intéressant à la généalogie seraient plus riches et éduquées. Ils ont trouvé peu de preuves d'un tel biais, cependant.Le résultat final est un pedigree unique reliant 13 millions de parents principalement d'origine européenne, datant de 11 générations. Il comprend, entre autres, le célèbre généticien de la population  Sewall Wright  et l'acteur Kevin Bacon, explique Erlich. (Geni a maintenant 120 millions de profils connectés et d'autres sites d'ascendance ont un grand nombre, mais les arbres généalogiques en leur sein n'ont pas été validés de la même manière.)

Acteur Kevin Bacon

Regardant à travers les données de décès de l'arbre, l'équipe a trouvé les fluctuations attendues dans la durée de vie - une baisse pour les jeunes hommes pendant la guerre civile, la Première et la Seconde Guerres mondiales et une augmentation de la survie infantile dans les années 1900. En complotant les naissances sur une carte mondiale au fil du temps, ils ont cartographié des événements migratoires majeurs, tels que le débarquement de Mayflower en 1620 dans le Massachusetts actuel - bientôt suivi par une explosion de naissances dans la région - et la fondation 1788 de la colonie britannique a commencé la colonisation de l'Australie ( voir le  film ).

L'arbre a également fourni une nouvelle estimation de la durée de vie de nos gènes: seulement 16%, contre environ 25% d'après les études sur les jumeaux en Scandinavie. (Comme l'arbre, les études sur les jumeaux n'analysent pas directement l' ADN, que l' espérance de vie et les relations.) La figure héritabilité inférieure donne à penser que la longévité a encore plus à voir avec l' environnement et le comportement que l'on pensait , les rapports de l' équipe aujourd'hui en  sciences .

Selon Kaare Christensen, qui dirige le Danish Twin Registry à Odense, au Danemark, l'histoire paisible de la Scandinavie pourrait donner à la génétique un rôle plus important. Mais, il note que les études de jumeaux manquent également de la puissance de la nouvelle étude. Le chiffre inférieur de 16% de la nouvelle étude suggère que pour les chercheurs qui recherchent des gènes de longévité, «cela pourrait être légèrement plus difficile que nous le pensions», dit-il.

L'équipe d'Erlich a également exploré ce qu'il appelle «qui et où est l'amour de votre vie». En 1700, les gens ont généralement épousé un quatrième cousin né à 10 kilomètres de là; à partir de 1850, ils ont épousé des partenaires moins génétiquement liés. Mais bien que les experts aient pensé que ce changement reflétait une distance croissante entre la naissance des partenaires, l'étude d'Erlich a trouvé que cela ne l'expliquait pas. Au lieu de cela, un facteur culturel tel qu'un tabou sur l'épouser d'un cousin a peut-être surgi à cette époque et a conduit à moins de mariages avec des parents. "Tout cela nous aide à comprendre comment les gènes se propagent dans une zone géographique", explique Erlich.

Ces découvertes ne font qu'effleurer les utilisations potentielles de l'arbre généalogique, explique Erlich, qui est devenu l'année dernière directeur scientifique de MyHeritage.com, propriétaire de Geni.com. L'équipe de Columbia a commencé à mailler l'arbre avec un site appelé  DNA.Land  où les volontaires partagent leurs données de génotypage d'ADN provenant de services de test d'ADN pour les consommateurs tels que 23andMe et MyHeritage.com et remplissent des enquêtes sur la santé. L'équipe d'Erlich met également l'ensemble de données (dépouillé de noms) à la  disposition d'autres chercheurs .

Les données de santé superposant pour des dizaines de milliers , voire des centaines de milliers de membres d'arbre famille vivants et morts pourrait permettre aux chercheurs de raffermir le rôle de la génétique dans les maladies et des caractéristiques telles que la taille, la société islandaise deCODE Genetics a fait en  combinant les données d'ADN et de la santé avec la vaste généalogie du pays , Erlich dit. De cette façon, Visscher est d'accord, l'arbre généalogique de 13 millions de personnes pourrait être une «formidable ressource de données pour aborder les questions de nature-culture».

video : independent.co.uk

source : sciencemag

A lire également :

Pour une meilleure expérience de lecture
veuillez consulter ce site en format portrait, merci :)