NULL Skriv ut sidan - SV: auDNA-Finska frälsesläkter

Anbytarforum

Titel: SV: auDNA-Finska frälsesläkter
Skrivet av: ten skrivet 2017-04-01, 19:23
I mitt första inlägg skrev jag: ”Här bör vi diskutera metodiken för Analys/Syntes av erhållna resultat”.

En väsentlig del av analysen är att identifiera kluster av äkta DNA-kusiner. Bland mina i dagsläget 638 träffar, så har jag funnit 62 kluster med med mellan 3 och 15 äkta DNA-kusiner i varje grupp, totalt 371 stycken – eller med andra ord, endast 62 av mina anor (en för varje kluster) är anfädrar till 58% av mina matchningar!

Av dessa 62 anor så står 11 för ca 20% av träffarna, 133 stycken…

Hur är detta möjligt? Sannolikheten är ju minimal att detta kan vara sant, eller…? Jomenvisst, men om dessa anor levde tillräckligt långt bak i tiden, dessutom på en plats med begränsad genpool , så torde antalet levande ättlingar till dessa vara enormt stort!

För att praktiskt kunna göra denna analys krävs att man har alla data i ett sorterbart format. Utan att veta vad jag skulle få för användning av detta, så lade jag - redan när jag fått mitt första resultat från FF  - upp en tabell med alla data, inklusive 22 kolumner för kromosomerna där jag angav det längsta blockets position för varje matchning.  Efter test med Matrix – verktyget, så färgkodar jag de äkta DNA-kusinerna. När jag så får en ny matchning, så kan jag direkt se om den platsar i något av klustren.

Att jag tar upp ämnet nu beror på att jag haft stor anledning att fördjupa mig i dessa kluster i försöket att skapa en algoritm. Hur stor är spridningen av en viss varabel mellan dessa ättlingar till en gemensam ana? Och vad kan den tänkas bero på, förutom det skäl som Peter lyfte fram här ovan.

I ett av mina kluster på kromosom 6, omfattande nio äkta DNA-kusiner, så har jag tittat på spridningen av S3Lb (cM). Resultatet innehåller mycket information.
 
Fem ’kusiner’ hade värden mellan 14,1 och 15,7 cM, och  delade endast två segment över 3 cM med mig, medan de övriga fyra hade S3Lb-värden mellan 17,4 cM och 28,4 cM och mellan sex och nio segment över 3 cM. Detta resulterade i att de senare fyra predikterades som 7th – 11th cousins enl. min algoritm, medan övriga fem predikterades som 12th – Remote cousins.

En titt på resultatet i ’browsern’ avslöjar flera träffar över 5 cM som inte delas av någon av de övriga DNA-kusinerna. Genom att plocka bort dessa så fick jag nya S3Lb-värden för de fyra med ursprungligen högre värden.

Den totala spridningen blev efter korrigeringen 14,1 till 16,6 cM, alla predikterade som 12th – Remote cousin enligt min preliminära algoritm, med ett undantag – denne hade sorterats ut som 4th – 7th p.g.a. att han endast delar 10 segment med mig, vilket indikerar ett misstag i min algoritm!

De ’för höga’ värdena på S3Lb beror alltså på gemensamma segment från en eller flera andra gemensamma anor än den aktuelle.  I två av dessa fall så vet jag vilket  övrigt kluster de tillhör, tack vare upplägget av min databas.

Det kan tilläggas att FF 'tillsynes' hade ’rätt’ på åtta av de nio när de predikterar 5th – Remote.  För den nionde predikterar de 3rd – 5th cousin!

Utmaningen blir att försöka koppla de justerade S3Lb värdena till antalet generationer (meioser) till den närmaste anan. Det absolut lägsta värdet jag hittat är 12,8, vilket är enbart ett resultat av de använda gränsvärdena i FF:s algoritm för matchningar.