Supporting the community

Tehnologia de identificare a ADN-ului si APL

Matematica juridica
Introducere
Identificarea de rudenie Note de Programare si Confirmari 
 

 

     
  Charles Brenner
Prezentare la APL2000 User Conference, Naples, Florida in 
Noiembrie 8, 2005
  In care un potential matematician, un geneticist si un programator necultivat folosesc agilitatea APL pentru a identifica infractorii, parintii, Centrul Comertului International si victimele tsunami si a determina rasa folosind ADN-ul intr-o lume a tehnologiei de identificare rapida a ADN-ului.


Pana la sfarsitul anilor 1980 ADN-ul a fost bine sa inlocuiasca serologia ca o metoda mult mai superioara de testare genetica, noi frontiere tehnologice au fost, prin urmare, deschidere si am fost bucuros pentru sansa de a pune in spatele meu "programare pentru inchiriere" in dezvoltarea APL, Sau orice altceva si sa ma concentrez exclusiv pe gasirea unor modalitati de imbinare a intereselor mele in computere, matematica si stiinta.

 

The human genome consists of 46 chromosomes. There are two each of 1-22, the autosomal chromosomes. XX or XY are the two sex chromosomes.

Esenta genomului este o secventa de 3 • 10(9) perechi de baze, bazele (nucleotidele) fiind A, C, G, T si perechile fiind A-T (sau T-A) si C-G.

 

Retineti ca exista pereche la doua niveluri: Cromozomii sunt imperecheati prin faptul ca exista doua din fiecare numar, care este semnificativ din punct de vedere fizic in timpul diviziunii si reproducerii celulare si semnificativ din punct de vedere genetic deoarece cele mai multe gene apar in doua copii. In al doilea rand, sirul ADN din fiecare cromozom este o dubla fire (dublu helix), cu secventa lui A, C, G si T pe o singura rama, oglindita de o secventa complementara de T, G, C si A, pe de alta parte Regula de imperechere. In timpul diviziunii celulare, firele sunt separate si fiecare singura fasie serveste apoi ca model pentru a recrea o copie a liniei duble originale.

TH01
Actual electron micro-photograph

Un cromozom mediu este de aproximativ 100.000.000 de perechi de baze lungi. O gena este un subgrup mic al unui cromozom, de obicei cateva mii de perechi de baze. Orice eroare aleatorie din secventa este de natura sa incapaciteze gena si la randul ei, organismul; In consecinta, exista o variatie relativ mica intre gene in randul indivizilor.

Prin contrast, genomul este plin cu ADN-ul nedorit, variatii in care nu poarta nici o pedeapsa de supraviețuire si prin urmare o multime de variatii s-au acumulat in timp si pot fi folosite pentru a distinge indivizii. Sunt folosite astfel locatii traditionale (timp span = cativa ani) in genomul numit uneori pseudogene. Locusul TH01 (aproape de gena pentru hidroxilaza tirozinei) este definit ca o intindere particulara de aproximativ 200 de baze la 11p15.5 - cromozomul 11, bratul scurt sau p, in banda 15. Partea "afaceri" a TH01 consta din 6 pana la 11 repetari tandem scurte (STR) ale aceluiasi motiv cu 4 baze (tetramer): AATG, de exemplu AATGAATGAATGAATGAATGAATG. Formele variante, numite alele (analogi izotopilor sau izomerilor) variaza intre indivizi si de asemenea intre cei doi cromozomi ai unei perechi in cadrul unui individ. De exemplu, o persoana poate avea un tip TH01 de 8,10.

Un profil ADN este in mod tipic de 13 sau mai multe locatii: ({13,15}, {28,28}, {8,10}, ...). Alelele variaza foarte mult in functie de frecventa, media fiind de aproximativ 1/5. Probabilitatea medie de potrivire intre persoanele necuprinse este, prin urmare, 0,1 pentru fiecare loc, 10-13 pentru un profil. Prin urmare, aproape asociatie de criminali cu infractiuni.

Desigur, toate acestea conduc la nenumarate oportunitati de instrumente informatice pentru a ajuta analistul DNA. Biologia si datele biologice, spre deosebire de datele de inginerie, sunt in mod inerent neregulate, incomplete si inexacte, iar software-ul trebuie, prin urmare, sa fie iertator. Din acest motiv si altele exista multe complicatii tehnice.

 

Note de Programare

Vizualizarea ADN (Numele pachetului care contine 20 de ani de dezvoltare a software-ului meu) include 1000 de esantioane de populație pentru diferite populatii si locuri. Exista un meniu cu nume pentru fiecare, fiecare nume desigur multi-parte. Prin urmare, am gasit foarte convenabil sa folosesc o idee de la Eric Lescasse pentru meniu.

  • Selectarea contextului - deoarece utilizatorul personalizeaza caracterele, meniul se micsoreaza la elementele care contin - si nu doar incepe - cu fraza tastata. La aceasta am adaugat cateva lucrari ale mele:
  • Multifrazat - daca urmatorul caracter creeaza o expresie imposibila, atunci programul incearca sa imparta intrarea in doua fraze si limiteaza lista la elementele care contin ambele fraze. Exista o tasta de utilizator (tab) pentru a forta divizarea frazelor, dar in practica nu este niciodata necesara. Fluxul de cunoastere a constiintei face treaba. Daca vreau sa gasesc datele irakiene compilate de laboratorul de la Amsterdam pe locusul D18S51 (numit D18S51 STR Amsterdam Iraqi 70 03/03/27 2pm), pot scrie amstd18iraq sau iraqd18 sau multe alte posibilitati.
  • Observatia cazului, dar iertand - lista se micsoreaza, indiferent de cazul introdus, dar bara de avertizare (indicand intrarea care va fi aleasa daca este apasata intrarea) prefera o intrare care se potriveste cu cazul.
  • Ratacitor de bara - bara de basculare tinde sa se miste in timp ce tastati mai multe personaje, pe teoria ca, daca ar fi fost deja asezat pe alegerea dorita, ati fi oprit din tastare.
  • Functionarea in mai multe moduri - miscarea mouse-ului sau a sagetii este intotdeauna permisa.

Identificarea de identificare

Pe langa variatia individuala, care ADN-ul imparte cu amprentele digitale, ADN-ul are o alta proprietate de mare utilitate pentru identificare. Este mostenit. In plus, regulile de mostenire pentru trasaturile ADN sunt extrem de simple. Amintiti-va genele recesive? Penetrare incompleta? Uita-i. Cu ADN-ul puteti vedea chiar pana la elementele de baza, fiecare sistem este (aproape - nimic in biologie este regulat) un sistem co-dominant. Nu exista practic nici o distinctie intre fenotip (ceea ce puteti vedea) si genotip (ceea ce este pe cromozom).

Mostenire Mandeliana

  • Locusurile autosomale sunt mostenite de copil de la parinti, obtinand aleator unul dintre cele doua alele de la fiecare parinte.
Asta e. Acesta este modelul Mendelian, desi ca G.E. Cutia a spus ca toate modelele sunt gresite (dar unele modele sunt utile). Uneori trebuie sa recunoastem –

Mutatie

Ocazional (1/200 – 1/2000) un alela castiga sau pierde Un singur motiv de la parinte la copil. Rar mai multe. Foarte rar o schimbare mai putin obisnuita.

Test de Paternitate


Intrebarea paternitatii clasice este colectarea unor informații genetice (profiluri ADN) si care dintre aceste doua imagini le explica mai bine datele:

Sunt cateva formule simple, precum ar fi 1/q, Pentru analiza de paternitate, care este bine cunoscuta oamenilor in afaceri.

 

Incercarea de Rudenie

Cu zece ani in urma am decis sa incerc sa rezolv o problema mai generala - avand in vedere orice doua diagrame pedigree care se refera la un set de oameni, sa decida cu datele ADN care este relatia suportata de date (si cat de mult). A fost dificil si am reusit sa fac progrese doar atunci cand am lovit ideea de a face toate calculele cu algebra.

Implementarea acestei idei este simpla. Ori de cate ori programul original ar putea adauga doua probabilitati, de exemplu: + / P, noul program pur si simplu a folosit o functie definita: Plus / P. Formulele in cauza se dovedesc a fi polinoame in variabilele n + 1 (p, q, ... pentru frecventa fiecarei alele P, Q, ... plus un simbol z pentru frecventa totala a tuturor celorlalte Alele), prin urmare, structura de date pentru a reprezenta un polinom este două matrice: o matrice de exponenti cu o coloana per variabila si un rand pentru fiecare termen si un vector de coeficienti pentru fiecare termen. Este usor sa scrieti Plus, Times, Simplify (colaps ca termeni), Over (impartiti doua polinoame si eliminati factorii comuni) si o functie care se dovedeste a avea proprietati remarcabile, UnZ, care elimina toate instantele variabilei z in favoarea A expresiei echivalente 1-pq -.... Acest lucru este necesar deoarece z ar trebui sa aiba loc numai pe plan intern; Utilizatorul nu se aateapta sa-l vada. Ceea ce este remarcabil este ca UnZ reduce foarte mult complexitatea polinomului. Zeci de termeni se reduc la cateva. Totusi, expresiile rezultate sunt uimitoare, infasurandu-se la mai multe linii atunci cand sunt aplicate in colectia neregulata a persoanelor care sunt ipotezati sa fie semidecizi, unchi, veri si incestuosi.

 

 

 

Identificarea Corpului

Sa dovedit ca jucaria mea a gasit numeroase aplicatii practice. Una dintre ele este identificarea corpului: este profilul ADN pentru acest cadavru legat sau nu in legatura cu tatal de referinta, sora si profilul matus? Pana in 2001, programul si am avut o reputatie suficienta pentru acest tip de problema, ca la 12 septembrie, cand am reusit sa-mi verific e-mailurile la Londra, am avut o ancheta de la New York Office of the Examiner Medical, explicand ca o problema pe care as putea sa o ajut. Astfel a inceput o saga lunga, care cuprindea sute de identificari dificil de rudenie.

O noua problema care a aparut a fost sa rezolvam mii de profiluri ADN care provin din atacul World Trade - profilurile victimelor de la organisme anonime, comparativ cu profilurile de referinta ale rudelor sau periutelor de dinti. Avand in vedere o identitate suspectata, este foarte bine sa folosim programul Kinship pentru al testa, dar testarea rudeniei este in mod inerent manuala (informatiile pedigree nu sunt nici uniforme si exacte) astfel incat nu este practic sa folositi programul de rudenie de un milion de ori cu ipoteze gresite.

 

 

 

 

 

Proiectele de dezastre

Prin urmare, era evident ca ar fi nevoie de un program special de "screening". Mii de profiluri - poate doar sute de la inceput - informații incerte despre structurile familiale adevarate, periajul de dinti impartit, DNA de slaba calitate care duce la profiluri deficitare - ar fi nevoie de o experimentare clara pentru a descoperi euristicile care ar gasi in mod util identitatea probabila a candidatului. Esti inaintea mea: o aplicatie personalizata pentru APL. Ca si voi, am spus sa-mi dati datele si voi produce identitatile in ore. Si asa a fost, desi a durat o saptamana sau doua pentru a depasi obstacolele birocratice si pentru a procura datele. Un flux de lucru sa dezvoltat in curand in care noi profiluri de ADN, obtinute de diferite laboratoare contractate, mi-au fost aduse in doua saptamani, le-am alergat prin programul de screening revizuit in mod constant si am trecut rezultatele la o alta firma software care le-a instalat intr-o baza de date la OCME Caseworkerii au folosit legatura de rudenie si alte instrumente pentru a lua decizii finale cu privire la identificare. Acest model a continuat timp de doi ani; In cele din urma fluxul de noi profiluri ADN, informatii noi si identificari noi s-au uscat.

 

 

 

 

 

 

Discriminare Rasiala

Voi mentiona inca una dintre numeroasele idei interesante care apar din analiza ADN-ului, si aceasta este ideea de a determina rasa de la ADN. Ideea evidenta ar putea fi gasirea genelor "negre" sau "chinezesti", dar aceasta este dificila, poate chiar imposibila si complet inutila. In schimb, mai multe persoane, in afara de mine, au remarcat ca toate variatiile minore sau moderate ale frecventelor alelelor in randul populatiilor sunt indicii sursei de origine. Daca o pata de crima (de exemplu, materialul seminal al unui violator) include o alela care este cu 20% mai frecventa in randul populatiei X decat populatia Y, atunci acesta este un indiciu subtire care sustine populatia X ca origine. A acumulat peste 26 alele aceasta dovada este probabil sa fie foarte puternica. In mod special, in urma cu 10 ani, am avut un avantaj fata de alti cercetatori, datorita unei largi baze de clienti internationale, de a avea o multime de date populare. In plus, vorbesc APL. In consecinta, am reusit, in principal prin trecerea rapida prin multe experimente pe calculator, sa găsesc calea de succes (a carei baza teoretica in genetica populatiei nu am inteles atunci) de a extrage inferentele rasiale din profilurile ADN. Acest lucru este uneori util in investigatiile politiei, dar mai mult decat atat, este interesant sa aruncam lumina asupra istoriei migratoare umane si, de asemenea, se dovedește a avea o aplicatie importanta in reglementarea cursei de cai.

 

 

 

 

 

 

 

Note de programare si confirmari


Sunt recunoscator pentru generozitatea si colegialitatea altruista a comunitatii APL. In special, Don Lagos-Sinclair mi-a completat incercarea de a scrie metoda mea de selectie in APL + WIN, Biserica Davin a impartasit instrumentele SQL si a muncit din greu pentru a ma ajuta sa ințeleg, iar oamenii de la APL2000 sunt foarte rabdatori si incurajatori . In plus, exista multe persoane care contribuie si incurajeaza invatarea mea prin simpla contributie la aceasta conferinta.

Nu am multe de oferit in schimb. Zilele mele in fruntea alfabetizarii pe calculator probabil au expirat in jurul anului 1963. Desigur, as fi bucuros sa impartasesc utilitatile sau ideile din spatele lor pe care le-am dezvoltat, desi nu am nici un cod in forma ca pe un spatiu de lucru. Comentariul rau al lui Adrian, cu cativa ani in urma, ca utilitatile lui Rex sunt in mod obisnuit de aproximativ 90% complete ar trebui sa fie revizuite negativ pentru lucrurile mele in starea lor.

As dori totusi sa recomand un pachet pe care John Walker la subliniat cu cativa ani in urma si anume un pachet de instalare gratuit, dar foarte profesionist, numit Inno Setup si un preprocesor macro de companie numit ISTool. Examinarea fisierului de script [omis] pe care il folosesc pentru a crea un fisier de instalare pentru ADN-ul • VIEW va va oferi o idee despre capabilitatile sale si in masura in care am invatat unele dintre inauntru si afara de a le folosi, voi fi bucuros. Pentru a raspunde intrebarilor de la orice APLer care doreste sa-mi trimita sau sa-mi trimita un e-mail.


 


Translated by: Irina Vasilescu

Link to the original page: Click Here

We love giving back to the community

We believe in helping people and that matter to us more than anything else. Since the very beginning of our company, our team have been willing and wishing to help.