Ref.:
哈代-溫伯格定律 - 維基百科,自由的百科全書
哈代-溫伯格定律,也稱「遺傳平衡定律」或「哈代-溫伯格平衡定律」,分別在1908年和1909年由英國數學家G·H·哈代(Godfrey Harold Hardy)和德國醫生溫伯格(Wilhelm Weinberg)獨立證明。在群體遺傳學中,哈代-溫伯格定律主要用於描述群體中等位基因頻率以及基因型頻率之間的關係。
最近在做 SNP 的分析, 看到哈代-溫伯格定律, 讓我想到一則有趣的科學故事. 在這裡談一下.
在遺傳學上常常會用到這個哈代-溫伯格定律 (Hardy–Weinberg principle). 他的意思其實很簡單 -- 如果沒有任何天擇壓力, 理論上特定基因的基因型分布應該是平衡的.
舉個例子來說, 耳垂分離是顯性, 所以擁有 AA 和 Aa 基因型的人, 都會是耳垂分離, 而擁有 aa 基因型的人, 耳垂不會分離. 根據哈代-溫伯格定律, 我們可以知道, 在耳垂分不分離不會影響交配和生存的情況下, 理論上不管過幾百年, 各類基因型的人數比例應該是一樣的.
有趣的是, 在20世紀初, 這個問題還爭論不休, 甚至連英國皇家學院院士之間都沒有一致的觀點, 這個故事就起因於兩位院士 Udny Yule 和 Reginald Punnett 之間的爭論. Udny Yule 認為, 既然顯性基因這麼強, 那麼擁有顯性基因的人應該越來越多才對, 但是 Reginald Punnett 卻不這麼想. 但是這個生物學家之間的爭論一直沒有得到解決.
後來 Reginald Punnett 和數學家 Godfrey Harold Hardy 打板球時, 告訴 Godfrey Harold Hardy 這個問題, Godfrey Harold Hardy 很驚訝這些搞生物的人這麼笨 (基本上他認為搞純數學理論之外的人都不怎麼聰明...), 所以就用有點不屑的口氣提出了這個定律.
- To the Editor of Science: I am reluctant to intrude in a discussion concerning matters of which I have no expert knowledge, and I should have expected the very simple point which I wish to make to have been familiar to biologists. However, some remarks of Mr. Udny Yule, to which Mr. R. C. Punnett has called my attention, suggest that it may still be worth making...
- Suppose that Aa is a pair of Mendelian characters, A being dominant, and that in any given generation the number of pure dominants (AA), heterozygotes (Aa), and pure recessives (aa) are as p:2q:r. Finally, suppose that the numbers are fairly large, so that mating may be regarded as random, that the sexes are evenly distributed among the three varieties, and that all are equally fertile. A little mathematics of the multiplication-table type is enough to show that in the next generation the numbers will be as (p+q)2:2(p+q)(q+r):(q+r)2, or as p1:2q1:r1, say.
- The interesting question is — in what circumstances will this distribution be the same as that in the generation before? It is easy to see that the condition for this is q2 = pr. And since q12 = p1r1, whatever the values of p, q, and r may be, the distribution will in any case continue unchanged after the second generation
很有趣的是, 這個定律只要國中數學就可以推導出來了. (雖然我看不懂 wikipedia 上的推導 Orz)
假設不同基因型的機率如下
Pr(AA)=p, Pr(Aa)=q, Pr(aa)=r.
所以我們可以知道 p+2q+r=1. 所以第二個世代的基因型分佈就會變成
Pr(AA)=p2+2*p*q+q2=(p+q)2, Pr(Aa)=2(p+q)(q+r), Pr(aa)=(q+r)2.
(產生基因型 AA 的小孩的可能性, 只有三種 基因型 AA 的人和基因型 AA 的人交配, 基因型 AA 的人和基因型 Aa 的人交配, 基因型 Aa 的人和基因型 Aa 的人交配, 以此可以推出第一個式子, 其他以此類推.)
如果這個分佈是穩定的, 我們知道下面三個式子一定要成立
p=(p+q)2,
2q=2(p+q)(q+r),
r=(q+r)2
有趣的是, 觀察上面三個式子, 這個式子可以化簡為
(2q)2=(2(p+q)(q+r))2=4(p+q)2(q+r)2=4pr
所以我們可以得到
q2=pr
回過頭去看第二個世代的基因型分佈, 我們會發現
(Pr(Aa))2=((p+q)(q+r))2=(p+q)2(q+r)2=(Pr(AA))2(Pr(aa))2
剛好也符合分佈穩定的條件式.
也就是說, 不論一開始的 p,q,r 的值是多少, 都會穩定的遺傳下去. (在沒有天擇或人擇的情況下)
這個定律有什麼用呢?
根據現在的技術, 我們可以很容易做到檢查人的基因形是哪一種. 所以只要檢查的量夠大時, 我們可以收集到足以表達一個族群的基因型分布. 根據哈代-溫伯格定律, 如果這個基因型不會影響到人的生存和繁衍, 那麼它的機率分佈就不會改變. 所以如果我們觀察到的族群(例如糖尿病患者)的基因型分佈不一樣, 那麼這個基因很可能就跟這個疾病有關.