乳糖不耐的成人還是嬰兒時能消化母乳中的糖分,當時他們的乳糖酶基因是打開的,科學界稱之為「表現」(expressed),代表身體將乳糖酶的 DNA 指令轉錄成 RNA,再將此 RNA 轉譯成需要的蛋白質。乳糖不耐的成人則將乳糖酶基因永遠關掉並不再表現。能被我們身體打開或關掉、像乳糖酶基因這類的,就是所謂「受調控」的基因。
大部分人類歷史中,成人的乳糖酶常態處於「關閉」狀態。若你夠幸運能耐受乳糖,表示在你的乳糖酶控制區域(乳糖酶基因附近的 DNA 延伸)中有個突變,讓乳糖酶基因在成人時期能隨時打開。你的先祖有可能是喝牛奶的牧民,造成乳糖耐受的突變首先在東非和斯堪地那維亞的畜牧族群中傳開,而且速度極快。從人類首次發現畜牧生活型態開始,大約八千年,不過是曇花一現的時間,一些族群就從零突變躍升到九○%突變。這就是天擇在我們基因體留下最有力的近代特徵之一。
當此聚合酶要轉錄一個基因,它首先會接上基因的 DNA,沿著一個個 DNA 字母滑動,並將 RNA 分子串在一起,而 RNA 字母序列會與基因的相同。細菌也是如此表現它們使用的乳糖酶:β-半乳糖苷酶(beta-galactosidase,這個字很累贅,通常簡寫成 beta-gal)。這個酵素會將乳糖切成兩個較簡單的醣類─—葡萄糖及半乳糖,其他代謝酵素可以從它們取得能量和碳。
為了調控 β-半乳糖苷酶基因,細胞用轉錄調控蛋白(transcriptional regulator)來操控轉錄。此蛋白質基本上只做一件事:占據基因附近的一小段 DNA 延伸。
在細胞的液體環境中,多種調控蛋白在其中漂來漂去,當任何一個蛋白遇到特定 DNA 序列(DNA「字碼」)時就會結合並黏住。不同調控的蛋白有相異的關鍵字,β-半乳糖苷酶調控蛋白辨認的關鍵字是「GAATTGTGAGC」。
讓辨認工作可行的,就是像讓酵素能夠工作的摺疊蛋白質的形狀。調控蛋白和 DNA 必須有互補的形狀,類似樂高積木,一塊積木上的幾個小突起與另一塊上面的凹陷緊密貼合。這個比喻十分恰當,但仍有限制,因為形狀不是一切,例如兩個分子還需要帶有互補電性,否則會相互排斥。而且一套標準樂高積木只有幾十種形狀,但分子卻不同,蛋白質有數萬種形狀,DNA甚至還更多—就跟可能的DNA序列一樣多
van der Valk, T., Pečnerová, P., Díez-del-Molino, D., Bergström, A., Oppenheimer, J., Hartmann, S., … & Dalén, L. (2021). Million-year-old DNA sheds light on the genomic history of mammoths. Nature, 591(7849), 265-269.
您知道中央研究院有位相當低調的遺傳演化學大師嗎?此人開創了許多分子演化的數學分析方法,他就是生物多樣性研究中心的特聘研究員李文雄院士!數學是李文雄用來描述生物演化的工具,用 DNA 序列計算分子時鐘是他的重要貢獻。至今 80 歲高壽的李院士,是國內唯一獲得巴仁獎榮譽的得主,不僅培育眾多學生,並且依然在最前線探索未知。中研院「研之有物」專訪李文雄,邀請他分享在美國與臺灣的學研經歷及主要研究成果。
因此改變 DNA 的核苷酸,有時候不會改變氨基酸,此時稱為同義突變(synonymous mutation);有時候會改變氨基酸,此時稱為非同義突變(nonsynonymous mutation)。比較 DNA 序列和胺基酸序列變與不變之比例,就能大約估計天擇力量的影響,推測天擇是傾向去除突變還是選擇突變。這是分子演化常見的分析之一,李文雄的實驗室開發了數個被廣泛應用的分析方法。
-----廣告,請繼續往下閱讀-----
在分子演化興起前,不同生物間的親疏關係,可以透過生物形態的相似程度建構演化樹,但形態資料很有限。比較生物 DNA 或蛋白質的資料,可以細緻地釐清物種間的親緣關係,對分類學的貢獻很大。
比方說早期演化學家會比較一群鳥類的嘴喙特徵,兩種鳥喙的形態差異較小,便代表其親緣關係較近;而分子演化學家則是比較這群鳥類的 DNA 或蛋白質序列的差異,更能釐清彼此的親緣關係。
形態是巨觀的,分子是微觀的。但我們也可以說每一處 DNA 或氨基酸位置都相當於一種形態。分子資料通常更容易取得,可提供比較的特徵數量也比形態還多很多,更容易計算。
關於同一物種的性別演化差異,李文雄表示這是前輩霍爾丹(J. B. S. Haldane)提出的觀點。李文雄設計好 DNA 定序區間及物種,產生適合材料,於是就驗證了此假說。雖然講起來雲淡風輕,但若讀者了解遺傳學發展史應該會深受震撼,因為霍爾丹正是奠定族群遺傳學的三大名家之一,從霍爾丹到李文雄,我們可以看見大師傳承的軌跡。
遺傳與演化學最高榮譽:巴仁獎
靠著數學和分子生物學的分析,李文雄解決了許多演化生物學的難題。比如,他在 1991 年就以很有限的人類 DNA 序列資料,預估人類的 DNA 多樣性低於 0.1%,比果蠅的低不少,十年後大量的資料證明他的預估是正確的!還有,在 2001 年當黑猩猩的基因體資料還很有限時,他就預估出人類與黑猩猩的基因體相差只有 1.2%,這個預估引起很大的震撼,因為人類與黑猩猩看起來很不一樣,但當黑猩猩的基因體於 2005 年發表時,得到的答案與李文雄的預估完全一樣!
承上,李文雄陸續受到各界肯定,他於 1998 年被挖角到芝加哥大學擔任 George Beadle 講座教授(Beadle 為一位諾貝爾獎得主),並當選中研院院士。2003 年更獲得兩項重大榮譽:美國國家科學院院士和巴仁獎(Balzan Prize for Genetics and Evolution)。
隨著 1980 年代以來 DNA 序列數據的爆炸式增長,李文雄一直是通過比較 DNA 序列來推斷演化關係的方法的設計師。他在建立估計演化樹的準確程度和可以放在其中的統計置信度的方法方面特別有影響力。
以往解釋 DNA 數據的一個關鍵假設是 DNA序列的變化在演化時間上以恆定速率進行(所謂的分子時鐘)。該假設常被用於估算譜系分歧的時間。1980 年代,李文雄第一個證明分子時鐘的運行速度取決於世代的長短:世代越短,時鐘越快。因此,時鐘在大鼠和小鼠之間的演化速度是猴子和人類之間的演化速度的五倍。這一發現有助於更好地估計兩物種的分歧時間。
另一方面隨著技術進步,以前難如登天的問題,現在也可能有機會解答。上面提到人類與黑猩猩的 DNA 分歧只有 1.2%,但兩者間的差異除了非編碼區外,也有很多來自基因調控不同的區域,尤其是腦部發育。過去這幾乎是不可能探索的議題,如今難度雖大,卻是有希望解決的難題。總之,在李文雄的視角中,一直都有新鮮的問題。