好看的電影應該要存在哪裡?CD、隨身碟、還是你的電腦 D 槽?科學家對此有些不一樣的想法。既然是科學家,存影片的方式當然也要很科學,最近,由美國國家衛生研究院(National Institutes of Health)資助的科學團隊首度將原始電影編碼於活的大腸桿菌 DNA 中,並且成功回放影片!
為什麼想用基因紀錄影像?因為它們可以存超多!
科學家在 7 月 12 日將實驗結果線上發表於《自然》(Nature)期刊,將這個前瞻的「分子錄影帶」(molecular ticker tape)想法公諸於世。在過去的研究中,科學家們已經能用 CRISPR 儲存細菌中的 DNA 序列;而這次的研究則證明了 DNA 不只可以用來編碼遺傳訊息,更可以將任意順序的訊息編碼進基因組中。
不過,為什麼研究者一開始會將腦筋動到 DNA 儲存上呢?那是因為 DNA 是我們目前已知最佳的儲存空間之一,在理論上,僅僅一公克的單鏈 DNA 就可以存下 455 艾位元組(Exabyte,EB)的內容,也就是大約「一千億」張 DVD的容量。這麼看起來,也就不難理解科學家們為何要努力地將大量的書籍資料、數位影像塞進小小的生物原料中。(也可能只是因為他們的 D 槽不夠存……)
在了解科學家是如何「拍電影」前,我們不妨回顧一下神奇的 CRISPR 究竟是何方神聖:CRISPR 在細菌裡扮演著免疫系統的角色,當細菌受到病毒感染時,CRISPR 就會切除部分外來的 DNA 並將之儲存於自己的基因組,方便細菌在往後利用這些儲存的資料去辨識病毒、防禦未來的攻擊。而現在為科學家所青睞的 CRISPR/Cas9 技術就是利用這樣的原理,將特定的訊息編進基因之中。(詳見此文)
你有看過這隻可愛小馬嗎?圖/by Eadweard MuybridgeAnimation, public domain, wikimedia commons
那麼,研究團隊究竟要如何將馬兒的影片儲存於核苷酸中呢?
每個核苷酸都有一個含氮鹼基作為核心,而 DNA 裡會出現的含氮鹼基有 A(腺嘌呤)、G(鳥嘌呤)、C(胞嘧啶)、T(胸腺嘧啶)四種,科學家便以此作為編碼依據,使用三元組表格去定義不同的像素顏色。他們將四個核苷酸定義為一個像素集(研究團隊將之標示為 pixet),而每個像素集中的像素(pixel)則分散於圖像上。
每個像素都要仔細編碼,才能再度建出小馬。圖/研究圖片
而後科學家把賽馬動畫中的五幀圖畫以上述方式編碼,再將匯集過的寡核苷酸利用電穿孔技術植入大腸桿菌(os:好痛)。在五天的過程中,他們用轉譯過的 DNA 順序去處理細菌,接著,他們便能用定序細菌 DNA 的方式來「撥放」電影,重建的精準度高達 90%。聽起來很厲害吧?恩……這部神奇的生物電影看起來是這樣子的:
同樣地,如果我們給 AI 一含所有物質之性質的資料庫,然後告訴它如何尋找「規律」(pattern),相信它會非常勝任地發現許多具有某種特性的「新物質」、「新藥物」、甚或告訴我們如何製造它們(有機合成的資料庫)。但是 AI 雖然知道哈密瓜的所有性質(資料庫),可是它會想到哈密瓜含有能大量分泌青黴素的菌株、即時在第二次世界大戰中拯救了上百萬士兵的生命嗎(見後)?我覺得後者不是邏輯的問題,是沒辦法訓練的,因此 AI 不能「真正創造」不是依靠邏輯的發現。這正是本文所要談的:許多科學大突破都不是靠訓練或邏輯分析的!
-----廣告,請繼續往下閱讀-----
視眾人所見視,思眾人所未思
牛頓的傳記《艾薩克·牛頓爵士生平回憶錄》(Memoirs of Sir Isaac Newton’s Life)於1752年出版;作者斯圖克利(William Stukeley)在書中轉述:「晚餐後,天氣溫暖,我們去了花園,在幾棵蘋果樹的樹蔭下喝茶……他(牛頓)告訴我,他當時的處境和以前一樣,剛剛想到萬有引力的概念。當他正沉思時,一個蘋果掉了下來。他心想:『為什麼蘋果總是垂直落到地上,永遠不會向上或向一側掉落呢?……』,這使他得出結論:地球一定具有『引力』,從而發展出他的萬有引力理論。」
早在西元前 4 世紀左右,亞里斯多德(Aristotle)及歐幾里德(Euclid)等希臘哲學家就為自然哲學和邏輯奠定了基礎。樹上的水果都是往地面掉,這是任何小孩都知道的「常識」,但為什麼卻等了 1700 年才引起牛頓的注意?我們不知道為何牛頓會想到這個問題,但 AI 也會注意到這個現象嗎?如果會,它會先想到萬有引力或是直接跳到更精確的愛因斯坦廣義相對論(見後)呢?
一位正在自由下落的人不會感覺到自己的重量,那不是等於漂浮在沒有任何重力的外太空空間嗎?如果加速度可以抵消重力,那麼在沒有重力的情況下,加速度本身不是可以模擬重力,產生與真實重力沒有區別的人造重力嗎?愛因斯坦稱上面這一發現為「等效原理」(Equivalence Principle):我們雖然不知道重力是什麼,但其現象可以用加速度來模擬!這一想法啟動了愛因斯坦嘗試改變牛頓重力論的八年艱苦抗戰,於 1915 年 11 月完成了人類有史以來最美麗的物理理論━「廣義相對論」(General Theory of Relativity)。100 多年後的今天,愛因斯坦這一透過想像力來推測的理論仍然在指引著物理學家們去瞭解宇宙的基本特徵!怪不得愛因斯坦後來大膽地稱它為「我一生中最幸運的靈感」。
好吧,就假設 AI 像愛因斯坦一樣也有「最幸運的靈感」,發現了廣義相對論。可是後來物理學家瞭解到了愛因斯坦的「等效定理」事實上不完全正確,是有限制的,也就是說它只是一種近似的基本定律,只適用於一個局部、無限小的時空區域內。哈,如果AI比人類聰明,怎麼會在邏輯上犯下這個錯誤呢?如果不犯這個錯誤,它能發現廣義相對論呢?
愛因斯坦真大膽:一個可以用實驗來確定的光速,怎麼可以定為「公設」呢?光速與發射體運動狀態無關不是完全違反了我們日常生活的經驗(如聲速)嗎?愛因斯坦在其時鐘「同步程序」的假想實驗裡魔術般地導入了他的公設:光在任何方向的速度都是一樣的 c 值!完全忽略了當時幾乎所有物理學家都相信光是在「以太」中傳播的理論。
1924 年,一位名不見經傳,任教於東巴基斯坦的講師波思 (Styendra Bose) 在一篇 1500 字的論文裡做了一個誤打誤撞、連他自己本人都不知道、在整篇論文中隻字未提的重要及創新性假設:光量子是不可分辨的!在當時,所有的物理學家都認為光量子像銅板一樣是可以分辨的(我們可以分辨哪個是 A 銅板、哪個是 B 銅板、…),因此兩個銅板出現「一正及一反」的或然率是 2/4;但如果它們不能分辨呢?則出現「一正及一反」的或然率將變成 1/3。沒想到這一「錯誤」的假設後來竟成為打開量子統計力學的鑰匙!超強邏輯的AI會犯這種錯誤嗎?
在「發現能治療糖尿病的胰島素—胰島素與生技產業的誕生(上)」一文裡,我提到了「….將狗的胰臟割除,發現這隻可憐狗整天口渴及隨地小便。數日後,一位助手覺得實驗室內的蒼蠅好像突然多了起來,尤其是在狗小便過的地板。分析狗尿及其血液後,梅倫(Joseph von Mering)及明考斯基(Oskar Minkowski)很驚奇地發現裡面充滿了糖份。」顯然地,胰腺具有調解體內糖代謝的功能,它一旦受損將導致糖尿病。就這樣,法國兩位外科手術醫生無意中發現了「困擾」人類三千多年之糖尿病的病源━胰臟分泌物「胰島素」失調!這不是透過邏輯分析得到的結果,AI能做到嗎?