一個杞人憂天的問題

代生物學的每一個領域,目前都遇上了基因體研究的衝擊。DNA定序技術的快速發展,使我們已經擁有人類和其他幾種模式生物基因體完整的DNA序列。接下來的工作,就是怎麼樣利用這些資料庫中的資訊來解答生物學中長久等待解決的問題。像發育生物學的當務之急是要找出啟動胚胎發育程式的鑰匙 ; 細胞生物學家也汲汲於決定種種決定細胞結構與功能的基因 ; 演化生物學不論是討論生命的起源或物種屬別的問題,現在也從遺傳資訊的比對著手。甚至生態學都開始用DNA序列來追溯生物族群的變遷,更不用說法醫用DNA序列作為新的「指紋」標記,來解決一些身份鑑定的法律問題了!

分子生物學技術的進步神速,亳無疑問地會引導了研究進行的方向與影響科學家面對研究對象所採取的策略! 生物學過去的研究,往往起始於現象的觀察與假設理論的提出,然後再以實驗來驗証或測試這些理論。所以傳統生物學的研究多半停留在小科學(small science)的範疇 : 個人的靈感和透視力是新知產生最重要的泉源。但是人類基因體定序計劃相當程度地改變了生物學研究的面貌;以團隊合作快速大量地產出資訊的策略,引領生物學逐步走向大科學 (big science) 的研究模式。

譬如說,基因體定序計劃完成後我們知道酵母菌有六千多,而人類則有三萬多個基因。接下來的工作就是要知道每一個基因的功能,對酵母菌來說,我們可以把基因一個個破壞,然後看看那些基因破壞後細胞就活不成,至少我們就知道那些基因是維繫酵母菌生命所必需。能不能用相同的策略來暸解人類基因的功能呢?答案當然是不行。只有用老鼠作為模式,當然破壞老鼠基因的技術變得更複雜,而研究的規模與所需要的資源變得更為龐大罷了!

另外也可以問每一個基因作出來的蛋白究竟存在細胞的什麼位置?要回答這個問題,就必須作三萬個螢光標記的蛋白,一個個送進細胞,再用顯微鏡記錄螢光出現在細胞裡的位置。這些都還是只要功夫下的深,不愁找不出答案的問題。但是要更進一步瞭解,這些眾多的基因在細胞內如何協同運作,答案就不是那麼單純或直接了當了!我們可以最簡單的問:一個蛋白在細胞裡會和那一些其他的蛋白結合在一起?要回答這個問題,我們就必須作三萬對三萬個蛋白的配對。問題還不在這些資訊是否容易得到,而在於一旦這筆龐大的資訊獲得之後該如何分析。想想看,三萬個蛋白之間相互結合的關係可以畫出一個極為複雜的網路。這樣的網路究竟有那些特性?它對環境刺激的反應與這個網路的結構有什麼樣的關連?不用數學裡圖論的觀念與工具,就很難非常精確地掌握其中的關鍵。不僅僅是蛋白之間相互結合的關係可以用網路的概念來呈現,其他像細胞中成千上萬的代謝反應彼比間的關係,或是眾多轉錄因子間彼此相互調控的關係,也都可以用不同形態的網路來描述。在後基因體時代,每一個簡單的問題,都很容易牽扯出無數彼此相關的答案,而單一細胞生命現象的運作,就是這些無數資訊組合的產物!要掌握生命現象運作背後的原裡,就必須掌握能夠分析複雜糸統與資訊的理論與工具。

基因體研究的進展己經把生物學家分為從事大科學的「資訊產出者」和從事小科學的「資訊利用者」。對傳統的生物學家來說,他除了原先傳統的科學訓練之外,還必須努力把自己轉變成聰明的「資訊利用者」。排山倒海而來基因資訊可以擴大我們的視野,也可以成為研上珍貴的資源,當然前提是你必須具備資訊分析的能力。未來的生物學家除了要熟悉電腦之外,他還得對資訊分析程式背後的數學原理也要有相當程度的掌握。整合物理、化學、數學與資訊的基礎已經成為訓練後基因體時代的生物學家的不二法門。對國內從事科學研究與科學教育的人,或許我們該問:我們有沒有準備好迎接這個基因資訊爆炸的挑戰?當然更嚴肅的問題是:如果我們自己沒有準備好,我們有沒有準備讓我們下一代的科學家開始有所準備?!

圖片作者: TheTim 圖片來源: http://www.flickr.com/photos/thetim/458733962/