2011年4月11日 星期一

一流的生物資訊研究 II

前文

後來我跑去追問我的上司,他跟我說了他的理由 -- 乾淨的數學 model 之類的。老實說我並不太認同。套用 Richard Durbin 的觀點,所謂的生物資訊就是指所有管理和運用生物的訊息的軟體。

"I do not think all biological computing is bioinformatics, e.g. mathematical modelling is not bioinformatics, even when connected with biology-related problems. In my opinion, bioinformatics has to do with management and the subsequent use of biological information, particular genetic information."
然而並不是所有的生物訊息都能有乾淨的 model. 尤其是為了讓準確度一點一點的提昇,誓必需要更多的 empirical knowledge 和 heuristics。

我個人比較偏向 Alex Kasman 的定義。他認為與 mathematical biology 相較生物資訊或計算生物學比較傾向於去解決特定問題或研究特定的方法。
...seems to focus almost exclusively on specific algorithms that can be applied to large molecular biological data sets...
但是,mathematical biology 比較偏向從數理的方式上去瞭解或解釋生物現象。
...includes things of theoretical interest which are not necessarily algorithmic, not necessarily molecular in nature, and are not necessarily useful in analyzing collected data.
從我個人的觀察上來看,我上司比較不喜歡計算生物學這類的研究,他一直強調,生物是實證科學,研究就是要有實用性。(這點我想他是受他的指導教授影響)

批評一個研究的好壞,我想主要是讓同領域或同研究性質的人評價。做電腦網路的學者不見得能很好的評價做計算理論的學者。生物學家不見得能很好的評價生物資訊的學者。 (在生物學家心中,好的生物資訊學家可能比較偏向一個會開發軟體的 digital biologist。)

不過,一個很現實的問題是,生物資訊,相較於計算生物學或者生物數學,更偏重於軟體的產出,在這種情況下,使用者的意見變成很重要的評價標準之一。有些人批評生物意義不足,只是軟體而已;有些人批評軟體不完整不 user-friendly,為了論文開發而不是當作產品開發。這些都很有道理,但是也都只站在生物學家的角度過去批評這個領域。

以在資訊的領域,我想續聘標準應該是以資訊相關為參考吧,有多少系所可以讓教授像生物學家這樣慢慢磨出論文?而且出品的論文越多,他們要維護的軟體就越多,這個成本根本高到不可能做到。就算是 Sanger 和 Broad,我想也有很多軟體現在都乏人聞問吧,更何況像 Sanger 和 Broad 這麼有錢可以䀻專任程式設計師的單位有多少?以 MIT 的 Christopher Burge 這個大頭來說,他是生物學士和計算生物學博士,在生科系任教,他的網頁上列出的軟體大概有十來種,都有人 maintain 嗎?有些都已經是十幾年前的軟體了,另外,他在這二十年來,發表了七十篇論文,也就是說他不是純做軟體而已,如果有七十幾個軟體,他們要如何維護?

基本上我不是認為我上司的論點是錯的,但是我始終認為他太過注重生物學家的觀點。(沒辦法,他是生物學家) 再加上在他一流的生物機構受訓練,他所認為的標準也比別人高。但是即使是美國 Top-50 的大學,也不見得有做到他的標準所需要的資源。

Ref.: More on “What is a computational biologist?” (and related disciplines) | Code for Life

沒有留言: