前幾篇我都是在站資訊科學的角度談我的想法. 這一篇我想談一下關於生物學家怎麼看生物資訊. (請不要和
計算生物混為一談)
在
Nature Milestones in DNA 可以看到, 1990 年代,
BLAST 的發明是比較基因體學的發展的關鍵.
2002,
2003,
2004, 更是生物資訊的黃金時期.
雖然這些發展對資訊科學家來說不見得很熟悉, 或者說覺得很了不起, 但是隨著國家對生醫相關領域的補助開始提高, 台灣也漸漸越來越多資工系教授投入這個領域. 當然, 其中也不少對生物沒有興趣, 只是想賺點 paper 和國科會經費的研究人員. 這也是常常被生物學家批評的一點 -- 資工人做的東西沒有考慮到生物學家的需求, 盡做一些沒有用的東西.
但是, 就我個人注意到的(個人偏頗地觀察), 很多論文其實都有掛, 一兩個非資工的學者的名字, 甚至很多是生化, 生醫相關的教授. 但是這些有多有用? 我倒不以為然. 很多其實也是騙騙論文而已. 我想對某些生物學家來說, 這個研究只是大計畫下的 side project, 她們不見得會做到很細, 有時候只是當下滿意就好. 當然也是有例外, 像是 Broad Institute 就開發了很多軟體, 但是那也是為了滿足自己的需要. 而且她們有聘專業的資深工程師來協助開發和維護!
這其實是很有趣的. 同樣一篇生資論文, 生物學家在生物方面就會特別重視, 所以會強調生物方面的意義, 但是資科學者就會強調在技術上的創新, 也就是說, 兩方預設的讀者並不相同. 在論文寫作上的也有差異, 例如生物學家就偏向舉例, 盡可能不要批評, 但是資科學者就會偏向提出數據來說明做得比較好, 例如速度和準確度之類. 資科學者在圖表上面就沒那麼重視, 但是生物學家常常就會想辦法畫出精美的圖表, 而這也常常跟介面有關, 生物學家相對來說就比較注重使用者介面.
這倒不是對或不對的問題, 好的使用者介面非常重要, 這個我們從消費性電子的市場就知道了. 但是, 這應該交給專家來做, 而不是叫一些碩士班學生或者博士班學生花精神在改善這些地方. 像是 Broad Institute 這樣請職業程式設計師來做是很棒的. 但是叫學生來做這些東西, 某個程度上, 是一種資源的錯置.
我認為像 Genome Research 或者 Nature Method 這種生物為本, 偶而刊載一些生資文章的發表模式是比較健康的. Nucleic Acids Research 的 web server issue 或者 database issue 的做法也不錯. 我覺得在 Bioinformatics 之類的期刊上, 不應該刊登整合性資料庫的文章, 畢竟生物學家很少會看這種期刊, 而這種資料庫對資訊科學來說相對沒有學術價值.
就像之前提到的 Nature 有個
The Future of the PhD 裡面就提到, 不論是博士氾濫, 不只是台灣的問題, 美國, 英國, 日本, 中國都是這樣. 尤其是生醫相關領域, 增長數字更是驚人. 這些新科博士, 真的有那麼多需求嗎? 還是只是為了滿足需索無度的教育系統!? 這我沒有資格置評. 但是如果這個增長真的是病態的, 我不希望從資訊領域跳過來的學生是這個系統下的犧牲品.
好用的使用者介面, 漂亮直覺的畫面呈現, 還有整合性的資料庫, 這些當然對生物學家來說都很有幫助. 但是, 對資訊背景的學生有什麼幫助呢? 她們實作這些東西可以學到什麼? 這些東西某個程度上不該是由大型學術計畫去聘程式設計師開發維護的嗎? 還是她們被當作廉價的人力? 如果是開發真正有用的軟體, 例如到 Ensembl, UCSC, 或者 Broad Institute 去做研究或者當工讀生, 或者對生物學有很強烈的熱情也就算了, 但是如果只是為了發表論文而將才智和時間浪費在這些無謂的軟體上. 我覺得實在有點可憐. 我覺得她們的才智可以花在別的地方. 我不知道生物學界有沒有類似的生態. 但是在資訊工程, 一些 hacker, 像是 R. Stallman, T. Linus 都有很高的地位, 但是他們不見得是博士, 也不見得呆在學術界, 但是她們的確推動了技術的成長.
做什麼不是重點, 重點是真的喜歡, 或者你覺得自己做的東西有意義, 而不是為了發論文而發表的東西而已. 一個真的用心想要投入生物資訊研究, 應該是願意花錢去做資料蒐集和驗證的學者, 而不是僅僅把這個東西當作是 side project 的學者, 或者換一個角度來說, 是否對生物研究和和對生資研究有同樣的嚴謹態度? 同樣看重? 這種要求很容易陷入僵局, 因為對另一個領域的了解有限, 往往對品質無法作正確的評判 --- 過高或過低. 這是跨領域合作的難處. 我也相信所以跨領域合作不該是兩(多)個團隊短期的相遇, 而該是長期的相處.
如果生物學家覺得生物資訊沒啥用處, 這也okay, 那就請那些生物學家不要來玩這個東西, 乖乖當 end user. 如果生物學家覺得生物資訊很有用, 但是對這個東西沒有研究興趣, 請給這個領域的學者一定的尊敬, 當個虛心的 active user. 如果生物學家覺得生物資訊很有用, 也想一起合作開發一些有用的東西, 也請尊重對方的研究興趣, 對資訊學者來說有學術意義的東西, 不見得對生物學家有意義, 但是這就是合作要互相禮讓的部分. 資訊學者花很多時間改進模型或者演算法, 或許對生物學家來說不是那麼重要, 但是這是學術合作, 不是商業合作, 不是片面由消費者覺得一個東西的價值. 生物學家很容易忘記這一點.