這件事我提過很多次, 物理學家投入生物學, 產生了分子生物學這個領域; 統計學家投入生物學, 帶來了遺傳統計這個領域. 那麼資訊科學家將會帶給生物學什麼東西?資訊科學帶給了生物學家哪一種不同的思考? 資訊科學家該用哪種態度看待生物資訊?
有人說生物資訊都是 heuristics 太 trivial. 但是 VLSI EDA 或者 Network 裡面也大多是簡單的演算法和 heuristics! 為什麼沒人說 VLSI EDA 或者 Network 太 trivial !? 我認為癥結是在 "問題" !
VLSI EDA 或者 Network 基本上都是要設計某個東西出來, 所以即使研究者提出新穎但有點不切實際的模型或解法, 由於 IC Design 或 Network 完全是人工的東西, 所以你很難說他沒意義. 但是生物學不是要設計什麼, 而是探索自然, 而這門科學本身對他們要研究的對象了解又不夠, 所以只要稍微離開物理或化學可以去分析的層次, 資訊科學家很難主動提出什麼模型或解法.
物理和化學都大量用到計算機, 不過通常都是科學計算的部分, 在生物學裡也有這樣的領域, 像是計算生物學等等, 通常這些問題就是比較可以明確定義的問題, 像是 haplotype。不過,這些東西對生物學家來說通常不會有非常非常大的影響力,因為太技術性了,有點像是一把超好用的外科手術工具,或許外科醫生會覺得很棒,但是外科醫生有一絲感動嗎?我是蠻懷疑的。
資訊科學的很多概念,基本上都是和其他領域共有的,例如機械學習理論和統計學習理論的關聯就很強,資訊理論編碼理論之類的東西基本上也是電機通訊先有的,如果排除這些,對我來說,資訊科學的思考模式,最大的特點應該就是 trade-off 和 constructive proof。這在以設計為導向的研究非常有威力,但是對分析為主的研究來說,效力似乎就不是那麼強大。
下面是我和實驗室同學們的對話(略有修改,我是從 plurk 上剪貼下來的, 所以有一些混亂, 但是我不想太大幅更動我們之間的對話.)。我們都是學生而已,但是訓練各有不同,也是一種想法的分享。不過我並沒有徵得他們的同意,但我想應該猜不出來我們的真實身份 :)
學長 R 說 你該換個方向想,身為資訊背景的人,你能問什麼樣的ˊ問題 ..要走生物資訊 一定要非常加強生物背景 否則永遠只能被動的接問題
我 說 問題有很多種阿!? 計算生物學, 字串比對都是 "問題", 但是這些問題對生物學家的重要性日益下降! "如何從資訊的角度問出讓生物學家眼睛一亮的問題?" 而且如果太過強調生物, 那 "懂資訊的生物學家+軟體工程師" 一定狂電生物資訊的博士....
學長 R 說 並不是這樣,資訊人的優點在於,對於同樣的生物問題,你有屬於資訊觀點的解法。程式?演算法?那離問題本身很遠,你的觀點才重要,我舉我領域的例子,分析基因體重組的兩類人,生物學家或許懂程式,也懂找工程師寫程式,但他們切入的點跟資訊學家切入的點完全不同。生物學家看到的是基因頭尾演化樹不相同,而反之利用拓樸分析去找重組事件,資訊學家則是從同構序列分析演算法切入,直接去找發生重組的片段。這兩支科學都發展得很龐大,也都很有用。學資訊的人與學生物的人在思考方向上差異很大,這是我待在生物實驗室親身體會的,而這樣的差異,就是彼此的利多。從自己鑽研的子領域發展出自己的觀點,以這個為中心去解各式各樣的問題,當有一天你的成果圍繞著觀點已能自成一格時,那就是你所說的品味
我 說 恩...我了解, 可是....還是有點困惑. 例如 David P Bartel, 他們實驗室是做 microRNA tool, 為了做得更深入, 他們還用各種 report assay 和 proteinomics 的方法去研究 miRNA 的特性. (我在他 Cell 的 review paper 裡看到的) 我覺得要做得比他們好幾乎不可能, 一方面 miRNA 機制未明, 很難良好地 modelling, 另一方面, 從資訊角度提出的 idea, 比較起他們的實驗等等, 在研究的完整度上會差很多. 最後還是要依賴生物學家做實驗! 除非是大頭, 像是李文雄, 自己就很有錢可以給外面做實驗, 不然通常都還是要看生物學家的臉色. 所以我才會覺得 "如何從資訊的角度問出讓生物學家眼睛一亮的問題?" 很重要!
學妹 D 說 計算生物學, 字串比對都是 "問題",但是這些問題對生物學家的重要性日益下降!>>>NGS現在不正是需要這個的時候嗎 最近新出的一些系統生物paper在建network時會希望把sequence alignment加進去 連謝老師都要求自己的學生嘗試看看。對學生物的人來說他只單純希望input給學電腦的,然後output給我什麼東西,所以如果能知道生物的知識,其實就有發現問題的優勢了,單純用資訊的角度去modeling代謝的問題,我覺得很天真,因為不管什麼model,都還是會base on過去實驗出來的數據。不知道我這樣想有沒有錯,電腦本來就是發明出來讓人類方便的,解決人類的問題,不像物理和化學原本就存在於世界上,如果電腦和統計這些東西和要解的問題分開,就變成死的了,就算是學生物的,不同領域的人如果不了解就要去解對方的問題,A疾病的要去解B疾病,用相同的WORKFLOW有時一切也會很不合理的啊。生物統計是統計學家帶來的,那生物資訊不就是資訊學家帶來的嗎,聽之前老師說很多大公司在處理生物晶片資訊分析,都是CASE BY CASE的處理 而且實際狀況也應該是要這樣 要一言以蔽之到底資訊科學家會給生物學帶來什麼東西 答案一定很模糊吧
我 說 所以現在 High throughput 的實驗技術才會這麼受矚目 :-) 基本上生物學家自己對生物模型的了解都那麼簡陋了, 不管用什麼方式去 model 都不太可能做得很好. 我想一些電腦科學/統計學的理論學者不會認同你的話 :-) 雖然我基本上認同你的論點, 但是你也要注意到, 這是因為你喜歡生物的關係, 對生物沒興趣的資工人來說, 為什麼他們要研究的領域必須是別人的附庸!? 在做生物網路時把序列的資訊加進去看不是現在才有的 idea了, 至少五六年前就有了吧. 我說的不是說這個資訊不重要. 從學術發展的角度來說,當然都重要. 我的問題是,生物學家會關心細節的發展嗎?還是有東西給他們用就好! 那麼說難聽一點,我們不過是工人?所以我們能問什麼問題很重要!
我先承認我這個問題是抽象而不太切實際的 :-) 我說的不是產生一個子領域, 而是在思想上帶來什麼衝擊!!! 當然也可以說是一種嘴泡 XD 我只是想知道, 在從生物研究而來的技術問題之外, 我們有多大的可能性能反客為主? 主導生物研究? 統計學有自己發展的歷史, 高斯的最小平方法基本上是應用在天文學上, 但是現代統計基本上是 Fisher 和 Pearson 奠定的, 他們(尤其是 Fisher) 主要是把統計應用在生物問題上, 也開發了不少技術, 像是 ANOVA. Fisher 在演化和統計上做了很多工作! 擴展達爾文和孟德爾的概念, 今天做生物研究的人, 或許對生物統計的細節不清楚, 但是有誰不受這些思考影響? 物理/化學更不用說了, 今時今日, 分子生物已經打下了生物學的大半片江山 XD
計算生物學當然很有用, 但是到底有多大的部分影響了生物學家的觀點? 資訊處理是資訊工程的強項! 但資訊分析不是, 分析我們比不過統計學家!!! 那我們可以貢獻什麼? coding 的技能嗎? 我想這也呼應了 學長 R 說的, 要加強生物知識主動去問問題! 而不是被動的去接問題! 但是要怎麼問, 該如何問, 對我來說還是很模糊 Orz 可能是因為我是雙魚座的, 比較浪漫比較愛作夢, 單解一個個的問題對我來說很無聊, 我寧願去外面工作賺錢! 我希望能有一個大目標, 只要朝著這個目標前進, 即使貢獻只是些微的一步兩步, 我也覺得很開心 :-) 這也是我唯一不喜歡演算法研究的一點, 一個個的智力遊戲, 好像是在比誰比較聰明而已!? 把某個問題從 n^3 變成 linear time, 對演算法這個領域, 到底有什麼意義?
好像有點太激動了...科科. 不過我的確是困惑了很久 :-)
學妹 D 說 我覺得對某些學生物的 學資訊的真的很像是工人 至少我看到有些人的態度是這樣 但我覺得這樣也是不對的 真正的資訊科學不是只是會用電腦就好的了 但我也覺得有些學資訊的去批判學生物的不懂資訊也不對 畢竟當一個資訊工具沒有考慮到很多細節就想解決生物問題 對生物學家來說不就跟廢物一樣。但很多現狀也是無法改變的 畢竟大家各自的能力都是有限的 要一個在自己專業上top的人去虛心從新學習另一個領域 並不是很簡單的事情 生物資訊很多時候還是像夢想一樣., 有時候有一點小失落 : p 但我想大家努力在不同地方挖掘東西 總會有適合和想去的位置 能夠把自己的能力貢獻在這個領域我覺得很棒 這就很重要了啊
我 說 任何跨領域研究都需要投入吧。不管是哪個領域來的人,為了要溝通,都應該要投入一部分的心力去學習對方的語言。至於深入學習另一個領域的知識就未必需要了,我覺得這要看合作的模式和規模。 其實生物學家自己也沒考慮到很多細節XD 很多都是覺得大概是這樣,實驗先做下去再說,他們的邏輯反而沒有我們清楚。所以實驗都亂做阿,謝老師他們做生物晶片分析的應該都很有感觸,哈哈。對我來說,我一點都不想替生物學家解決自動化問題,應該是生物學家提出一個讓資訊學家覺得有趣的生物問題,然後我們投入進去共同找出解法才對阿。不過目前生物科技正夯,人在屋簷下,不得不低頭阿。(煙~~)
沒有留言:
張貼留言