2011年7月26日 星期二

演算法與 domain knowledge II

前文

我並不是說,演算法或者演算法的訓練沒有實用價值。

雖然我會在這個部落格幹譙生物學家或生物資訊,但是我並不認為只要 CS 功力夠強就可以做好跨領域研究。IOI 的銅牌 vgod,跑去做 人機界面,但是這個領域似乎想法比編程功力重要多了(?)

我本身沒參加過 ACM-ICPC 或者 IOI,雖然我認為這些解題技巧的訓練是非常有用的,但是在職涯發展上到底有多大優勢,我覺得很難說。姑且不論蠻多人都認為這些競賽者為了贏得比賽,通常被訓練出不好的編程習慣;解題技巧本身的進步和退化是跟使用有關的頻率有關,當投入另一個領域之後,所需要耗費的精神勢必減弱原來的解題能力。

如果研究主題有越多 domain knowledge,基本上解題技巧的重要性就逐漸被淡化。在努力補上需要的知識的過程,某些東西就勢必要放手。最後會是選擇平衡點的問題。例如(20%生物,80%資訊), (40%生物,60%資訊), 或者 (30%生物,70%資訊)。

我的立論就是這麼簡單,只根據一個假設:心力守恆。

演算法的訓練所能帶來的優勢,我覺得跟選擇的題目更有關系。假設做理論性的題目,像是 phylogenetic tree 或者 rearrangement 的演算法,我想演算法訓練非常重要;但生物資訊發展已經數十年,做這類題目的學者也都不是軟柿子。我不認為在這方面佔得到便宜,畢竟者這種題目也就等於演算法研究了。

我想這也是『演算法與 domain knowledge 孰重』這類主題始終沒有定論的原因。不同的跨領域研究/產業 需要不同的技能組成與比例。或許在大型產業或公司中,會有專重演算法的單位,但是談到『優勢』,這也和投入的時間以及當時的人力組合有關。

2011年7月24日 星期日

演算法與 domain knowledge

最近有個做演算法的學弟寫信來問我: 做演算法的人在生物資訊上有沒有優勢.

看到這個問題有點不知所措, 我不覺得自己夠資格回答. 只能就個人經驗簡略表達意見.

最大的問題還是在於, 上班的公司或單位, 多重視演算法開發這個部門, 願意讓做演算法的人花時間去解決問題. (不見得能解決, 例如證明出來是 NP-Hard, 這對公司來說可能沒啥意義. 但是 Approximation 或者 Heuristics 的解法可能又不能接受時, 最後還是要嘗試暴力解.)

在生物資訊上來說, 基本上大多數我看過的研究還是處於套用不同的技巧並整合不同的生物知識居多, 實際開發新的演算法的研究基本上是少數. 以我自己有限的經驗, 大多是做工具和處理資料, 如果碰到很難的問題, 通常會被要求繞過去或者放棄.

再者, 演算法的子領域很多, 平行演算法, 近似演算法, 字串, 圖論, 計算幾何, 資料結構等等, 各有各的限制和要求, 研究字串演算法的人, 不見得熟悉圖論演算法, 而研究 exact algorithm 的人, 不見得抓得到近似演算法或者 Heuristics 的設計概念. 所以有 n 年資歷的演算法學者跳去做應用時, 比起該應用領域有 n 年資歷的學者來說, 實際上有多大的優勢, 我是有點存疑. 當然對於強者演算法學家來說, 可能沒差, 反正什麼題目對她們來說都是信手拈來.

至少我看到一些在生物資訊很受重視並廣泛被使用的研究成果(軟體), 大多不是在演算法上原創性很高的方法. the algorithmic lens 到底有多有用, 我也想知道.

2011年7月18日 星期一

小記

  • Ref.: Marvin Minsky - John Nash solves my PhD problem - Web of Stories

    AI 大頭 Marvin Minsky 說 自己也曾經被 J. Nash 電過....。神人真是不同凡響。
  • Ref.: 研究補助縮減 大學恐剩教書匠 - 高等教育論壇 - 文教要聞 - udn校園博覽會

    過去向國科會生物處申請專題研究補助,約有50%可通過,今年據了解只約30%。許多教授建議國科會重新檢討其他大型計畫的效果,科技預算緊縮,就要讓「錢用到哪裡去了」更透明。
    據說美國只剩下 10%,我想台灣不算是特別低的吧。
    不少大學教授也反映,國科會補助大學研究的件數若縮減,將嚴重影響台灣學術發展,未來研究型大學可能只剩「教書匠」,延攬國際研究人才也將更困難。
    教書匠?研究匠有比較偉大嗎?
  • 最近幫生物學家分析資料,檔名上有 HeLa,才發現原來這就是鼎鼎大名海拉細胞。真是有眼不識泰山。

    回台灣有機會應該把《海拉細胞的不死傳奇》找來看看。

2011年7月12日 星期二

二十世紀最偉大的生物學家

前一陣子和上司聊天,聊到了Crick和 Watson,我上司(生物學家)認為他們兩人是20世紀最偉大的科學家之一,可以和愛因斯坦齊名。

我不是生物學家,所以不是很清楚,但是當時很多人都在研究 DNA 的結構,像是莫里斯·威爾金斯萊納斯·鮑林,還有 被陰的羅莎琳·富蘭克林。也就是說,就算他們兩人沒發現雙螺旋結構,似乎也不會拖太久,數年內可能也會有人發現。

我不太明白為什麼會被 Crick和 Watson 會被吹捧得這麼高?並不是說他們兩位的貢獻不夠卓越,但是在二十世紀裡這麼多優秀的生物學家和諾貝爾獎得主裡,何以他們兩位可以被拉到這麼高的地位?這我實在不太明白。

Ref.: DNA雙螺旋五十年 - 實驗室裡 實驗室外 - PChome 個人新聞台

Ref.: 生物學史 - 維基百科,自由的百科全書

2011年7月5日 星期二

Falling Skies

最近在看新的影集 Falling Skies


我覺得還不錯。老實說我還蠻喜歡看這種片子的,與其看人類互相殘殺,不如看各色人種聯合起來抵禦外侮(外星人)。當然前提是不能拍得太爛。

有點意外的是,竟然製片是 Steven Spielberg ,我還以為他只會拍一些跟外星人友好的片子說。

科科。

2011年7月1日 星期五

看電影

Ref.: cinema-critique: 消遣《變形金剛3》(Transformers Dark of the Moon) 現象 - yam天空部落

我身邊的同學朋友基本上大多可以分成兩類電影觀眾. 第一類是電影不用去戲院看, 網路上抓,租DVD, 或者等電視重播就可以了. 第二類是去戲院就是要看聲光效果, 所以爽片, 例如《變形金剛3》才值得去戲院看.

我的觀點是, 進戲院看是要看好電影, 只要能讓你覺得感動, 這就是一部好電影, 跟電影類型無關. 其實我不太愛去戲院看動作片, 因為動作片能夠讓我印象深刻的機率很低.

當然不是說我完全反對去戲院看爽片, 在戲院吹冷氣看電影吃爆米花喝可樂當然是很暢快, 但是對我來說出戲院之後會覺得很空虛. 爽兩個小時, 但是空虛一個下午, 對我來說很不划算. 我更傾向於把這個活動視為團體活動, 所以除了和女友約會或者和朋友出遊, 我不會想要去戲院看爽片.

研究與民生

Ref.: Galerie Bleue: 關門
荷蘭烏德勒支大學決定關閉該校天文所。荷蘭的天文學有相當悠久的傳統,該大學與天文所都非常古老,這個消息讓很多天文學家感到氣餒。目前的氣氛相當悲觀,在全球經濟持續不振、研究預算緊縮的情形下,這恐怕不會是唯一一個被關掉的天文所。
這其實牽涉到一個核心問題,就是在經濟前景不明的情況下,我們應該打腫臉充胖子投入基礎科學嗎?還是應該先把力量集中在與國計民生有關的學門?

Ref.: 【意見評論】如何決定科學研究的價值 « CASE PRESS
政策制定者、資助者和科學家都應該謹記。例如,同是亞利桑那州立大學政策學家邁耶(Ryan Meyer)提出的一篇論文,著重於討論美國政府全球變化研究計劃在提供廣大公共價值方面的失敗。基於與研究者、政策決策者的個別訪談,以及對公開聲明的研究,邁耶說,美國的氣候計畫在過去二十年,受益於公共投資超過三百億美元,但多數都未能產生決策者和公眾所想要的信息以及參與形式。社會上有一種觀念是,任何知識上的進步都是好的,縱使這些科學沒辦法達到該達成的目標與重點;邁耶認為不該還有這種觀念。

我想任何知識上的進步都是好的,但是當國家設計研究計畫時, 應該有它預期的目標, 而不是把錢灑下去而已. 國家應該要支持基礎科學,但是未必要投入大量資源. 以氣候變遷的問題來說, 台灣可以集中在特定的領域, 像是跟颱風相關的研究.

支持理論研究或者基礎科學的理由, 除了它的潛在應用價值以及知識上的美學價值外, 保留詮釋和推廣該領域的能力也是十分重要的, 目的是為了保持學術多樣性. 這有點類似生物多樣性的概念, 我們會期望即使台灣沒有能力發展特定領域, 也能讓那些有潛力的人到願意發展的國家去學習和研究. 但是學生不會憑空接觸得到這些訊息, 所以我們需要保留一些資源給各領域, 讓他們生存下去, 並讓他們能夠傳承下去.

Ref.: 【科技歷史】瞧 ! 馬克斯威爾來了 « CASE PRESS