2011年4月29日 星期五

羞於告人的「卓越」秘密

Ref.: 清大彭明輝的部落格: 台、清、交大羞於告人的「卓越」秘密
我才55歲,要退休了。我在退休申請表上坦然寫出理由:「我所承襲的學術傳統旨在明辨是非,破除愚盲,探索社會發展之未來,培育後進,以促進社會之公共福祉,而非用以圖謀個人之名利與地位,或虛幻之世界排名。這樣的學術傳統在清華校園已日漸澆薄,培育後進與促進社會公共福祉之本務日漸乏人聞問,而「只問業績,不論手段」的各種制度與風氣則漸成主流。『不同道者,不相為謀』,個人對學術與教育所秉持之理念與既有制度漸行漸遠,希望能退休以便從事其他更能契合個人理念與心願之活動。」
如果彭教授真的是以這個理由申請退休,那我之前寫的文章就太不敬了。

另一篇文章,亡台從五年五百億開始,對文中很多地方都很認同(當然也有不甚認同的地方,但是都值得我們反思)。

環境影響人的程度往往超過我們所能意識到的。在這個環境,有些想法都漸漸扭曲,我偶而還會想起當年跟同學閒聊時,說自己不想念博班的理由。現在我還會這樣想嗎?我們總是強調專業上的訓練,那在專業之外呢?學術倫理呢?

以前看到指導教授忙兼任行政職時,每年都要花很多時間和精力開會討論,如何制定一些策略,讓入學分數可以提高,以期能在聯招中勝出。

雖然我能夠理解他們的難處,但是我始終不禁為他們感到可惜,這些一流的頭腦,都虛耗在這種的事情上面了,而我也不禁擔心未來接棒的新生代學者,又有多少可以跳脫出來?

小記

  • 做出Facebook規模,你所需要的技術元件總覽

    很炫!!!!
  • 最近看了兩篇文章, 都講到貨幣上的圖案. 高斯, 盧瑟福. 回頭看看新台幣, 雖然說小朋友是國家未來的希望沒錯啦. 但是總覺得這個是政治妥協的結果. 梅花鹿之類的雖然也不錯, 但是一個國家之所以偉大, 是因為他的人民做了什麼, 而不是擁有什麼天然資源吧!?
    2001年,中華民國中央銀行正式於20元硬幣鑄上莫那·魯道肖像以茲紀念。
  • Strange Places To Prove Theorems « Gödel’s Lost Letter and P=NP

    很有趣的小文章. 尤其是
    On a Date: The man shall remain anonymous; the lady did not become his wife\dots
  • Ref.: Ravi Kannan Honored for Advances in Algorithmic Techniques
    His foundational work spans many areas of theoretical computer science including lattices and their applications, geometric algorithms, machine learning, and computational linear algebra.
    依照慣例要貼一下得獎新聞.
  • Ref.: 傷不起!亞馬遜史前最大宕機事件的啟示-科技頻道-和訊網
    Ref.: 關於Amazon云宕機的網貼收集 | 酷殼 - CoolShell.cn
    Rackspace公司的首席戰略官和數據中心服務專家Lew Moorman說,亞馬遜的中斷事故跟墜機差不多,屬於普遍事故中的一種。他指出,然而,飛機旅遊比開車旅遊還是安全一些的就好比云計算比公司私有的數據中心要安全。「從世界範圍內來看,每天,公司內部都會出現宕機事件。」Moorman表示,「每一段時間都很小,但是他們加起來就是更長的中斷時間、金錢損失以及業務損失」。
    I told you XD

2011年4月25日 星期一

社會責任與工作責任

最近意外看到清大彭明輝教授的部落格. 也看到了很久以前鼓勵過我的老文章.
最諷刺的是:當我們面對兩個可能的方案,而焦慮得不知何所抉擇時,通常表示這兩個方案或者一樣好,或者一樣壞,因而實際上選擇那個都一樣,惟一的差別只是先後之序而已。而且,愈是讓我們焦慮得厲害的,其實差別愈小,越不值得焦慮。反而真正有明顯的好壞差別時,我們輕易的就知道該怎麼做了。可是我們卻經常看不到長遠的將來,短視地盯著兩案短期內的得失:想選甲案,就捨不得乙案的好處;想選乙案,又捨不得甲案的好處。如果看得夠遠,人生長則八、九十,短則五、六十年,先做那一件事又有什麼關係?甚至當完兵又工作後,再花一整年準備考研究所,又有什麼了不起?
彭教授的生活方式是讓我十分羨慕的. 我對政治沒有太大興趣, 但是對人文社會科學卻很有興趣. 我也認為知識份子有相對的責任義務去向社會發聲.

時遷境移, 這次重新看到彭教授的文章, 卻讓我多想了一些事.

依照網頁資料推算, 彭教授現在大約快六十歲. 1995 年任清大動機所正教授後鮮少發表論文. 也就是說, 彭教授不到五十歲, 就鮮少發比學術論文了. 這是正常的狀況嗎? 當然這是很膚淺的調查, 其實還需要看業界計畫, 國科會計畫等等. 而且有的教授興趣偏向實務研究, 對發表論文興趣比較低. 這也是有可能的.

除了社會責任之外, 知識份子的工作責任一樣重要. 研究型大學自然有對教授的獨特要求. 劉炯朗教授和李家同教授這樣不但人文素養深厚, 對研究也不放棄的態度一向讓我很敬佩. 雖然學術研究已經不再是他們生活的重心, 但是只要他們一日是教授就要把研究和教學做好, 只要他們一日是校長行政就是他們的責任.

但是, 如果興趣已經轉移了呢? 如果研究興趣轉移到另一個領域了呢? 這樣要如何盡到工作責任? 很多人再談到學術工作時, 都會提到穩定, 工時有彈性之類的特點.

這讓我想到另一個人, Alan Lightman. 劉炯朗教授也介紹過他. Alan Lightman 本身是物理學家, 但是後來對寫作的興趣越來越濃厚, 最後就改為教授寫作課程. 我覺得這沒有什麼不好.
最近我參加一個人文和科技的對談,主持人選了一本很有趣的好書作為對談的導引,這本書叫做《愛因斯坦的夢》(Einstein’s Dreams),原著者是萊特曼(Alan Lightman),他是美國麻省理工學院的教授,中文版的譯者是童元方教授,她是香港中文大學教授。這兩位作者的背景和經歷反映了人文和科技的結合和交融,萊特曼在普林斯頓大學主修物理,在加州理工學院獲得天文物理學博士學位,然後在康乃爾和哈佛大學從事天文物理學領域的教學和研究工作;同時也開始寫詩和有關人文科技的文章,十幾年之後,他到麻省理工學院任教,開授物理和寫作的課程,他是麻省理工學院第一位同時被聘為科學和人文兩個領堿的教授,不過,近年來他把時間和精力專注於在寫作上。
我會認為, 如果研究興趣改變了, 最好是做到能夠讓其他的單位聘用, 以彭教授來說, 他不但得過好幾個人文藝術獎項, 也擔任了藝術中心主任, 目前是交通大學文化與社會研究所兼任教授, 我覺得這是很好的例子, 只是如果我不清楚, 對動機所來說, 這位雇員是否有花更多的時間在控制工程的研究上.

我也不是認為, 不做研究就該辭退, 畢竟不同的領域風格大異其趣. 像是號稱四十歲是創造力門檻的領域, 似乎不該這麼做. 所謂在做研究的意思, 有很多層的含意, 教育研究生也是一層.

David Eppstein 最近就寫了一篇文章 談到他最近在 Wikipedia 上寫了一篇關於 integer sorting algorithms 的 survey. 這種寫 survey paper 或者 technical report, 我覺得對學術界也有很正面的貢獻. 當然教育大學生也是一個重要的貢獻. 所以問題是在於如何評估一位教授盡到了他的工作責任.

如果不參與行政職, 教授本身是相當輕鬆的工作, 一學期頂多教三門課, 加上備課等時間, 大概頂多 3.5 個工作天就夠了. (我想大部分的老師不會像陳寅恪那麼認真備課) 雖然說, tenure 本身就是要保障教授的權益, 但是依照六年條款, 我主觀的估計是大部分的老師升上正教授的時間大概都在十到十五年之間. 也就是說大約四十五歲到五十歲之間會變成正教授. 目前大學教授之強制退休年齡是 65 歲, 所以有大約 15 年的時間幾乎可以說是沒有什麼工作壓力的. 如果真的要養老的話, 的確是不太公平的. (超強者教授, 例如諾貝爾獎得主, 另當別論, 因為他可以不斷貢獻"名氣", 對建立校方或系方的聲望是很有價值的.)

現在這種以 SCI 為尊的風氣並不是很好的方式, 我們需要更有效評估教授貢獻的指標.

Ref.: 吳清在,施念恕,2007,〈台灣地區大學教授薪資待遇合理性初探:大、中、小學教師之比較研究〉,(2007年會計理論與實務研討會年會,台北大學與中華會計教育學會合辦,2007年十一月[Proceedings: 33-76].) (draft)

2011年4月20日 星期三

網路英文字典

我個人最常用的網路英文字典是 Yahoo!奇摩字典, 有人說香港版比較好用, 但我是覺得差別好像沒那麼大.

雖然很多人認為英英字典比較好, 但是她們並不用 KK 音標, 所以我都看不懂, 這很討厭. 畢竟並不是任何時後都適合點發音來聽. 所以我的第一選擇還是Yahoo!奇摩字典, 畢竟很多時候只是要查一下, 並不是要練英文, 尤其是名詞. 但是它最大的問題是, 發音有時候跟英標標註不太一樣, 讓我覺得很困擾.

所以當我比較認真一點點時, 通常會用 The Free Dictionary, 他的解釋很多, 而且也有相近字. 雖然沒有KK音標, 但是有三種發音, 有男有女, 對我這種耳朵長繭的人來說很好用.

除此之外, 會用的字典大概就是 Cambridge Dictionary Online, Dictionary.com, 和 Wiktionary 吧. 但是如果真的是要複雜或專業的東西, 還是直接 Google 或 wikipedia 最有用. 例如 Bake 和 Broil 的差別, 在Cambridge Dictionary Online上的解釋是:
bake: to cook inside a cooker, without using added liquid or fat
broil: to cook something by direct heat, especially under a very hot surface in a cooker
我個人不懂烹飪, 所以不知道是不是我理解力比較差, 但是我光看這兩個解釋還是看不太懂就是了.

至於黑話或者俚語, 它們也有專屬的字典, 像是 Urban Dictionary, The Online Slang Dictionary, 不過實在太少用了, 我也不知道好不好用 XD

2011年4月18日 星期一

偽責任制

Ref.: 喲哪桑 Speaking 之專案工作日誌: 六點了,大家下班!

台灣竹科有一種有名的產物,叫做『偽責任制』。說得更明白一點,叫做『上班打卡制,下班責任制』。以超多的工作量,讓你永遠有盡不完的責任,不但可以名正言順的不准你下班,還可以省下加班費。

這篇文章就讓我有這種感覺。
當然,回家不代表就是完全不碰公事 (這點倒是和張忠謀先生說的一樣),產品經理和UX回家了以後,還是會一邊把玩產品,繼續觀察使用者,思考使用的情境;ScrumMaster/專案經理回家以後, 還是會閱讀公司營運的 Metrics,閱讀 Scrum Alliance 或是社群的討論。
請問程式設計師下班之後要如何繼續工作? coding/debug ? 還不是要坐在電腦前! 這對員工有啥好處?能提昇多少生活品質?

繳少無謂的會議可以增加生產力,這很多書都說過,Rework 不是第一本,也不會是最後一本。但是讓員工從在公司加班變成在家裡加班,能提昇多少生產力?(工作環境更容易分心! 而且,在家工作和在家加班是兩回事,前者是彈性工時,後者是延長工時。)

強制下班這樣的美意,如果沒有控管工作量,其實也等於逃避加班費而已。

我自己就碰過這樣的例子,當年黃系主任以類似的理由,晚上關掉冷氣,美其名為希望大家不要工作過頭,實際上只是為了省電費而已。以台灣研究生這種薪水極低,而且畢業時間相對來說未知的『職業』,再沒有提供替代方案的情況下,跟要求沒有底薪的業務員下班時間不準拉業務一樣可笑。更何況學校裡有多少大頭教授,都在學校工作到十一二點,請問這些大頭都是工作效率低落的傻子嘛?


在我看來,員工下班之後的工作最好當時手上的東西沒有直接的關係。老闆可以『期望』員工下班之後還能關心公事,但是必須有合理限制。

例如,美術設計師下班後,可能還會琢磨該怎麼設計,但是如果開電腦畫圖找圖就有點過頭了。程式設計師下班後,可能會參與一些 open source project 或者上 stack exchange 上查資料,但是動手寫公司的程式就過頭了。

像這樣的例子,才是不會傷害員工生活品質,並且對公司長遠來說有意的狀況。

2011年4月16日 星期六

什麼才叫好的解釋

最近看了一篇非常有趣的文章. 其實我也寫過類似的文章. 不過立場卻完全不一樣. 對我來說, 一個真正的問題是 --- 什麼才叫好的解釋.

Matrix67 說他的理想
學習數學的過程,應該和人類認識數學的過程一樣。我們應該按照數學發展歷史的順序學習數學。我們應該從古人計數開始學起,學到算術和幾何,學到坐標系和微積分,瞭解每個數學分支創立的動機,以及這個分支曲折的發展歷程。我們應該體會數學發展的每個瓶頸,體會每個全新理論的偉大之處,體會每一次數學危機讓數學家們手忙腳亂的感覺,體會先有直觀思維再給出形式化描述的艱難。
我也蠻喜歡這樣的東西, 不過是個人的歷史嗜好. 未必最適合拿來學習. 一門學問的發展, 中間除了知識的累積之外, 也必然包含了很多汰舊換新的過程, 很多概念往往到了很多年之後, 才能看出它的真正意義. 甚至有些重要的解釋方式或者觀點, 到了後來也不是那麼重要了. 以集合論來說, 到了 Georg Cantor 那個時代才開始要嚴格的處理這些概念, 公理化的處理方式更是近代的事. 難道我們要等到把十九世紀前的數學都學完了, 才開始學集合論嗎?

舉個例子吧。如果有學生問,質數是什麼?老師會說,質數就是除了 1 和自身以外,沒有其它約數的數。不對,這不是學生想要的答案。學生真正想知道的是,質數究竟是什麼?其實,質數就是不可再分的數,是組成一切自然數的基本元素。 12 是由兩個 2 和一個 3 組成的,正如 H2O 是由兩個 H 原子和一個 O 原子組成的一樣。只是和化學世界不同,算術世界的元素有無窮多個。算術世界內的一切對象、定理和方法,都是由這些基本元素組成的,這才是質數為什麼那麼重要的原因。

這個時候我想也可以繼續問說, 為什麼不可再分的觀點是以乘法的角度來看? 不能是加法嗎? 數論中也有很多關於加法的題目, 像是 Goldbach Conjecture 是關於兩數之和, Erdős–Turán conjecture 是關於等差級數 !? 其實我也不知道答案, 只是, 對同一個物件或者定義, 往往有不同的觀點, 不同的觀點往往會造成不同的學派或者新的理論的出現. 例如, frequentist vs bayesian 的爭論, 不就是對同樣的東西有兩種觀點?

所以, 要如何去判斷何謂好的解釋? 對甲來說直覺的解釋, 對乙來說未必如此.

eaglefantasy 的建議是我覺得比較合理的. 應該也是一般學生比較能接受的方式.

所以現在想想,真正好的教材其實應該把要講的內容寫兩遍:第一遍怎麼直觀怎麼講,儘量用最少的數學讓大家明白研究的對象到底是什麼東西,要在頭腦中有一個直觀物理圖像,然後講的順序可以按照歷史上這些概念是怎麼提出來的來講;第二遍就上公理化系統 嚴格地列出這套理論的所有定義和公理,然後按照邏輯的先後順序推演出所有需要掌握的定理。

Ref.: Matrix67: My Blog » Blog Archive » 隨記:我們需要怎樣的數學教育?

Ref.: 對於教材寫法的一點考慮 | 宇宙的心弦

2011年4月15日 星期五

被語言制約的心靈

不,我不是在說 Wittgenstein 的理論。

thinker 寫了一篇很有趣的文章 心靈與程式碼的協奏曲. 也引發了我的一些想法. 不過我 coding 功力完全比不上 thinker. 以下只是我的一些個人感想而已.
假設問題是, function 接受一字串,裡面的每一行有兩個欄位,皆是整數。欄位以一個空白相隔。 function 必把每一行的兩個欄位的數字相乘,然後再將每一行的結果加總。

雖然 thinker 強調這種回推法或者Top-Down的設計方式的不同, 但是我倒覺得這並不是設計方法的不同而是工具的不同, 而且即使採用回推法, 如果之前的設計不好, 最後還是要回去修改原來的程式, 這跟傳統的做法沒有太大的差別. 以這個例子來說, thinker 一開始想到的是,
result = sum(value_of_lines)
但是這裡其實就是一個有趣的地方, 為什麼 values 會被存放在 list 裡面? 原因不就是因為 Python 大量的建議使用 list 作為基本的資料結構? 我基本上還是比較習慣一行一行往下寫的做法, 但是因為工具 (list comprehension) 的關係, 我想到的程式是
001 def mul_n_sum1(data):
002     bag=[ line.split() for line in data.strip().split('\n')]
003     result=0
004     for i in [ int(i[0])*int(i[1]) for i in bag]:
005                  result+=i
006     return result
和 thinker 的程式相去無幾了. 更精簡一點, 我可能寫成這樣.
001 def mul_n_sum2(data):
002     bag=[ line.split() for line in data.strip().split('\n')]
003     return sum([ int(i[0])*int(i[1]) for i in bag])
以我寫的程式來說, 兩種風格都有, 決定會用 for-loop 或者 list comprehension 基本上是依據
  1. 有沒有我已知的方便的函數
  2. Data 的大小
  3. for-loop 裡內容的複雜度
  4. 有沒有想把程式寫短一點的慾望
第一點是非常重要的. mul_n_sum1 的怪模樣就是因為我一時忘記了 sum() 的存在 XD 所以這個情況下如果我硬要寫短, 可能會寫成這樣 XD
001 def mul_n_sum3(data):
002     bag=[ line.split() for line in data.strip().split('\n')]
003     return reduce(lambda x,i: x+int(i[0])*int(i[1]),  bag,0)
第二和第三點當然也非常重要, 我處理的資料通常是幾GB的大小, 我不太會在這種情況下採用 list comprehension.

對我來說, 一般而言, 寫程式比較接近填空, 先搞清楚自己要做什麼事, 然後大概幻想一下流程 (如果之前寫過類似的程式,流程圖會很快出現), 然後把流程圖裡的方塊一個一個填進去並實作出來. 由於 Python 本來就想要加入 functional programming 的特色, 而且 list 又是對 Python 來說最自然的資料結構, 用 list 串起每個方塊是很自然的想法, 因此寫出類似的東西, 或者說有點 FP 風格的 code 並不奇怪.

當 thinker 一開始決定用
result = sum(value_of_lines)
來實作時, 其實已經限制了接下來的回推要怎麼做了. 如果今天是用C語言的話, 往上回推的寫法大概還是出現 function, recursive function, for-loop 幾種寫法吧. 因為自己實作 dynamic list/array 可能還比較麻煩XD 如果是要實作迴圈來加總, 其實又會碰到一樣的問題了.

我假設自己在C裡面用倒推法寫程式, 第一步是
result = sum(value_of_lines)
然後我們就要設計 value_of_lines 是怎麼來的, 如果是在 C 語言裡, 我直覺有兩種做法
value_of_lines=multiple_pairs(two_D_array)
或者
value_of_lines=multiple_two_vector(column_1,column_2)
可以想像, 這兩種函式不論怎麼寫, 大概都要用到 for-loop/recursive. 所以下一步,我們應該思考什麼? 如果不考慮細節, 這個時候我們要開始設計資料如何存入對應的資料結構. 如果是方法一, 大概就是如下
two_D_array=parse_data_line_by_line(data)
如果是方法二, 就比較麻煩了, 我們必須一次寫兩行,
column_1=parse_data_line_by_line_and_fetch_column(data,1)
column_2=parse_data_line_by_line_and_fetch_column(data,2)
或者多幾個步驟
struct_of_two_vector=parse_data_line_by_line(data)
column_1=struct_of_two_vector->column_1
column_2=struct_of_two_vector->column_2
顯然麻煩多了. 而且繼續寫之後會發現, 我們需要自定一些資料結構, 才能夠保存 array 的長度的資訊. 否則就得 "回頭" 去改函式的介面.

但通常我們不會選擇這條路徑. 因為在寫當下的程式之前, 我們已經稍微往前設想到資料的特性 --- data 被 parse 出來大概長怎樣.

如果用 Python 做這樣的動作, 產生的程式碼大概如下
001 def mul_n_sum(data):
002     txt_field_lines=[ line for line in data]
003     txt_field1 = [ int(line.strip('\n').split()[0]) for line in txt_field_lines]
004     txt_field2 = [ int(line.strip('\n').split()[1]) for line in txt_field_lines]
005     value_of_lines = [ txt_field1[i]*txt_field2[i] for i in xrange(len(txt_field1))]
006     result = sum(value_of_lines)
007     return result
雖然比之前的程式沒有複雜太多, 但是我寫起來可一點都不覺得順暢XD 而差異僅僅只是源自 "資料來自於兩個 lists 或者 一個 list"

當我們用 for-loop 寫程式時, 基本上我們要考慮到 pre-condition, loop-content, post-condition 的正確性. 因為 list 的強大, 所以在設計時可以很容易的 "遷就" 上一個流程方塊裡的內容, 所以很適合拿來做方塊之間傳遞資料的容器. 我是覺得, 這才是用"回推法"寫程式的有效益的主因.

附帶一提,原始命題也暗示了處理的方式,如果說原來的題目描述如下,或許讓人想要用兩個向量相乘的作法。

假設問題是, function 接受一文字檔,裡面有兩直行,每一直行代表一整數向量,欄位以一個空白相隔。 function 求出兩向量之內積。

Ref.: fcamel 技術隨手記: 用 Ruby 寫碼為例, 說明思考和寫程式同步的樂趣

2011年4月11日 星期一

Lie to Me

最近在看 Fox 的一套影集,Lie to Me。改編自美國心理學大師 Paul Ekman 的經歷,藉由分析被觀察者的肢體語言和微表情,進而向他們的客戶(包括FBI等美國執法機構或聯邦機構)提供被觀測者是否撒謊等分析報告。

除了故事還不錯之外,我查了一下 Paul Ekman 的資料,發現他真的開了一家顧問公司 Paul Ekman Group。
Currently, he is the Manager of the Paul Ekman Group, LLC (PEG), a small company that produces training devices relevant to emotional skills, and is initiating new research relevant to national security and law enforcement.
沒想到這種冷門的學問也可以賺大錢。Paul Ekman 原本是在研究表情和肢體是先天或後天的學術問題,沒想到後來跟測謊扯上關係,真是有趣,我想他也想不到吧。
Ekman showed that contrary to the belief of some anthropologists including Margaret Mead, facial expressions of emotion are not culturally determined, but universal across human cultures and thus biological in origin. Expressions he found to be universal included those indicating anger, disgust, fear, joy, sadness, and surprise. Findings on contempt are less clear, though there is at least some preliminary evidence that this emotion and its expression are universally recognized.

一流的生物資訊研究 II

前文

後來我跑去追問我的上司,他跟我說了他的理由 -- 乾淨的數學 model 之類的。老實說我並不太認同。套用 Richard Durbin 的觀點,所謂的生物資訊就是指所有管理和運用生物的訊息的軟體。

"I do not think all biological computing is bioinformatics, e.g. mathematical modelling is not bioinformatics, even when connected with biology-related problems. In my opinion, bioinformatics has to do with management and the subsequent use of biological information, particular genetic information."
然而並不是所有的生物訊息都能有乾淨的 model. 尤其是為了讓準確度一點一點的提昇,誓必需要更多的 empirical knowledge 和 heuristics。

我個人比較偏向 Alex Kasman 的定義。他認為與 mathematical biology 相較生物資訊或計算生物學比較傾向於去解決特定問題或研究特定的方法。
...seems to focus almost exclusively on specific algorithms that can be applied to large molecular biological data sets...
但是,mathematical biology 比較偏向從數理的方式上去瞭解或解釋生物現象。
...includes things of theoretical interest which are not necessarily algorithmic, not necessarily molecular in nature, and are not necessarily useful in analyzing collected data.
從我個人的觀察上來看,我上司比較不喜歡計算生物學這類的研究,他一直強調,生物是實證科學,研究就是要有實用性。(這點我想他是受他的指導教授影響)

批評一個研究的好壞,我想主要是讓同領域或同研究性質的人評價。做電腦網路的學者不見得能很好的評價做計算理論的學者。生物學家不見得能很好的評價生物資訊的學者。 (在生物學家心中,好的生物資訊學家可能比較偏向一個會開發軟體的 digital biologist。)

不過,一個很現實的問題是,生物資訊,相較於計算生物學或者生物數學,更偏重於軟體的產出,在這種情況下,使用者的意見變成很重要的評價標準之一。有些人批評生物意義不足,只是軟體而已;有些人批評軟體不完整不 user-friendly,為了論文開發而不是當作產品開發。這些都很有道理,但是也都只站在生物學家的角度過去批評這個領域。

以在資訊的領域,我想續聘標準應該是以資訊相關為參考吧,有多少系所可以讓教授像生物學家這樣慢慢磨出論文?而且出品的論文越多,他們要維護的軟體就越多,這個成本根本高到不可能做到。就算是 Sanger 和 Broad,我想也有很多軟體現在都乏人聞問吧,更何況像 Sanger 和 Broad 這麼有錢可以䀻專任程式設計師的單位有多少?以 MIT 的 Christopher Burge 這個大頭來說,他是生物學士和計算生物學博士,在生科系任教,他的網頁上列出的軟體大概有十來種,都有人 maintain 嗎?有些都已經是十幾年前的軟體了,另外,他在這二十年來,發表了七十篇論文,也就是說他不是純做軟體而已,如果有七十幾個軟體,他們要如何維護?

基本上我不是認為我上司的論點是錯的,但是我始終認為他太過注重生物學家的觀點。(沒辦法,他是生物學家) 再加上在他一流的生物機構受訓練,他所認為的標準也比別人高。但是即使是美國 Top-50 的大學,也不見得有做到他的標準所需要的資源。

Ref.: More on “What is a computational biologist?” (and related disciplines) | Code for Life

2011年4月9日 星期六

起聘

據說台灣某些地方,如果通過資格考後休學,也就是說,以博士候選人的身份休學,他們願意以博士級的薪資起聘。

或許是歪打正著,不能說明我當初的觀點是對的,但是至少結果是好的。

2011年4月8日 星期五

一流的生物資訊研究

上司跟我抱怨說, 因為資源和訓練, 他現在能做的都是二流的生物資訊.

我就問他, 你心目中的一流的生物資訊是什麼? 可以給個例子嗎?

他跟我說了一個軟體, 叫做 Eponine. Eponine 是在哺乳類動物的基因體上找出可能的轉錄起始點 (transcription start sites) 的軟體. 老實說我看不太出來這和其他的研究相比, 有什麼很特別的地方, 雖然發表在 Genome research 上是很好沒錯啦, 但是 Blat, MAQ 等等軟體也都是發表在 Genome research 上阿. 像是我常說的英國生資之星 Ewan Birney, 也是做了一堆工具, 像是 BioPerl 或者 HMMER toolkits, 這樣算是一流的生物資訊研究嗎?

實在無法了解.

2011年4月4日 星期一

地圖

Ref.: 我是地圖狂 - FT中文網
我會在網絡上搜尋奇怪的地圖——我自己不去畫——然後將它們分類、加以描述、並與其它地圖聯繫在一起。有一些分類更清楚明了,例如歷史、科技和政治;另外一些則非同尋常:愛情、性與幸福、生與死、真相與正義。其中一種叫寓言地圖。在19世紀,具有象徵意義的地圖十分流行,特別是在美國禁酒令時期。禁酒主義者會繪製道德地圖。這些地圖會描繪醉酒者之國,以及如何從那裡到達戒酒大陸。通往成功的道路穿越了沮喪之谷與拖延之山。
這篇文章的標題完全吸引住我的目光。

因為我也很喜歡地圖,尤其是古地圖,雖然還算不上是地圖狂,而且興趣也沒有廣泛到選票分佈圖之類的統計圖表。(下圖盜自北藍南綠? @ 地圖會說話)


對我來說,地圖有趣之處,在於他代表了一個時期的人看待這個世界的方式。(文末我附上了一個很好的例子)所以航海古地圖等讓我覺得特別有趣,我也喜歡架空世界的地圖,像是中土大陸的地圖。(下圖盜自 Patell and Waterman’s History of New York)


地圖,是一種非常浪漫的呈現模式,我也曾想過要做個手繪的世界地圖,來紀錄我的人生。也許有一天會做到.....。


































下圖就是我說的,代表了一個時期的人看待這個世界的方式的地圖。

1483384640123d