2011年5月30日 星期一

Arsenic life

  • Ref.: Arsenic life – more criticism, formally published | Code for Life
    This was announced by NASA, teasing the announcement before the release of the paper as being relevant to life outside earth. (The connection being that, in principle, life might have a different chemical basis outside earth.)
    蠻有趣的科學研究,探討 DNA 化學組成,科學家發現有些細菌會用砷元素代替磷元素,來組成DNA。對我來說,這只是個有趣的科學新聞,暗示了我們對何謂生命的認知可能還不夠,過去我們認為不可能有生命的星球,可能還是有另一種形式的生命存在。

    不過很多人更重視的似乎是傳統科學社群和在網路上的科學社群對這件事的不同反應。

    Ref: Post publication peer review – a new way of doing science? | Code for Life
    Ref.: 【科學瞭望】網路改變了「做科學」的方法 « CASE PRESS
    不過,八篇評論之一的瑞德菲博士說,在這次的回覆中原作者還是以 「我們沒有錯」的態度來回答這麼多的質疑,這是「很糟糕的科學態度」。瑞德菲博士對《自然》的記者表示即將在部落格中繼續寫下她的想法。換句話說,這個科學事件,應該會繼續在網路上演下去。
    老實說,這些驗證工作是很麻煩的,你還要提供樣本給人家檢驗。如果不是很重要的發現,這真的很不划算。某個程度上我可以理解他們的心情啦。
  • 小記

    • Ref.: 氧氣(1,2,3) - 我愛談天你愛笑 - udn部落格
      有兩位化學家寫了一齣虛擬的舞台劇,描述有關「氧氣」是誰第一個發現的爭論,其中一部分是根據科學史上的記載,一部分是他們的創作,既風趣又發人深省,更沒有污衊別人的危險。這齣舞台劇的兩位作者是當代最有名的兩位化學大師翟若適(Carl Djerassi)和霍夫曼(Roald Hoffmann)。翟若適是美國史丹福大學化學系的教授,他因為口服避孕藥發明的貢獻獲得美國最高的國家科學獎,他在化學上研究的成果也讓他變得非常富有。他寫小說、戲劇、詩歌,也是一位藝術收藏家。霍夫曼是美國康乃爾大學化學系教授,1981年諾貝爾化學獎的得主。他也在電視台主持科普的節目,寫科普的書、散文和詩集。
      我很喜歡 Carl Djerassi 的作品. 這部看起來也很有趣. 劉前校長的介紹也漫有趣的. 基本上看到 Carl Djerassi 的作品, 我應該就會轉貼了XD
    • Ref.: 野心是對現狀的永不滿足 (1,2,3) -- 普通人的自由主義
      但李政道這樣的天才,對德曼的影響在於,讓他認清到天才和凡人的不同。他的太太是從哥大物理跳到生物學的博士,所以看過兩個領域專家的不同。她說,就算是最頂尖的生物學家,你也不會覺得和自己的距離很遠,但是物理學就是不一樣,天才的程度是分得出來的。
    • Ref.: 歐洲旅遊新熱點:下水道
      維也納並不是唯一一個將旅遊業往縱深方向拓展的城市。2007年﹐英國布里奇頓的一個本地商會投票將當地的下水道評選為“最佳遊覽地”。布里奇頓的下水道是一個展現了維多利亞時期工程和建築風格的鮮活的紀念館﹐其得票數超過了包括約克公爵影院(Duke of York's Picturehouse)在內的其他名勝古跡﹐後者是英國最古老的電影院之一。

      2007年﹐布魯塞爾翻新了該市的下水道博物館﹐從外部來看﹐它就像是一座希臘神廟。在這座博物館底下﹐遊客可以在無人陪伴的情況下獨自沿著一條氣味濃烈的泄水道漫步。
      西雅圖也有這樣的 tour,我覺得這類城市發展遺跡之旅還蠻有趣的。
    • Ref.: Leonard Susskind: My friend Richard Feynman | Video on TED.com

      Leonard Susskind 是知名理論物理學者,他在回憶分享一些關於費曼的往事。費曼迷就直接點進去看了吧XD
    • Ref.:Billion dollar babies of the human genome - The Scientist - Magazine of the Life Sciences
      The US government poured a total of $3.8 billion into the HPG between 1988 and 2003 -- an investment that has returned 10-fold just considering the $49 billion in taxes paid by genomics-enabled industries. In total, the genomics industry and the other industries it supports have generated $796 billion in economic output since the inception of the HGP -- a return on investment of 141 to 1. In other words, for every $1 of federal HGP funding, $141 have reentered in the economy.
      The project also generated 3.8 million job-years of employment (310,000 jobs in 2010 alone) and led to nearly $250 billion in personal income -- an average of $63,700 in personal income per job-year.
      完整報告在網路上可以下載。老實說我沒有下載來看。不過我對這個論文的說法是有懷疑的。我懷疑的不是數字,我懷疑的是把哪些東西算進去。舉個例來說,那個計畫雖然花了 $3.8 billion,但是,其他相關計畫呢?所有政府出的錢應該都要扣除吧?我是覺得這個報告可能有點虛。

    2011年5月29日 星期日

    75th Anniversary of Computer Science

    Ref.: Computational Complexity: 75 Years of Computer Science
    Ref.: Happy Anniversary To Turing’s Paper « Gödel’s Lost Letter and P=NP

    艾倫·圖靈, 計算機科學之父, 計算機之父, 在 1936 年 5 月 28 發表經典論文 On Computable Numbers, with an Application to the Entscheidungsproblem.

    圖靈在他的重要論文《論可計算數及其在判定問題上的應用》(On Computable Numbers, with an Application to the Entscheidungsproblem)(1936年5月28日提交)里,對哥德爾1931年在證明和計算的限制的結果作了重新論述,他用現在叫做圖靈機的簡單形式裝置代替了哥德爾的以通用算術為基礎的形式語言。由於速度很慢,儘管沒有一台圖靈機會有實際用途,圖靈還是證明了這樣的機器有能力解決任何可想像的數學難題,如果這些難題是用一種演算法來表達。現今,圖靈機還是計算理論研究的中心課題。他繼續證明了判定問題(Entscheidungsproblem)是沒有答案的。他的證明首先展示了圖靈機的停機問題(halting problem)是沒有答案的,這是說不可能用一個演算法來決定一台指定的圖靈機是否會停機。儘管他的證明比阿隆佐·邱奇在λ演算方面相等的證明晚發表了幾個月,圖靈的著作是更易於理解和直觀的。 他的通用(圖靈)機的概念也是新穎的。這一通用機能夠完成任何其他機器所能做的任務。這篇論文還介紹了可定義數的概念。

    沒必要多說什麼, 共襄盛舉就好.

    經驗機器論證

    Ref.: 經驗機器論證.哲學哲學雞蛋糕.
    提出經驗機器思想實驗的政治哲學家Robert Nozick認為,大部分人在仔細思量之後會拒絕。對於這樣的現象,他的解釋是,大多數人會這樣選,是因為當我們想要成就某些事、成為某種人,我們想要的是真的成就那些事、成為那些人,而不單單只是擁有相關的經驗,不管這些經驗多麼逼真。同時,Nozick認為,另一個選擇不進入經驗機器的理由,是因為我們不想要一個人造的人生。

    我認為經驗機器論證的核心就在於, 經驗和真實的差距. 它的效力的前提在於, 人不認為經驗等於真實. (附帶一題,在這個前提上, Turing Test 是沒有意義的.) 所以經驗機器論證無法直接對"價值"論證, 但他可以用來討論基於主觀經驗的價值.

    經驗機器論證可以拿來反駁快樂主義的主因是, 快樂基本上是主觀經驗. 同樣的, 功利主義也有類似的問題, 把全人類都被丟進一個良善的母體裡,是不是對全人類來說都是更幸福的事!?

    類似的, 我們可以設立一個神燈巨人論證 --- 某一天,你釋放了神燈巨人,他願意報答你, 讓你過你想要的人生, 只是願望開始實現的那一刻起, 你會忘記一切跟神燈巨人有關的事, 然後神燈巨人會離開這個世界, 回到M78星雲之類的, 總之你不用擔心有人又碰到神燈巨人, 破壞你的願望. 所以你可以許簡單的願望, 像是成為鉅富, 或者拿諾貝爾獎, 也可以許複雜的願望, 把自己想要的人生劇本交給神燈巨人.

    這個論證基本上很簡單, 他和經驗機器論證極類似的, 但是神燈巨人論證給你的體驗是以真實的世界為基礎. 那麼, 你會如何選擇!?



    我不知道 Robert Nozick 是否真的做過調查, 還是跟我一樣只是猜測. 我個人認為, 大部分的人對會對神燈巨人許下物質體驗的願望, 而不是心靈體驗的願望. 簡單地說, 我認為, 人很可能會選擇成為總統, 富豪, 帥哥美女, 或者擁有後宮之類的願望, 但是不會選擇某某人真心愛上自己之類的願望.

    這之間的差異不是真實和經驗. 真實和經驗不是兩個適合比較的辭彙. 我認為用 可經驗/體驗不可經驗/體驗 會是比較好的區分方式.

    即使不用學習哲學, 我們在現實生活中也早已學到, 你看到的東西不見的是真的.

    我們都看過魔術; 我們都聽過甚至體驗過朋友的背叛; 嘴巴上說愛你, 表現得很愛你的人, 也許只是愛你的財富或美貌. 在現實生活中, 每一個人都知道, 有一些東西是可以去經驗的. 但是有一些東西不行. 但這些東西的可貴之處, 就在於其不可體驗之處 (例如真愛). 即使神燈巨人有能力改變人的自由意志, 有多少人會認為這個東西有意義!?

    這種體驗論證, 其實是在問你, 關於體驗 --- 絕對是假的可能是假的 你會選哪一個? 或許進入那個世界或者機器之後, 你區分不出來, 但是在選擇的當下, 這個問題其實是要求你暴露的你價值判斷!!!

    人生的價值就在追尋意義, 只是意義的投射對象人人不同. 有些人追求功成名就, 有些人追尋真愛, 有些人致力於創造宇宙繼起之生命. 但是這個意義或多或少都綁在自己主觀意識之外的東西.

    我不知道在哪裡看過愛因斯坦說過這樣一句話, 雖然我不知道是否是假托. 但是我覺得很適合拿來做這篇文章的結尾.
    我不認識任何一個真正的唯心論者

    2011年5月23日 星期一

    理想性?

    最近有點鬱悶.....想要藉由書寫的方法釐清自己的想法.

    來到生醫研究機構來學習一年多, 看了一些現象, 也學了很多東西. 當然也有很多不適應的地方, 尤其是研究方式和文化.

    當學術界是某些領域的高等教育的唯一出路,再加上這十幾年來的高教膨脹,學術研究這兩字的招牌自然要退色。很多人在怪罪的 impact factor 量化研究成果造成歪風,但是真正的原因難道不是因為高教膨脹?競爭激烈,領域分劃細微,研究期刊爆增,人力根本很難去評估好壞了;再加上競爭者越多越容易在意公不公平的問題。以成為大師為職志的學者可能不在乎這種微支末節,但是一般的學術公務員可在乎得緊。 impact factor 只是應運而生而已。



    在四五年前,我考慮是否要念博班時,曾經很苦惱思索。

    除了出路好壞這些問題,我也很在意自己會怎麼做研究 -- 安逸地在大學裡教書,做些可有可無的研究。這不是我心中對學術的景象。

    但是我後來還是選擇唸了博士班。

    基於很多理由,包括資質限制,我不敢期望自己在理論領域有好的表現,我所期待的研究形式,是更接近應用科學的。所以我希望走比較應用的那種領域。我當年決定念博班時給自己的期望,是希望能到業界上班,希望不要喪失拼鬥精神,希望能找到那種能夠讓我的訓練有用武之地的應用領域。所以我左思右想,寫了一份自認有機會應用到業界的理論 proposal 去申請博士班。

    就算無法成為 Maxwell,無法成為 Hertz,是不是有機會成為 Heaviside? (其實 O. Heaviside 也是大師級人物!我這樣寫其實是很不要臉的)

    Ref.:【科技歷史】瞧 ! 馬克斯威爾來了 « CASE PRESS
    總而言之,拿〈論物理力線〉作為物理科學絕對純粹性的一項例證,並不恰當。馬克斯威爾的方程式直到發表後二十五年,才被表達成今日最熟悉的形式。最有名的那四條電磁力和電磁通量方程式,它們簡潔又經濟的表達式,得歸功於卓越的倫敦電信技師希維賽德(Oliver Heaviside)。他一八八五年將這些表達式發表在讀者為電子工程師和商人的商業期刊《電子技師》(Electrician)之上。

    身為一八六○年代海底電纜計畫的老兵,希維賽德亟需數學工具來控制能量傳遞,以避免訊號扭曲或遺失。這位孤獨的電信技師並不知道,一位年輕的德國物理學家赫茲(Heinrich Hertz),在同時也建立了這套簡化的場方程表達式。即使是涉及這些表達式最令人熟悉,也明顯是最抽象、最數學形式的部份,現實的問題依然幫助完成了這些漂亮的數學式子。在一八八五年之後的一段時間,它們被稱作赫茲—希維賽德方程式,而非馬克斯威爾方程式。

    但是很多因緣巧合.......,後來改做生物資訊。我會覺得,資料分析是一門很重要的學問,所以也打算好好學習。簡簡單單跑一些數據出來是很容易,但是要做到能夠乾淨清楚,就非常困難了。經濟分析就是一個很好的例子。

    但是我不想花太多精神做服務生物學家的工具,在電腦時代,每一個上班族都會用 WORD 和 EXCEL,因為這是工作需要,為什麼生物學家可以例外?如果需要去用那些複雜的軟體,他們就該去學,如果要用好用的軟體,他們就該聘專人來優化,而不是浪費另一個領域的學術資源來為他們服務。

    服務性的網站不是不能做,像 miRBase 和 Pfam 都很重要,問題是,誰來 Host 這個東西!?我個人認為,生物學家應該學習其他領域,很多物理學家要跑數值分析,他們可以去學 matlab, mathematica, 或者 fortran, 生物學家又不比人笨,為啥就不能去學? NCBI SRA 都必須要結束,UCSC Genome browser 似乎也沒有過去那種活力了。這些 user friendly 最後總會撐不住的。這些人應該要跟計算生物學家和生物統計學家合作,並且也該學習如何使用這些軟體。 我想不只我一個人這麼認為 (A,B)

    如果將來有機會管一個部門,用生物學家的錢,像是 Broad 或者 DNASTAR 這樣,開發容易使用的軟體倒是沒啥不好。但是耗用生物資訊學門/生物科技學門/計算生物學門的經費來做這種 UI 改善的工具,我到是不以為然。相同的觀點,也可應用到其他領域,我們應該讓下一代的年輕工程師將心力浪費在這些東西上面嗎?(如果是在 facebook,有物質上的回報也就算了。)

    This Tech Bubble Is Different - BusinessWeek
    After a couple years at Facebook, Hammerbacher grew restless. He figured that much of the groundbreaking computer science had been done. Something else gnawed at him. Hammerbacher looked around Silicon Valley at companies like his own, Google (GOOG), and Twitter, and saw his peers wasting their talents. "The best minds of my generation are thinking about how to make people click ads," he says. "That sucks."
    網路上可以找到中文翻譯,如下:
    但是在Facebook呆了幾年以後,Hammerbacher開始感覺不自在了。他覺得許多重大的計算機科學創新和突破很早之前就已經完成了。他也仔細的思考了一下周圍的這些公司包括Facebook,Google和Twitter等,看著自己和同學在為這些公司賣命,他不禁開始覺得:「我們這一代最聰明的人竟然都在這裡思考著怎樣讓人們去大量的點擊廣告,真衰。」


    這樣的態度是太過理想性嗎?

    或許吧。但是就像我女朋友鼓勵我的 --- 『人沒有理想要怎麼活?』

    我出生於商人家庭,我祖父白手起家,到了我爸那代,他沒分到什麼資源,也是白手起家。我在他們身上學到的,就是要往上爬要靠自己。我祖父我老爸雖然不是什麼有道德的人,但是他是那種有錢不一定願意賺的人,尤其是那種上位者用權勢變出來的 case,他是不接的。他們寧願在商場上硬碰硬,或者用勞力賺錢。這是我佩服的。

    附帶一提,我女友跟我說 --- 她和我一起撿垃圾總是活得下來。

    雖然誇張了一點,但是讓我很感動倒是真的。

    2011年5月22日 星期日

    Energy drink

    Joel Spolsky 曾經在他的一篇文章中提到 Jolt Cola, 它被歸類為是一種 Energy drink


    據說頗受 hacker 們歡迎, 也在很多 hacker 電影中出現過
    Jolt Cola was featured in Steven Spielberg's film Jurassic Park in a scene which shows computer programmer Dennis Nedry's work station covered with Jolt Cola cans & bottles. It was also shown in several scenes in the film Hackers; in one scene, the characters Razor and Blade refer to it as, "Jolt Cola: The soft drink of the elite hacker."

    Energy drink 應該比較接近台灣的老虎牙子之類的東西! 保力達B 那類的飲料不太像, 雖然美國也有這種東西, 像是 5-Hour Energy.

    Wiki 上有很多 Energy drink 品牌, 我在西雅圖比較常看到的是 Monster, Rockstar, AMP Energy, 和 Red Bull 品牌. 至於 Jolt 目前無緣得見. 不過我喝過其他幾個牌子, AMP Energy 味道很正常, 有點像是比較不酸的奧利多mini-Oligo, 沒什麼特別的, 至於 Monster 味道有點奇怪. Rockstar 跟汽水好像沒啥兩樣。

    根據 Caffeine Content of Drinks, Monster 每 100cc 含 10.0 mg 的咖啡因, Rockstar 每 100cc 含 10.0 mg 的咖啡因, AMP Energy 每 100cc 含 8.9 mg 的咖啡因, Red Bull 每 100cc 含 9.5 mg 的咖啡因, Jolt Cola 每 100cc 含 11.9 mg 的咖啡因!

    有趣的是, 看他們的官方網站, 這些能量飲料似乎主打高集中力而非高體力消耗的運動, 像是滑雪和賽車.

    但是 Jolt Cola 好像是走奇怪的路線. 有興趣的可以看一下他的廣告影片.

    附帶一題, 有一個有趣的網站, 專門討論 Energy drink -- Energy Fiend - Obsessed With Caffeine

    Algorithms In The Field (8F)

    Ref.:Algorithms In The Field (8F)

    這是前幾天在 DIMACS, NJ 舉辦的研討會, Algorithms In The Field, 縮寫是 8F, 因為 A-I-T F 唸成 8F. 科科. 我是沒有機會參加, 不過 D. Eppstein 倒是寫了兩篇 posts 介紹 (1,2,3).

    一開始我覺得還漫可惜的, 怎麼沒有生物資訊相關的主題. 不過看了 David Eppstein 的文章, 才知道其實還是有的.
    John Doyle: "We have theories, but they're fragmented, incoherent, and incomplete." We have problems that have arisen from the solution to other problems (autoimmune diseases from an immune system that responds well to infectious diseases) and the need for those solutions is now less strong than it was when they evolved. From which he concludes that we should go back to having more infectious diseases in order to better control our autoimmune diseases. Or at least that's what I got from his talk. Also: you have ten times as many signals going from your brain to your eyes than vice versa. The way our eyes work is that the brain sends a fat pipe of predictions out to the eyes and gets back a much narrower pipe of differences from the predictions. That's why we dream so vividly. Also also: DNS is a mistake, because it breaks the layering structure of the internet by allowing the top application layer to gain access to a much lower addressing layer.
    不過內容似乎是偏向 complex systems, 或者說是 systems biology.

    2011年5月20日 星期五

    小記

    • 2011 年 Gödel Prize 頒給了 Johan T. Håstad 的論文,
      Some optimal inapproximability results, Journal of the ACM, 48: 798--859, 2001.

    • Michael Mitzenmacher 又回來寫 blog 了! 太好了 :-)

    • Brief communication: DNA from early Holocene American dog - Tito - 2011 - American Journal of Physical Anthropology

      在人類糞便的化石裡發現了一塊動物骨頭, 經過 DNA 定序, 發現是狗骨頭! 推論出人類吃狗肉的歷史! 而且是美洲! 科科, 以後爭論時可以拿來用, 有空應該找來看一看.
    • Hack, Everything! » Mr. Jamie 看網路與創投
      In modern computing terminology, a kludge (or often a "hack") is a solution to a problem, doing a task, or fixing a system (whether hardware or software) that is inefficient, inelegant, or even unfathomable, but which nevertheless (more or less) works. To kludge around something is to avoid a bug or some difficult condition by building a kludge, perhaps relying on properties of the bug itself to assure proper operation.
      我喜歡這個說法!
    • Ref.: 狗日的開源軟件許可證 | 酷殼 - CoolShell.cn

      以後可能會用到

    • Ref.: EnTech Taiwan | Utilities | iRotate

      最近發現辦公室這台 UltraSharp 1905FP 可以將畫面轉成直立, 所以就玩一下, coding 起來感覺還不錯!

      irotate
    • 最近的流行話題之一, 是Fabrice Bellard 作了一個 Javascript PC Emulator, 真是太炫了!!! 雖然理論上應該是可以, 不過要做得出來也是不容易!!! Geek Rules !!!

    2011年5月19日 星期四

    一流的生物資訊研究 IV

    前幾篇我都是在站資訊科學的角度談我的想法. 這一篇我想談一下關於生物學家怎麼看生物資訊. (請不要和計算生物混為一談)

    Nature Milestones in DNA 可以看到, 1990 年代, BLAST 的發明是比較基因體學的發展的關鍵. 2002,2003,2004, 更是生物資訊的黃金時期.

    雖然這些發展對資訊科學家來說不見得很熟悉, 或者說覺得很了不起, 但是隨著國家對生醫相關領域的補助開始提高, 台灣也漸漸越來越多資工系教授投入這個領域. 當然, 其中也不少對生物沒有興趣, 只是想賺點 paper 和國科會經費的研究人員. 這也是常常被生物學家批評的一點 -- 資工人做的東西沒有考慮到生物學家的需求, 盡做一些沒有用的東西.

    但是, 就我個人注意到的(個人偏頗地觀察), 很多論文其實都有掛, 一兩個非資工的學者的名字, 甚至很多是生化, 生醫相關的教授. 但是這些有多有用? 我倒不以為然. 很多其實也是騙騙論文而已. 我想對某些生物學家來說, 這個研究只是大計畫下的 side project, 她們不見得會做到很細, 有時候只是當下滿意就好. 當然也是有例外, 像是 Broad Institute 就開發了很多軟體, 但是那也是為了滿足自己的需要. 而且她們有聘專業的資深工程師來協助開發和維護!

    這其實是很有趣的. 同樣一篇生資論文, 生物學家在生物方面就會特別重視, 所以會強調生物方面的意義, 但是資科學者就會強調在技術上的創新, 也就是說, 兩方預設的讀者並不相同. 在論文寫作上的也有差異, 例如生物學家就偏向舉例, 盡可能不要批評, 但是資科學者就會偏向提出數據來說明做得比較好, 例如速度和準確度之類. 資科學者在圖表上面就沒那麼重視, 但是生物學家常常就會想辦法畫出精美的圖表, 而這也常常跟介面有關, 生物學家相對來說就比較注重使用者介面.

    這倒不是對或不對的問題, 好的使用者介面非常重要, 這個我們從消費性電子的市場就知道了. 但是, 這應該交給專家來做, 而不是叫一些碩士班學生或者博士班學生花精神在改善這些地方. 像是 Broad Institute 這樣請職業程式設計師來做是很棒的. 但是叫學生來做這些東西, 某個程度上, 是一種資源的錯置.

    我認為像 Genome Research 或者 Nature Method 這種生物為本, 偶而刊載一些生資文章的發表模式是比較健康的. Nucleic Acids Research 的 web server issue 或者 database issue 的做法也不錯. 我覺得在 Bioinformatics 之類的期刊上, 不應該刊登整合性資料庫的文章, 畢竟生物學家很少會看這種期刊, 而這種資料庫對資訊科學來說相對沒有學術價值.

    就像之前提到的 Nature 有個 The Future of the PhD 裡面就提到, 不論是博士氾濫, 不只是台灣的問題, 美國, 英國, 日本, 中國都是這樣. 尤其是生醫相關領域, 增長數字更是驚人. 這些新科博士, 真的有那麼多需求嗎? 還是只是為了滿足需索無度的教育系統!? 這我沒有資格置評. 但是如果這個增長真的是病態的, 我不希望從資訊領域跳過來的學生是這個系統下的犧牲品.

    好用的使用者介面, 漂亮直覺的畫面呈現, 還有整合性的資料庫, 這些當然對生物學家來說都很有幫助. 但是, 對資訊背景的學生有什麼幫助呢? 她們實作這些東西可以學到什麼? 這些東西某個程度上不該是由大型學術計畫去聘程式設計師開發維護的嗎? 還是她們被當作廉價的人力? 如果是開發真正有用的軟體, 例如到 Ensembl, UCSC, 或者 Broad Institute 去做研究或者當工讀生, 或者對生物學有很強烈的熱情也就算了, 但是如果只是為了發表論文而將才智和時間浪費在這些無謂的軟體上. 我覺得實在有點可憐. 我覺得她們的才智可以花在別的地方. 我不知道生物學界有沒有類似的生態. 但是在資訊工程, 一些 hacker, 像是 R. Stallman, T. Linus 都有很高的地位, 但是他們不見得是博士, 也不見得呆在學術界, 但是她們的確推動了技術的成長.

    做什麼不是重點, 重點是真的喜歡, 或者你覺得自己做的東西有意義, 而不是為了發論文而發表的東西而已. 一個真的用心想要投入生物資訊研究, 應該是願意花錢去做資料蒐集和驗證的學者, 而不是僅僅把這個東西當作是 side project 的學者, 或者換一個角度來說, 是否對生物研究和和對生資研究有同樣的嚴謹態度? 同樣看重? 這種要求很容易陷入僵局, 因為對另一個領域的了解有限, 往往對品質無法作正確的評判 --- 過高或過低. 這是跨領域合作的難處. 我也相信所以跨領域合作不該是兩(多)個團隊短期的相遇, 而該是長期的相處.

    如果生物學家覺得生物資訊沒啥用處, 這也okay, 那就請那些生物學家不要來玩這個東西, 乖乖當 end user. 如果生物學家覺得生物資訊很有用, 但是對這個東西沒有研究興趣, 請給這個領域的學者一定的尊敬, 當個虛心的 active user. 如果生物學家覺得生物資訊很有用, 也想一起合作開發一些有用的東西, 也請尊重對方的研究興趣, 對資訊學者來說有學術意義的東西, 不見得對生物學家有意義, 但是這就是合作要互相禮讓的部分. 資訊學者花很多時間改進模型或者演算法, 或許對生物學家來說不是那麼重要, 但是這是學術合作, 不是商業合作, 不是片面由消費者覺得一個東西的價值. 生物學家很容易忘記這一點.

    2011年5月18日 星期三

    產學之間

    Matt Welsh 是 Google 的 senior software engineer, 但是之前是哈佛資工的教授XD

    他跳槽到 Google 之後, 對產學研究環境和研發模式似乎很有興趣, 常常在他的 Blog 上討論. 例如 The death of Intel Labs and what it means for industrial research

    前幾天他又寫了一篇 How can academics do research on cloud computing?
    John Wilkes made the point that that he never wanted to see another paper submission showing a 10% performance improvement in Hadoop, and he's right -- this is not the right problem for academics to be working on. Not because 10% improvement is not useful, or that Hadoop is a bad platform, but because those kinds of problems are already being solved by industry.
    之前在和韓老師合作時, 就 survey 過相關的問題. 要研究所謂的 cloud computing 或者 distributed data center 所需要投資的基礎建設實在很大. 對台灣的學校來說根本是不可能的. 除了 Scale 過大以外, 就算聯合建立起這樣的系統, 又如何有效的共用這個系統? 做一些理論性的探討, 在這樣的領域有多大的意義? 畢竟架構和解決方案都在快速的演進中....今年討論的模型明年可能就不適用了....

    2011年5月11日 星期三

    小記

    • Ref.: 第一期 5年500億 頂尖論文只多2篇|生活萬象|中時樂活|中時電子報
      五年五百億計畫成果如何?依教育部資料,九十四年國內十五所頂尖大學發表在一流期刊《自然》、《科學》的論文共十五篇;領了大筆計畫經費後,九十九年發表在這兩種刊物的論文是十七篇。若只從這個指標衡量,五年五百億計畫成果是:只多兩篇。
      看看這些論文, 只要 sequence 一些鬼東西就可以上 N/S/PNAS 期刊. 台灣花個兩千萬 sequence 台灣黑熊和櫻花鉤吻鮭, 大概就有兩篇了吧. 投資報酬率是 500/0.2 = 2500 倍XD
    • Ref.: 11011110: New academicians

      James Demmel, Jon Kleinberg and Leslie Lamport 當選了 National Academy of Sciences 的院士! 恭喜恭喜. 前一位我不太熟悉, 後兩位倒是大名鼎鼎.
    • 期刊 PLoS Computational Biology 打算推出一系列的專欄文章, The Roots of Bioinformatics. 藉由了解一個領域的過去發展, 或許我們可以去掌握未來該領域的走向. 當然, 科學史不是這個期刊的目的, 所以他們不是要請歷史學家來爬梳, 而是從過去資深的從業人員的視角, 來回顧整個發展史. 目前已經刊出了三篇, 有興趣的人可以追蹤一下.
    • Ref.: 拉普拉斯,費雪以及充分統計量的發現, 黃文濤, 原載於數學傳播第三卷第三期

      我在學習充分統計量的觀念時, 發現這篇文章. 很有趣的文章, 雖然 Fisher 貴為二十世紀最偉大的統計學家之一, 但是他有不少工作其實都是重複和拉普拉斯和高斯等前人重複, 讓我們不禁感嘆, 這些大師有多偉大!

    2011年5月8日 星期日

    Country/Nation/State

    Ref.: 台灣是什麼國家?Country? Nation? State? - 歸人的網誌 - udn部落格
    英文中所謂「國家」,有好幾個不同的字:Country 偏重地理涵義,Nation 強調的是民族,而State指的是政權。Nationality相對於 Nation,指的是「哪裡人」的人;Citizenship相對於State,才是在「哪個政權」有投票權的人。

    很久以前聽說這三個字有點差異, 但是搞不太清楚. 所以查了一下. 似乎是有點差異. 但是不太具體, 這種些微的差異可能對非以英文為母語的人來說可能很難掌握.

    根據牛津大字典 OED
    Nation
    a large aggregate of people united by common descent, history, culture, or language, inhabiting a particular country or territory
    Country
    a nation with its own government, occupying a particular territory
    State
    a nation or territory considered as an organized political community under one government

    根據維基百科
    A country is a geographical region. A country may be the territory of a sovereign state, the territory of a non-sovereign (or formerly sovereign) political division, or a region associated with a certain people or certain characteristics.
    A nation is a group of people who share culture, ethnicity, language and/or territory.
    State commonly refers to either the present condition of a system or entity, or to a governed entity or sub-entity, such as a nation or province.
    Ref.: Country, State, Nation - Definition of Country, State, and Nation
    Ref.: State, Country, and Nation The criteria that define a country, an independent State, and a nation

    2011年5月7日 星期六

    一流的生物資訊研究 III

    Ref.: Katharine Miller: "Bringing the Fruits of Computation to Bear on Human Health: It's a Tough Job But the NIH Has to Do It", Published by Simbios, the NIH National Center for Physics-Based Simulation of Biological Structures

    前文

    西元兩千年時, NIH Biomedical Information Science and Technology Initiative Consortium 提出了對生物資訊和計算生物學的定義
    Bioinformatics: Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data, including those to acquire, store, organize, archive, analyze, or visualize such data.
    Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.
    在台灣資工界, 我的認知裡, 計算生物學被大家視為是一個研究演算法的領域 -- 只是問題來自生物科學. 就像是做 Network algorithm 一樣, 資訊科學家還是在研究演算法, 只是問題來自 computer networks.

    不過我個人認為這樣的觀點不是那麼適合.

    Computational 是用來修飾 biologist 的形容詞, 所以這些人應該以 biologist 自居! 他們可能會發展統計方法, 演算法, 或者模擬方法, 但是問題的核心應該是在生物上面, 而不是 computational methods. 也就是說, 他們應該在意的生物意義. 就像 Molecular biologist 是分子生物學家, 他們在意的是生物問題, 而不是物理或化學. 他們的工具是分子相關的技術, 而他們是為了更了解生物的奧秘而去發展新的分生技術.

    在這個層面上, 我同意 Grant Jacobs 的論點, 計算生物學家應該要有更多的生物知識, 而且應該和生物學家有更多合作.
    By contrast, computational biology is primarily founded on theoretical science; computer science is a toolkit used to implement the theoretical concepts in a practical way. Computational biologists tend to be specialists, as they tap into specialist biological knowledge that take time to build up.
    李文雄教授在 Phylogenetics 方面的研究和 Hamid Bolouri 在 simulating genetic regulatory networks 上的研究應該算是好例子.

    但是, 讓我覺得不太舒服的是一種廣為流傳的態度 -- 生物資訊的存在就是為了幫助生物學家. Grant Jacobs 就提到
    At a recent bioinformatics meeting I attended, a senior experimental biologist from overseas commented to the effect that it was hard for bioinformatics researchers to build their own careers, to publish their own papers. My take on his comment was that he was referring to the tendency of experimental research to treat the bioinformatics as a service, seconding the work or linking to service centres, rather than treating bioinformatics researchers as collaborators, stand-alone groups in their own right.
    老實說, 我不太明白為什麼這些生物學家自認為高人一等? CS 的就業市場和薪資都比生物學家高多了, 資訊科學家實在不需要紆尊降貴來服務生物學家.

    不論是計算生物學或者生物資訊, 我相信他們的主要目的是 "輔助生物學研究", 而不是 "輔助生物學家". 這兩者不是等價的. 就像當年在 Niels Bohr and Erwin Schrödinger 鼓吹之下, 許多新一代的物理學家和化學家紛紛投入生物的領域, 難道他們是幫生物學家開發實驗技術而已嗎? (實際上, Alan Turing 和 Claude Shannon 都研究過生物學, 不過我不知道他們的動機是什麼XD 不過有興趣的人可以去讀一讀 Searls 的 The Roots of Bioinformatics)

    老實說, 被視為是 service 而不是 reinforcement 這點讓我覺得不太舒服! 每一個領域的學者都有他們自己的研究興趣. 雖然我不認同逐 funding 而居的研究態度 -- 藉由生物資訊的名字去申請生物科技的 funding 來做與生物關聯性很低的研究. 但是跨領域"合作"是需要互相尊重的! service 這個觀點我不是太能接受.