2010年3月17日 星期三

量化

Ref.: Evil Capitalism Heroes: 讀者來函---五力分析

Ref.: Evil Capitalism Heroes: 讀者來函---五力分析 (2)

Ref.: Evil Capitalism Heroes: 讀者來函---五力分析 (3)

Ref.: 量化研究典範的革命-結構方程模式概說 - 晨晰統計部落格(統計、問卷與SPSS的討論園地) - Yahoo!奇摩部落格

Ref.: 結構方程模式簡介 - 晨晰統計部落格(統計、問卷與SPSS的討論園地) - Yahoo!奇摩部落格

我之前去經濟系修了《歷史經濟學》。我忘記是高中還是大學時,我就已經讀過了劉老師譯的《制度變遷與經濟成就》和《經濟史的結構與變遷》,當時感到驚豔不已,所以後來才會專程跑去修課。劉瑞華老師的課非常精彩,比我期望的更好,不過,我卻沒有那麼感動了。

在歷史經濟學中,對同一個問題,常常有好幾種候選理論,都頗有道理,但是卻缺乏決定性的證據。老實說,根據他們的模型,雖然都頗有可能性,但是在模型的參數未明的情況下,結果是可能差距很大的。例如生產力的參數,可能就可以決定輪耕和休耕的合理解釋。

關於這點,我去請教過劉老師。但是劉老師似乎認為,這種兼容並蓄正是歷史的有趣之處我。

我認同在資訊不足,又無法做實驗的情況下,這些模擬非常難做;而且,量化研究也不代表沒有問題,甚至有更多東西可能被操弄。不過,我不太能接受這種兼容並蓄,我覺得努力去找答案的精神更加重要。

回過頭來,在我讀了上面的幾個鍊結之後,我還蠻驚訝的。一方面是自己對統計的無知,另一方面,其實我們計算機科學可能都還沒用到那麼複雜的統計方法。合理的原因,大概是計算機的實驗非常容易重複,所以沒必要這麼辛苦,跑半天模擬。不過這倒讓我想到傅斯年的『上窮碧落下黃泉,動手動腳找東西』。人文社會研究雖然被稱為軟科學,不過還是有很多值得尊敬的智慧和苦工,這是很多做理工的人無法想像的。

就我個人來說,我還是相信量化是有必要的,即使是在人文社會科學中也是一樣。這有點像是數學中的數值方法,雖然不是很被純數學家看得起,但還是一門意義重大的學問。對於生物資訊的研究者而言,這些統計的數學也應該多瞭解一點,才能夠更進一步利用計算機的力量去探索生命科學。

補注:剛剛發現,Structural equation modeling (SEM) 的發展,Herbert Simon 也有參一腳,我竟然不知道,真是該打屁股了。

2010年3月12日 星期五

心靈哲學 – 偽科學

Pyridine 最近寫了一系列的文章, 相當值得一看。

Ref.: 心靈哲學 – 偽科學 « Pyridine

Ref.: 心靈哲學 – 偽科學 (2) « Pyridine

Ref.: 心靈哲學 – 偽科學 (3) « Pyridine

Ref.: 心靈哲學 – 偽科學 (4) « Pyridine

Ref.: 心靈哲學 – 偽科學 (5) « Pyridine

Ref.: 心靈哲學 – 偽科學 (6) « Pyridine

Ref.: 心靈哲學 – 偽科學 (7) « Pyridine

Ref. : 心靈哲學 – 偽科學 (8) « Pyridine

Ref.: 心靈哲學 – 偽科學 (9) « Pyridine

Ref.: Wenn die Nacht am verschwiegensten ist - 哲學與其他學科的分野

關於哲學,我大體上是認同 Pyridine 的觀點。我雖然不認為哲學對科學進展有什麼幫助,但是也不見得是完全無意義。由於對科學有一份憧憬,所以我花過一些時間閱讀科學史和科學家傳記。其實很容易可以發現,科學本身並不是一門講究精確的學問。基本上除了數學之外,大概也沒有一門學問可以真的說是精確。

科學和歷史並沒有很大的差別,除了科學的研究對象可量化實驗之外。可量化這一點,雖然只是小小的差異,卻有巨大的差別。這也是我在修歷史經濟學時的一個感觸,理論是很有道理的,討論起來也很有這個可能性,但是由於無法量化,所以沒辦法進一步的驗證。

可証偽性當然也很重要。但對於自然科學或人文社會領域,差異並沒有這麼大。即使是歷史學也必須等到有新的證據,不論是歷史上或者科學上的新依據,才能討論論點對錯。否則,幾個不同的理論都有可能是正確的。舉個例來說,當初黑暗時代輪耕的爭論也是由於後來發現種植豆類後,會在土壤中留下氮,有助於下一次的麥類作物的成長,才證明了輪耕的好處到底是經濟上的還是政治性的。

這其實和科學研究也很像。受限於科學實驗的技術,我們總是會有一些無法証偽的猜測,或者說,局限於目前的技術而無法証偽的論證。The Big Bang theory 原本也是一個基於現象上的猜想而已,後來或許有用數學模型做些更深入的探討,不過如果不是等到三十幾年後宇宙微波背景輻射『意外』被偵測到,The Big Bang theory 某個層面上也不過是個無法証偽的猜想。可是那早期那幾篇研究論文,在當時會被視為偽科學嗎?我想不會。

數學一點的例子,Millennium Prize Problems 之一的 P vs. NP 問題, 到現在還是沒有人知道該怎麼證明,即使有過一些看起來很有希望的方向出現,但實際上,我們還是不知道該怎麼證明,甚至,不知道可不可以証。

而科學本身,就有不少人對方法論有質疑,同樣是諾貝爾獎級的物理學家,Weinberg 和 Gellman 的所支持的方法論就完全不同。Bayesian and Frequentist 的爭論也沒有停止過.

我認為哲學在思維方法的確有其獨到之處, 但是毫無疑問, 在對真實世界的理解上, 哲學已經退居外圍. 哲學討論有其樂趣和意義, 可是要以幫助科學或科學家自居, 我想非常困難. 我認為像是科學哲學之類的東西, 就像科學史或者 STS (Science and technology studies) 之類的研究一樣, 有其價值. 不過就像是知識論和認知科學的關係一樣, 很多知識論裡面的討論基本上都已經被認知科學涵蓋, 而且再也追不上了. 不過我還是覺得知識論在某種程度上是認知科學的先驅.

正如 Pyridine 所提到過的一樣, 幾乎所有的科學都有理論家, 當你真的很想了解這方面的知識時, 你就會去閱讀大量的相關資料, 你會想和其他的專家交流, 然後想了解是不是真的這樣, 最後, 或許哲學家有可能在科學上做出貢獻, 但那個時候, 或許他的身分也不再是哲學家了.

科學哲學之類的理論, 其實就是對 科學家這個群體有興趣, 如此而已. 我覺得不需要應貼上什麼對科學家有助益這種標籤. 這些探討本身有它的樂趣. 像我們現在常常用可不可以"証偽"做為一個科學理論是不是有意義的依據, 這也是始於卡爾波普, 或許科學家都或多或少知道這些原則, 但是有人整理之後, 在溝通和應用上會方便很多. 但是更大的貢獻是什麼就很難說了.

至於心靈哲學, 我是一點都沒有接觸, 只是單純不相信這些東西而已. 我讀過一些關於知識論的議題的論證, 我是覺得, 在當時技術沒有辦法做任何實驗的情況下, 這樣的論證和討論是合理的, 理論模型本身未必要和真實世界掛勾, 但是它必然要協助我們多了解某些事情. 我是不知道心靈哲學到底脫離現實到什麼程度, 但是做為一個嚴肅的學問, 我覺得沒有跟上最新的研究成果是不可原諒的.

****

其實我也可以舉一些計算機科學的例子, 但是後來 Pyridine 的第三篇文章出爐, 我覺得就沒有寫下去的意義了.

2010年3月11日 星期四

最光輝的失敗

Ref.: 小眾計算學 :: Charles P. Thacker 獲得 2009 年 Turing 獎

今年的 Turing Award 得主早就已經出來了, 得主是 Charles P. Thacker, 不過我一直沒有寫相關介紹, 只要是因為我對他不太了解, 對他的研究領域興趣也不大.

但是不管怎麼說, 他對資訊工程的貢獻都是很大而深遠的. 他的故事也很難讓人不遙想到 Xerox Palo Alto Research Center 當年的風光, 真的可以說是計算技術史上最光輝的失敗.

2010年3月8日 星期一

邊開火邊移動

Ref.: Joel on Software - 邊開火邊移動

這些年來,我一直嘗試要做好時間管理,我也用過 GTD 但是成效總不是很好。原因之一在於我是那種很容易『一時興起的人』,所以常常破壞自己的計畫。這也是我喜歡這篇文章的原因。
當你進入狀況後, 要繼續維持並不算太難. 我的一天通常都是這樣子的: (1) 上班 (2) 看信看網頁等等 (3) 決定應該吃過午飯後再做事 (4) 吃完午飯回來 (5) 看信看網頁等等 (6) 終於決心該開始幹活 (7) 看信看網頁等等 (8) 再度下定決心真的該開始做事 (9) 把該死的編輯器叫出來然後 (10) 不斷地寫程式直到突然發現已經下午7點半了.

第8步和第9步之間似乎有點問題, 因為我不是每次都能順利跨越鴻溝.bike trip對我來說, 要開始本身就是唯一的難題. 靜者恒靜. 我腦袋裡有些東西重得不得了, 很難很難加速, 不過一旦全速運轉就不必費心維持.
對我來說,時間管理是一件困難的事。即使是我最喜歡的閱讀活動也是一樣。要我拿起一本書其實是很困難的,但是通常一讀起來就會很快看完。
我也注意到由空中纏鬥到大規模的海軍演習, 幾乎所有軍事策略都是由邊開火邊移動的概念延生的. 我又花了15年才瞭解這也是在生活中成功的方法. 每天你都得前進一點點. 你的程式不好有錯還是沒人要, 這全都沒關係. 只要你一直進行, 持續的寫程式並修正錯誤, 時間就會站在你這邊. 當競爭者對你開火的時候要注意. 他們可能只是想逼你忙著應付, 讓你不能繼續前進.

2010年3月7日 星期日

Talapus Lake

今天和西雅圖認識的朋友們一起去 Hiking,去看 Talapus Lake and Olallie Lake。不過為了避免下山時天色太暗有危險,所以我們在往 Olallie Lake 的半路上就折返了,只看了 Talapus Lake。(如下圖,盜自此網站)


不過我要紀錄的不是在山上的旅程,而是山下的旅程。

晚上大約九點回到家後,我就一直在想,我哪裡不對勁了?對這樣的美景,我心中卻沒有太大感動。我常常說, 心中保持餘裕是很重要的, 我想我現在的狀況就是失了餘裕. 或許是時候改變了, 但我卻不知道要往哪個方向改變.

2010年3月5日 星期五

2010 Sloan Research Fellowships

Ref.: 2010 Sloan Research Fellowships

這個獎助金主要是資助年輕有潛力的科學家....網頁上是用學校分, 我是對領域比較有興趣....以下我整理出 CS 領域的得獎者. (Computer Science 果然是科學吧, 科科科.)

其實也可以看得出來, 對那些大頭來說, 比較熱門也比較有可能有突破的領域是什麼.

2010年3月4日 星期四

David Johnson has won the Knuth Prize

Ref.: AT&T Labs Researcher to Receive ACM SIGACT Knuth Prize for Algorithm Innovations — Association for Computing Machinery

David S. Johnson 獲頒 Knuth Prize. 恭喜!!! 不過好像相對來說沒有受到什麼注目. 上次頒給 Volker Strassen 時似乎還比較多人談到這件事. 或許是因為太理所當然了吧 :) 畢竟他一直是 TCS 界的大老, 他不僅是幾個學術組織領導人和期刊的編輯, 更建立了 SODA 這個研討會. 或許多寫什麼才是怪事 XD
The Donald E. Knuth Prize is a prize for outstanding contributions to the foundations of computer science, named after Donald E. Knuth.

他最有名的著作應該是 Computers and Intractability: A Guide to the Theory of NP-Completeness , 雖然現在來說已經過時了. (三十年前的作品你要怎樣) 但仍然是經典之作, 後來有很多書基本上都參考了他的編排方式, 像是 A compendium of NP optimization problems.

老實說, 我碩士班的時候還參考了不少這本書的內容. 即使在今天, 如果想要證一個問題是 NP-Hard, 這本書依然是最佳的參考書. 實際上, 這本書還是 CS 被引用最多次的書.

這本書影響到底有多深遠, 我想就不用我多說了, 這麼多年來, 只要提到這方面的研究, 都會想到 D. S. Johnson. 知名期刊 Journal of Algorithm (不過已經倒了) 從 1982 年起就邀請 D. S. Johnson 寫了好幾年的 NP-Completeness Columns. 到 2007 年, ACM Trans. Algorithms 還邀請他寫 The NP-Completeness Column.

他的另一個深遠的貢獻是, 發起了 experimental algorithm 這個領域, 從 The DIMACS Implementation Challenges 到推動 ACM Journal on Experimental Algorithmics. 雖然我不是很清楚證明了什麼定理或者發明了什麼雋永的演算法, 但是我想他的影響的確是深遠的.

Ref.: A Theoretician's Guide to the Experimental Analysis of Algorithms