最近有一篇報導很紅,內容大概是說美國職場調查網站CareerCast.com公布2014年度最佳工作,數學家打敗所有職業,以去年年薪中值10萬1360美元(約新台幣)榮登今年榜首,2022年前就業成長預估達23%,前景看俏。最棒工作其次是大學教授、統計學家。

看到這則新聞,我想最高興的大概就是:大學數學系裡研究統計的教授吧,集最棒工作前三名於一身。

然而,別高興太早,在臺灣可能不是如此。不信把全國大學數學系統計相關領域的教授收集起來,其平均年薪可能比不上台X電一個中階主管。

真的阿,當你要念數學系,很多父母一定會告訴你:別傻了,在臺灣最紅的就是電機、資訊、生物工程等...這些明日之星產業,你去唸基礎科學,以後要找什麼工作阿?

數學、物理、化學,這些理學院的科系,似乎在臺灣漸漸活不下去。

2009年世界知名期刊《Nature》,有一篇Letter的論文發表,其研究內容提出了一個利用google query search的model去預測流感高峰。

Detecting influenza epidemics using search engine query data

這篇文章非常轟動,除了是因為發表在《Nature》之外,也證明資料分析確實有其可貴之處。

而利用這樣的概念去預測什麼時候會發生流感大流行,概念現在聽起來也非常make sense(合理)。(註: 當時2009年巨量資料尚未爆紅)

為什麼?舉例來說,家裡有小朋友生病了,父母可能會上網查去哪看醫生,要吃什麼感冒藥,要如何做好照顧等醫療保健相關字眼詢問Google大神。

而這項研究成果也顯示這個方法確實有其準確度,至少也比當時美國疾病管理局預估的還要準確。

然而,近幾年來,這準確度似乎消失了。最近一篇報導明顯指出用這方法的失敗。

Big Data Hubris? Where Google Flu Trends Went Wrong

巨量資料只是噱頭?神話即將破滅嗎?

筆者認為,不是模型方法失效,更不是巨量資料神話破滅。而是因為data更多,分析也將更為複雜。

─本文獲「幣圖誌」授權轉載