大數據來自我們使用信用卡、行動電話或網路後留下的數字痕跡。小心正確地使用這些數據能給我們帶來前所未有的角度理解我們的社會,改善我們生活和工作的方式。但理論上有效,並不意味著在現實世界中管用,在現實世界中,複雜的人際互動未必總能把握,即便你使用最新的模型。大數據要求我們進行大規模實驗。

比如,我自己的實驗室正在建設基於Google地圖的一個網站,該網站使用這些數字,畫出貧困、嬰兒死亡率、犯罪率、GDP變化和其他社會指標地圖,並以社區為單位顯示,每日更新。這一新功能能讓訪問者了解(比如)某地的政府計劃是見效了還是失敗了。

但是,儘管這些令人矚目的「視覺化」工具能夠極大地增加透明度和公共知識,但在被用於解決社會問題時,它們的作用仍然非常有限。一個原因是如此豐富的數據流引起了不可靠的相關性。

即使使用常規科學方法也不再管用;在測量指標眾多和測量對象之間的潛在關係更多的情況下,我們的標準統計工具已無法產生有意義的結果。在不了解所有可能的替代方法的情況下,我們無法形成一個有限的、可檢驗的明確假說集。而如果我們能夠不再依賴實驗室實驗檢驗因果關係,就必須在真實世界中使用大量實時數據進行檢驗。這需要超越封閉的、以提問/回答為順序的典型的實驗室過程,提早並以比從前任何時候更頻繁地在社會中應用我們的思想。