限時免費

大數據,比高明的騙子更會說謊

商周集團執行長郭奕伶

商周集團執行長郭奕伶。(來源.本刊資料)

「讓我們陷入困境的,不是無知,而是看似正確的謬斷,」馬克.吐溫說。

越來越多自稱「數據科學家」的人出現,越來越多老闆深信大數據將讓企業挖到金礦,越來越多員工抱怨「公司數據不全,所以我沒法……。」

數據恐慌症蔓延,彷彿,沒有數據,就活不下去;而有了數據,便雞犬升天。

然而,Spotify前首席經濟學家Will Page示警:「除非我們正確了解數據,否則數據可能會說出比高明罪犯更有說服力的謊言。」

他舉了一個例子:Spotify的「每週新發現」播放清單。

每週一早上, Spotify會巧妙過濾音樂,將最熱門、但你沒聽過的三十首歌曲送到你手上,這是專屬你的播放清單。這個功能一推出,很快讓四千萬用戶埋單,創造歷史紀錄。

令人好奇的是,這功能推出前,並沒有大力行銷,相較其他用力造勢卻乏人問津的播放清單(譬如「週五好心情」),為什麼唯獨「每週新發現」能大放異彩?

整整六個月,數據科學家們傾全力研究,「我們監控、測量並測試每個播放清單的可量化指標,但還是卡住了。」

直到一位專家給了當頭棒喝:不要再查看數據了,去審視那些測量不到的事物。

原來答案就在眼前,就只因為「每週新發現」的推送時間在週一。這是「新起點效應」(Fresh Start effect),每週、每個月或每學期的開始,當人們進入心理上的新會計週期,傾向做出具企圖心的行為,所以「每週新發現」自然容易被人們使用,「解答並不存在從數百萬用戶中隨機抽取、測試所產生的大數據裡。」

當高學歷的資料科學家失去了基本常識、對人的好奇心、對事的想像力,而陷入「量化謬誤」時,他們將只看到自己願意相信的事,這時,真正的線索便悄悄的溜走了,這是「數據之障」。就像在佛學上的「所知障」,人們常被自己的知識、學問所蒙蔽,而失去真相。

數據,是企業數位轉型時的眼睛,它能驅動商業模式的創新、產銷流程的重構,但若誤用或濫用,它不僅無效,更將帶來負作用。譬如早期行銷學的「啤酒與尿布」、「巧克力與諾貝爾獎」等研究,後來都被證實是偽因果的數據分析。

層出不窮的統計謬誤提醒我們,數據分析,必須植基於對商業邏輯的理解、對用戶的洞察,否則,數據只是用統計學包裝出來的偽事實。

太多例子告訴我,有數據,不一定有真相。一個昧於商業本質、遠離現場的數據分析師,他帶來的很可能是誤判;一個妄想讓數據成為萬靈丹、卻始終未與用戶站在一起的工作者,更是天真而無知。

唯有鍥而不捨理解客戶痛點的那一顆心,才能讓數據成為飛上雲端的天使之翼。

本文完
免費訂閱!
商周最新出刊報‧隨時掌握最新趨勢