啟動成功關鍵,隨時掌握商周.com最新資訊
提供第一手新聞解析、財經趨勢、專屬活動
啟動成功關鍵,隨時掌握商周.com最新資訊
提供第一手新聞解析、財經趨勢、專屬活動
本文獲有物報告授權刊登,原文出處
相傳有種食夢獸叫「貘」。牠可以吃掉人類的噩夢,留下美夢。吃了一百個噩夢之後牠會開始長大。現在急速發展的巨量資料技術也在吃掉人類的美夢,留下惡夢;吃到一百個美夢後,牠會以O(100n)開始長大。
到底多巨量
●Google一秒可搜尋7百萬筆資料
●Dropbox每天檔案上傳達10億個
●Facebook全球用戶數12億人
●全球智慧型手機數量超過19億隻
●Facebook每天增加27億個讚
●Youtube每天有40億次瀏覽
擁護者不斷吹捧巨量分析的好處:它能幫助我們節約資源、分析流感疫情趨勢、治療致命疾病、改善醫療保健、提高氣象預報準確度、加強城市安全等,甚至讓我們免於恐怖主義的憂患。
躲不了監視
在商業上巨量資料分析的例子已不勝枚舉。新產品的市調、價格分析、營銷活動的投放等,當然也有政治運動。歐巴馬2012年競選時就利用巨量分析可能選民,精準籌集競選資金,並獲得選票。
誰在收集資料?信用卡公司、企業、零售通路、稅務局,甚至動物園都有罪。分析資料在商業上的價值無庸置疑,但道德上值得商榷。
會員卡是最傳統的資料蒐集工具。結合會員卡、郵遞區號、臉部辨識攝影機,就可以分析出恐怖的精準資訊。比如日本Lawson量販店發行會員卡,實際上是為了記錄消費者居住的距離、商品選擇等,以了解「到店距離」與「購買行為」的關係。
台灣的7-11在消費者結帳時,也會由店員將客戶分類並輸入資料庫,來進行客層研究分析。
Google,Facebook與電信公司
找一天可以做個小實驗,與朋友一起用同樣的關鍵字Google,看看搜尋結果有何不同。Google search的演算法已經將你過去點選的網頁加到你的紀錄裡面。
同樣的,你每天按讚跟更新狀態時,Facebook都在密切記錄。當他知道你每天的使用時間、跟哪些人聯絡、看什麼文章、發表什麼言論、打卡地點,可以說Facebook對你比你老婆、你爸媽都還要清楚。更進一步的,Google與Facebook已經開始交換使用者資料了。
但最可怕的、擁有最大資料的其實是電信公司。沒有人能躲開電信公司與世界聯絡,所以不論你用什麼手機、電腦、社群媒體、App,電信公司比Google、Facebook更能掌握你的一舉一動。包括你講過的話、發過的訊息、聯絡的對象、去過的地方等等,通通可以被記錄下來。
例如今年春運,百度已經能夠利用巨量分析觀察大陸過年時人類的遷移行為了。
big.BROTHER
「老大哥」監視人民的慾望,數千年沒有變。從明朝東廠,到現代稜鏡(PRISM),只是手段更加高明了。
為什麼稜鏡計畫(PRISM)要找上微軟(2007)、雅虎(2008)、Google(2009)、Facebook(2009)、Paltalk(2009)、YouTube(2010)、Skype(2011)、美國線上(2011)以及蘋果(2012)?另外,Dropbox也被指控「即將加入」這項計劃?因為這些公司加起來,幾乎掌握了地球上大部分的人的行為資料。
在美國政府讓科技公司公佈更多安全要求細節後,Facebook、Google、Microsoft、Yahoo、LinkedIn紛紛提供自己的透明度報告。從這些報告中,可以看到NSLS以及FISA(外國情報監視法)兩法案容許政府向服務商要求提供用戶的基本資訊、訊息、照片等。big.BROTHER 確實是在使用我們的資料。
文化不同,隱私觀念不同
外國經理人到台灣任職時,第一次面試應徵者時都會被台灣人的履歷嚇一跳。在美國面試,面試官不能問你幾歲、結婚沒、小孩幾個、幾歲?家裡有多少人?在美國問這些通通是違法的!
結果我們自己台灣人,每個人在履歷上把身家清白交代的一清二楚。誇張一點的連身高、體重、家譜全都寫上。但在美國,履歷上你的學歷、經驗,就是全部了!可知國情不同,台灣人對隱私的重視相對微小。
麻省理工學院彭特蘭博士(Alex Pentland)說:「巨量資料是新的資產。人們希望它是流動的,而且能為人所用。對於新的跨越式資料收集的突破,將提高對隱私的侵犯,同時引起人們對於隱私侵犯新的擔憂,也是巨量資料潮流裡最重要的問題。」
「沒有不好的數據,數據唯一不好的是用途。」微軟高級顧問Craig Mundie也公開表示。
例如,美國連鎖賣場Target能經由消費者行為模式,分析出哪些客戶可能懷孕了,而寄發懷孕相關的促銷廣告。可是如果收到信件的人是未婚懷孕呢?或是她的家庭原本不知道她懷孕?大家興沖沖的蒐集與利用資料,卻可能傷害個人隱私。
問題是,大家不關心巨量資料帶來的影響。許多人對自己的資料被收集無知或漠視。當其他人在努力反對,或要求數據的使用透明化時,其他人不讀,也不去理解。
匿名與阻隔逆勢而行
過去的「善良年代」時,資料收集時會有一個「匿名化」的過程,讓資料只能用於大數的行銷分析或科學研究,卻不會洩露個資。這種年代已經結束了。現在在美國,只要有生日、性別和郵政編碼的「三重標識符號」,就可以辨識出87%的美國公民。
目前國外興起的匿名技術即是一種反撲。國外開始推行的匿名或「用完即銷毀」(像電影裡的情報人員)應用不少,比如Secret、Whisper、或Snapchat等。傳統的「填假資料」也是一種基本的抵抗。以目前人工智慧的演算法來說,部分資料不全的資料分析精確度會大大降低。但將來可不一定。
巨量資料的蒐集與利用,固然可促進公共利益、創造龐大商機,但它也在吞吃你我的隱私。只能說科技發展慢一點,或許是一件好事。人們很容易只看到眼前的好處;日後發生質變時,或許只能消滅它。
有物報告取名自「言之有物」,是一個內容深、觀點多、有時帶點幽默的網路媒體。我們聚集了科技業的業內人士,從專業的角度探討科技業有興趣的議題,包括國際合作、新科技、領袖、商業策略、遊戲、動畫、法律、職場生活、以及創業等。有時這裡的讀者留言比原文更精采,是令作者們又高興又不好意思的特色之一。
有物報告取名自「言之有物」,是一個內容深、觀點多、有時帶點幽默的網路媒體。我們聚集了科技業的業內人士,從專業的角度探討科技業有興趣的議題,包括國際合作、新科技、領袖、商業策略、遊戲、動畫、法律、職場生活、以及創業等。有時這裡的讀者留言比原文更精采,是令作者們又高興又不好意思的特色之一。