帕蘭泰爾技術公司(Palantir Technologies)是歷來最成功的矽谷新創之一。該公司創立於2003年,上一次估算市值為令人吃驚的200億美元,這大約和推特市值相當。雖然你可能從來沒聽過這家公司,但帕蘭泰爾絕對聽過你。

帕蘭泰爾只是一般所知的資料仲介(data broker)這種新類型公司其中一例,他們蒐購人們的個人資訊,然後轉賣或分享圖利。這種公司還有很多:Acxiom、Corelogic……,一整掛你大概從未與之有過直接互動的大公司,持續監控並分析你的行為。

還記得你告訴房仲你正在尋找何種房地產嗎?賣給資料仲介了。或是你曾在保險比較網站上打進去的那些詳細資料?賣給資料仲介了。在某些案例中,連你的整個瀏覽歷史都被打包賣掉了。

你的個資,正被偷偷建檔

這種仲介的工作就是把這些資料全部整合起來,在他們所購入或取得的不同片段資訊之間交互參照,然後針對你創造出僅此一份、鉅細靡遺的檔案。

在某些仲介商的資料庫內,你可以用你在該資料庫的ID(一個你永遠不會被告知的ID),真的打開一個數位檔案,裡頭包括你歷來所做每一件事的蛛絲馬跡。你的名字、生日、宗教、度假習慣、刷卡紀錄、殘疾、你服用的藥物,以及你是否容易受騙。毫不誇張,我們每個人都有成千上萬的分類和檔案,裡頭又有成千上萬的詳細資料,儲存在某處隱密的伺服器上。

訂閱《連線》雜誌可能意味著你對科技有興趣,槍枝執照可能意味著你對打獵有興趣。在這過程中,仲介商用聰明但簡單的演算法,充實他們的資料。

資料仲介知道我們的好惡,意味著我們在網路上四處遊蕩所收到的廣告,會盡可能與我們的興趣和需要有關。加上這些訊息可以直接鎖定正確的消費者,意味著廣告整體來看是比較便宜的。這麼一來,產品很棒的小商家可以找到新的受眾,對大家都是好事。

然而,我確定你已經在想,一旦開始把我們是何許人的資料萃取成一系列的分類,一整串的問題也就隨之而發。我扼要解釋一下,線上廣告如何在你上網四處點選時找到你,其背後不為人所見的過程,以及資料仲介在過程中扮演的角色。

假想我擁有一家專辦奢華旅遊的公司,就叫弗萊公司吧。多年來,我一直要人們上我的網站登錄資料,如今有了一份他們郵件位址的清單。如果我想發掘更多和我的用戶有關的內容——像是他們對哪一種度假方式有興趣——可以把我的用戶郵件清單寄給資料仲介,他們會在他們的系統中查詢這些名字,然後把相關資料附記在我的清單上回給我,就像在試算表上多加一欄之類。現在,當你造訪我的弗萊公司網站,我就可以看到你對熱帶島嶼特別偏好,於是奉上一則出走夏威夷的廣告給你。

這是選項一。選項二,我們假想弗萊公司在網站上有一些額外空間,可以賣給其他廣告商。我又去找資料仲介,把我的用戶資訊給他們,仲介便去找其他想上廣告的公司。我們假想有一家賣防曬乳的公司很有興趣,為了讓他們相信弗萊公司擁有防曬乳賣家想鎖定的受眾,仲介可能會把他們推斷的弗萊用戶某些特徵秀給這些賣家看,或許是紅頭髮的人所占百分比;或是防曬乳賣家可能會交出一份他們自己用戶的電子郵件位址清單,仲介可以查出兩群受眾之間到底有多少交集。如果防曬乳賣家同意,廣告就會出現在弗萊公司的網站上,而仲介和我都會拿到錢。

到目前為止,這些做法並未超出行銷人員向來用於鎖定顧客的技術太多。但到了選項三,對我來說,事情開始有點碰觸到禁忌。這次,弗萊公司要找一些新客戶,我想鎖定65歲以上、喜歡熱帶島嶼且有大筆可支配所得的男女,期望他們會想參加我們其中一趟新的加勒比海奢華航程。我去找資料仲介,他會翻遍他們的資料庫,幫我找出一份符合我描述的人名清單。

好,我們就假想你在那份清單上吧。仲介絕不會把你的名字交給弗萊公司,但他們會查出你另外還固定上哪些網站。仲介可能也和你最喜歡的網站之一有合作關係,或許是社群媒體,或許是新的網站,諸如此類。只要你不疑有他登入你最喜歡的網站,仲介便會接到通知,提醒他們你來了。仲介是分秒不差,在你的電腦上放一支小小的旗標做為回應——所謂的cookie。這個cookie的作用就像對網路其他各類的網站發出訊號,說你是應當收到弗萊公司加勒比海郵輪之旅廣告的某人,無論你想不想收到,無論你去到網路的何處,這些廣告都會跟著你。

你不想收的廣告,也避不掉

我們在此碰上了第一個問題。要是你不想看到廣告呢?

華特豪絲(Heidi Waterhouse)期盼甚殷的胎兒流掉時,她退掉所有提醒她胎兒成長進度、告訴她現在胚胎和哪種水果一般大小的週刊郵件。她取消她在熱切期盼嬰兒誕生時所簽下的所有訊息郵寄名單和欲購清單。但正如她在2018年一場研討會上告訴在場聽講的開發商,根本沒有任何力量能幫她退掉網路上追著她到處跑的懷孕用品廣告。懷孕這件事的數位虛影一直自顧自反覆出現,沒有母親,也沒有胎兒。「建造那個系統的人沒有一個想過會有這種後果,」她剖析。

這是一個或出於沒有想到的疏忽、或出於刻意設計而具有剝削性的系統。提供發薪日貸款(payday loan)的人可以用這個系統,直接鎖定信用紀錄不良的人為目標;賭博廣告可以指向經常上賭博網站的人。還有人擔心這種資料簡介也被用於對人們不利:熱中於摩托車的人被認為有高風險嗜好,吃無糖點心的人被貼上糖尿病標籤,結果投保時被退件。一項從2015年開始進行的研究證明,Google提供給上網女性的高薪經理人職缺廣告,遠少於提供給上網男性。

這些做法不限於資料仲介。資料仲介的工作方式和Google、臉書、Instagram、推特的經營方式差異極小。這些網路巨擘並不是以擁有多少用戶來賺錢,它們的商業模式是建立在微定向(micro-targeting)的觀念上。它們是發送廣告的巨型引擎,賺錢的方式是讓用戶經常連到它們的網站,到處點點看、閱讀廣告主贊助的貼文、觀賞廣告主贊助的影片、看廣告主贊助的相片。

無論你在網路的哪個角落使用,這些隱身在背景畫面中的演算法,正運用你不知道它們擁有且絕不主動提供的資料在謀利。它們已經把你最個人、最隱私秘密,變成一種商品。

小檔案_書名:打開演算法黑箱

作者:漢娜.弗萊
出版社:臉譜
出版日期:2019年5月2日 

漢娜.弗萊 簡介
倫敦大學學院城市數學副教授,運用數學模型研究人類行為模式,曾與政府部門、警方、醫療保健分析師和超市合作。在TED上的演講累計數百萬人次觀看,主持BBC長期播出的科學性播客節目《拉塞福與弗萊的好奇事件簿》,著有《數學的戀愛應用題》等書。