Threads、Airbnb如何精準推薦?揭密讓演算法更聰明的「數據圖譜」
1.揭密比你想像中更強的演算法》Threads、Airbnb、Google如何精準推薦,用「數據圖譜」捕捉你的生活、娛樂與消費行為?
2.從Meta到Airbnb,包括你與誰成為好友、去哪旅行、喜愛的品牌或電影、住宿飯店等,藏在背後的社交連結網,正悄悄發展出一套「專屬你」的情境規則⋯。
書名:AI融合策略/作者:維傑.高文達拉簡、文卡.文卡查曼/出版社:商業周刊
過去十年來,一些企業開始在銷售的每件產品中內建感應器、連接裝置和軟體,即時蒐集資料。這些技術讓企業能追蹤消費者如何使用產品,並蒐集使用產品的資料,無論這些資料是結構化或非結構化,例如文字、圖片、影片或聲音。
透過追蹤即時數據,亞馬遜和Google等公司利用數據圖譜在市場上取得競爭優勢。
「數據圖譜」是用來捕捉企業與顧客之間的關係與互動,主要是根據產品使用數據來建立的。這個概念受到社交網路和圖形理論所啟發, 類似於社交圖譜:個體(例如朋友、同事、上司)被視為「節點」,而他們之間形成「連結」(link)。
「圖譜」(graph)這個詞是指各連結之間的結構特性,以識別這個網路中的重要人常物,例如關鍵節點、連結者和有影響力者。
這個概念可追溯至社會心理學家史丹利.米爾格蘭提出的「小世界理論」(small worlds),以及他所提出的理論「六度分離理論」:每個人之間平均的連結通常不超過六個人。社交網路理論指出,網路裡的成員彼此之間的關係和連結具有重要意義,這種觀點對於分析組織、產業、市場與社會的結構和動態十分有價值。
同樣的,公司的數據圖譜所顯示的連結,比起關於個別客戶、產品、功能及其用途的數據更為關鍵。透過即時追蹤產品使用資料,公司便能建立數據圖譜,進而提供個人化建議。
數據圖譜能夠捕捉個人的生活、工作、娛樂、學習、社交、觀看、交易、旅行、支出等行為。數位化使得這些行為可以被大規模且即時觀察與編碼。舉例來說,Meta的數據圖譜根據超過三十億名用戶在旗下七大平台上的數據建構而成:Facebook、Messenger、WhatsApp、Instagram、Oculus(Meta生產的虛擬實境頭戴式顯示器)、Meta打造的元宇宙、Threads。
Meta追蹤使用者行為,包括與誰成為好友、解除好友、正在與誰傳訊、去哪裡旅行、討論的品牌、觀看哪些電影、聆聽哪些音樂等。
Meta已經掌握了一門科學:即時蒐集用戶之間數十億次互動所產生的數據,追蹤會員間的互動、登入紀錄、點擊、停留時間、瀏覽頁面與搜尋行為。這使Meta能夠進行大規模測試、AB測試,確保使用者願意長時間使用其平台。
舉例來說,在臉書向使用者顯示貼文或廣告之前,它會從大量庫存內容中篩選出約五百項可能吸引使用者互動的選項,並透過專屬神經網路模型對這些內容進行排名,最終才在其各種媒介平台上展示給使用者,如文字、音訊、影片等媒介。
未來強者寶座,並非擁有高價值資產的公司,而是懂得運用數據驅動洞察力的公司。
這種機制能確保使用者會與內容互動;互動時,Meta社交圖譜規模又可以快速擴大。
大多的數據圖譜龍頭企業會將蒐集到的數據組織成機器可讀的圖形格式。舉例來說,Airbnb的旅遊圖譜是以約七百萬個房源為基礎,並標記了不同的實體(如城市、地標、活動等)及其關聯(如最佳旅遊時間、著名教堂、熱門演出等)做為標籤。
當消費者使用Airbnb策畫的旅遊體驗,並在社交媒體上標記位置時,這間數位科技公司會追蹤每位用戶租住的房間、參觀景點、用餐地點、觀看的演出等。
這種追蹤機制使Airbnb能夠將每位消費者所消費的所有產品和服務串聯起來,並將數據彙總到整體客戶,根據產品相似性將客戶分組分析,進而為未來的訪客提供個性化推薦,涵蓋的不只是房屋類型,還包括最佳的用餐地點或最適合參觀景點的時間。
Airbnb比傳統飯店更能滿足顧客需求,因為傳統飯店的顧客資料通常散落在各部門內。舉例來說,訂房部門有訂房資料、禮賓服務部門有一日遊和餐廳推薦資料,而Spa中心則有顧客服務紀錄等。
大部分數位企業都是參考Google的知識圖譜。我們都曾在實體圖書館進行研究,數據是獨立儲存在於不同的數據孤島中。但Google不只是一個虛擬圖書館,而是在過去二十年來建構了一個更加相互連結的系統,將蒐集到的所有事實組織為獨立且互相關聯的元素。
過去「我們製造」(Made by Us),轉變為「我們解決」(Solved by Us)。
每一個元素都提供不同類型的資訊,並與許多其他因素相連。當Google推出其數據圖譜時,已索引超過五億個實體、超過三十五億條關於這些實體的事實,以及無數相互關係。從那時開始,Google知識圖譜的規模和範圍以及數據庫變得越來越大。
Google的優勢來自於公司所建立的「數據集」,這些數據集捕捉了各實體間的關係,幫助公司的演算法理解每個搜尋的上下文。
舉例來說,當使用者在搜尋欄中輸入「Jaguar」一詞時,他們究竟是在查詢南美洲的動物、英國的汽車品牌,還是美式足球隊?一開始的演算法無法分辨其中差異,但根據過去的搜尋模式和使用者行為,這間數位巨頭發展出一套基於情境的規則,能夠預測某個意思比較可能出現。如果使用者最近搜尋過有關的動物內容,那麼Google可能會認為使用者比較可能是在查詢動物,而不是汽車或美式足球隊。
為了得出這樣的結論,Google採用以圖為主的架構並連結所有資料庫。
這種圖形化的結構使系統能回應語音查詢,例如你可能會對系統說:「嘿Google,幫我訂兩張下週三去羅馬競技場和古羅馬廣場的門票,並用Google Pay付款。」由於運用的知識以圖譜形式呈現,演算法就能理解使用者的請求,它知道古羅馬廣場和羅馬競技場是羅馬的旅遊景點;下週三是四月十九日;訂票表示買門票;付款是指使用綁定的信用卡,可以把這些詞語的其他可能含義先排除不用。
當消費者的互動模式發生變化時,底層的知識圖譜也會不斷被精煉與更新,以反映各種關係。
舉例來說,一位曾經攀登過亞當斯山,並計畫挑戰富士山的登山者,他可能會問:「攀登富士山所需要的準備,和攀登亞當斯山有哪些不同?」這樣的查詢需要綜合多方面的資訊,而過去使用者通常需要進行多次搜尋才能獲得答案。
生成式AI正在蓄勢待發,將通過建構對話式介面,讓客戶能夠透過文字、圖片、數字和語音進行互動,進一步豐富數位科技企業的服務。
數據圖譜是一個充滿動態連結的圖形化網路,可揭示更多、且更好的商業機會。
作者:維傑.高文達拉簡、文卡.文卡查曼
出版社:商業周刊
出版日期:2025年8月14日
維傑.高文達拉簡、文卡.文卡查曼 簡介
維傑是世界級戰略和創新大師,達特茅斯大學塔克商學院傑出講座教授、矽谷育成中心Mach 49學界合夥人、哈佛商學院馬文鮑爾研究員,曾任奇異公司首位首席創新顧問。文卡是波士頓大學奎斯特羅姆商學院管理學講座教授,史丹佛大學列為全球研究影響力前2%科學家之一。
更多好書 請上商周.COM:
https://www.businessweekly.com.tw/bookshop/
- 模式
- 字級