限時免費

虧損線上論壇變AI概念股,美版PTT憑什麼一上市漲48%

美國最大線上論壇、又有「美國版PTT」之稱的Reddit,3月上市首日,股價就大漲48%,背後關鍵來自它累積近20年、鄉民們的貼文及評論。它的數據,怎麼成為Google布局AI戰場的墊腳石?企業面對破壞式創新,如何抉擇「創新者困境」的兩難?

Reddit共同創辦人霍夫曼(左2)(來源.法新社)

一個匿名線上論壇,成立近二十年來仍年年虧損,為何能一夕搖身變成「AI概念股」,股價還在上市首日大漲四八%?這個主角,是有「美國版PTT」之稱的Reddit。

成立:2005年
共同創辦人:霍夫曼、瓦尼安
主要產品:廣告、會員訂閱費、數據授權
成績單:2023年營收8.04億美元、淨損9,080萬美元
地位:美國最大線上論壇

做為美國最大線上論壇的Reddit,是海外鄉民集散地、迷因哏發源地,更是許多時事的風向球。它的前三大股東,不只包含美國媒體集團康泰納仕(Condé Nast)、中國網路巨頭騰訊,更有現在最火熱的AI公司OpenAI執行長山姆・奧特曼(Sam Altman)。

三月二十一日,它以每股三十四美元的價格,正式在紐約證交所掛牌上市,在上市十天後,股價仍高於掛牌價約四五%。

可能不少人還記得二○二一年的「遊戲驛站(GameStop)之亂」——正是Reddit上聚集的散戶,狂買被對沖基金看空的股票,在二十天內硬是把這支股票的價格,推升成長近二十倍。

過去變現力低,受TikTok挑戰

二○○五年成立的Reddit,由畢業於美國維吉尼亞大學的史蒂夫.霍夫曼(Steve Huffman)與亞歷克西斯.瓦尼安(Alexis Ohanian)共同創立,如今它的網站流量排名全美前十大,略低於維基百科、勝過LinkedIn,每天有超過七千三百萬名活躍用戶;旗下子論壇(subreddits)更超過十萬個,話題從政治到金融、從科學到迷因都有,甚至,還有「請把我當五歲小孩解釋給我聽(Explain Like I'm Five)」這樣難以歸類的主題。其流量在二○一八年甚至一度超越臉書,躍升僅次於Google和YouTube的全美第三大網站。

有趣的是,它雖然是上一個網路世代的產物,但用戶樣貌卻相對年輕。據統計,其用戶約三分之二是Z世代或千禧世代,在美國造訪Reddit的人中,有三二%不太使用臉書。原因是,主打「匿名、開放、多元」的Reddit,擁有更多從個人經驗出發的分享,打中年輕世代追求「真實」的價值觀。

但這條上市路,Reddit走得並不容易。就跟其他社群媒體一樣,Reddit也經歷過管理層動盪、言論審查引起社群反彈、變現模式不明等危機。創立十九年後,現在這波AI熱潮,終於替它帶來轉捩點。

事實上,它二○二三年,有約九八%的營收都來自廣告,但社群媒體的商業模式,在近幾年卻備受挑戰。

一是,Reddit的變現能力不如其他平台,以每名活躍用戶能帶進的廣告營收來看,全球圖片分享社群平台Pinterest比它高出約三倍;二是,受到TikTok等其他廣告形式更豐富的社群媒體競爭,Reddit的廣告營收成長在過去幾季也開始趨緩。

如今高質量數據成稀缺資源

這也是為什麼,比起廣告,市場更看重的是它在招股書中提到的「數據授權」營收成長潛力。

這項數據新產品,才剛正式亮相就已獲Google搶先認證。今年二月,它同意將數據授權給Google用來訓練其AI模型,為此,Google每年得付出約六千萬美元(約合新台幣十九億元)、總金額估將高達逾兩億美元。

單看「一間社群媒體擁有數據」這件事並不新鮮,但Reddit的數據,就是比其他平台更值錢!

AI發展有兩大關鍵:龐大的算力和數據。根據史丹佛人本人工智慧研究院估計,光是用來訓練OpenAI旗下大型語言模型GPT-3,所需的數據量就多達五百七十GB,相當於二十五個維基百科的規模。

而Reddit做為一個文字論壇,坐擁的正是數據的寶庫。論「量」,它從創立至今已累積超過十億則貼文,和超過一百六十億則評論,而且這些數據還會隨著用戶驅動而自動不斷增加。

而它數據的「質」,不只含金量更高,更具有比較優勢。首先,造就首波AI浪潮的大型語言模型(LLM),如OpenAI旗下GPT和臉書旗下Llama,需要大量以文字為基礎的訓練數據集,正是Reddit論壇內容的強項,與以影音、圖片為主的其他社群平台不同。

其次,在將數據用於AI模型訓練前,需要「清洗」數據,也就是將數據按照屬性分門別類、貼上標籤,而它旗下的上萬個子論壇,已經替AI公司自動做好這件事。例如,如果想訓練金融相關的語言模型,特別適合用「WallStreetBets」子論壇(華爾街論壇,關於股票、期貨討論版)裡的討論串當訓練數據,其他還有醫療、法律、流行時尚等各種垂直領域的數據可供使用。

另外,現在AI生成內容最為人詬病的「胡說八道(hallucination)」症,也可能透過它的數據減輕。AI生成內容之所以難以完全取代人類、甚至是出錯,在於其缺乏與真實物理世界互動的經驗。而Reddit內容最大特色,在於它的匿名功能讓用戶很願意分享個人經驗,也讓其資訊更接地氣,正好與其他新聞網站、論文、教科書等大數據集互補。

簡單來說,Reddit的數據擁有巨量且不斷更新、分類標籤、人類經驗等特色,也讓其成為AI時代下必備且稀缺的資源。

老牌論壇Reddit坐擁大量訓練AI模型的必備數據,搖身成為AI概念股,其招股書共出現超過60次AI相關關鍵字。(來源:法新社)|放大原圖

看準這點,它從二○二三年就開始布局,調整API(應用程式介面)政策,將原本免費開放給外部的數據改為付費。而對它來說,與Google的授權協議只是第一步,由於招股書上並沒有特別列出這是獨家授權,因此外界估計接下來還會看到更多授權金入帳。

挑戰:功能被取代、用戶流失

擁有對的資源,讓它能抓緊機運搭上這波AI高速列車,但它並不是從此就高枕無憂。

現在的Reddit,與許多媒體和創作者一樣,在AI時代展開之際,也正面臨「創新者困境(The Innovator's Dilemma)」。

創新者困境,由哈佛商學院教授克萊頓・克里斯坦森(Clayton Christensen)提出,指的是在市場上站穩腳步的成熟企業,面對破壞式創新時會遭遇的兩難困境:應該冒著損害既有業務的風險,去投資新技術?還是選擇忽視新技術,但未來可能被掌握新技術的新進者超越?

以Reddit的例子來看,加入AI陣營可以讓它獲得新的營收成長動能、讓自己的內容更容易在AI產品中被看見,也有機會藉由合作提升自身AI技術,優化自家平台的內容推薦演算法。

然而,另一方面,當用來訓練AI的內容有大量來自Reddit,也就表示未來AI能提供越來越接近它平台上的內容,那麼或許有一天,人們想要找答案時,很可能會直接問AI,而不是到Reddit上找;一旦用戶開始流失,既有的廣告收入也會開始受到打擊。

這也是為什麼,另一派內容供應商,仍傾向保護自己的資料不加入AI訓練。例如,《紐約時報》在二○二三年底控告OpenAI和微軟,在未經同意下利用其新聞報導訓練AI模型,還可能傷害其聲譽。

面對創新者困境時,該怎麼選?這並沒有正確解答。蘋果創辦人賈伯斯曾說,「如果你不自己革自己的命,那也會有其他人來動手。」看來,Reddit選擇了自己先動手。無論結局如何,它已經在AI時代下重新定位,為自己開拓新道路。接下來,就看這條路能走得多廣多遠。

本文完
免費訂閱!
商周最新出刊報‧隨時掌握最新趨勢