數位時代的魔球

如果你是體育迷,可能知道作家邁克‧路易斯(Michael Lewis)提出的術語「魔球」(Moneyball),也就是用特定的數據驅動方法來建立和指導體育團隊。1990 年代後期,奧克蘭運動家隊(Oakland Athletics)發現,傳統的棒球球探在評估球員優秀與否方面,其實成效不彰。這些球探所仰賴的多數技巧,事實上都屬運氣因素,反之亦然,他們一直都將訊號與雜訊混淆。

大多數棒球球團會聽從球探的建議,支付數百萬美元年薪給實際上並未幫助球隊贏得許多比賽、過去成績也不顯赫的球員。同時,還有許多球員的價值被忽略了,即使他們幫助球隊的方式十分重要又穩定,卻輸在不夠引人注目。這種效率不彰的情況,反而為一個球團創造了契機,促使他們率先尋找更好的方法。

奧克蘭運動家的創新有三個層面。他們利用數據來確定球員的哪些特徵和習慣確實有助於贏得比賽,再利用這些調查結果來尋找市場異常,亦即長期以來被其他球團低估的決勝特性和習慣。接著,他們聘請具有這些特點的球員,也指導球員養成這些習慣。結果,這些球員能與紅襪隊、洋基隊對抗並贏得比賽。這兩個球團可是付得起高於運動家三倍的球員薪水呢。

快速瀏覽接下來的25年,你會發現這些創新改變了世界上所有主要的運動項目,但今非昔比:在 1990 年代,魔球靠的是試算表(spreadsheet)和聰明的實習生;時至今日,需要的是雲端超級計算機和專業的數據科學家團隊,一切都得歸功於專業運動團隊意識到此舉帶來的優勢,因而收集的大量新數據。

一級方程式賽車

這場革命的典型代表是一級方程式賽車(Formula 1,即 F1)—世界上最受歡迎的賽車比賽。在 F1 比賽中,數據的流動比豪華包廂中的香檳更快,可對賽車各方面的性能鉅細靡遺地進行即時監控。

F1 賽車每跑一圈會產生幾十億位元組的數據,大約是傳輸 30 小時的歌曲或下載 6,000 本電子書所需的數據量。這些數據透過無線方式發送給後勤維修人員,他們利用複雜的演算法尋找可能影響比賽策略的異常現象,如發動機功率,剎車溫度、燃油消耗、輪胎磨損、橫向G力、後翼下壓力等數百種變數。賽車團隊不用等到某個零件臨時出意外,影響到比賽,才能發現問題所在。如今,他們可以在狀況發生之前就偵測到異常。

事實上,資料探勘並不僅限於賽車軌道上。F1 各大車隊投入昂貴的高科技裝備競賽,為了制衡這點,大會祭出規則,限制每個車隊比賽當天可在賽道旁安排的工作人員數量。如果沒有這個限制,大型車隊的金錢遊戲,會讓小型獨立車隊不堪負荷而從賽場上消失;畢竟,在這項運動中,車隊每年在引擎方面斥資1億美元,並且要為每個輪胎雇用3人在維修站待命。

然而,資金最雄厚的車隊甚至決定要導入更多的數字運算,因此轉向賽道之外的工程師。例如,紅牛車隊(Red Bull Racing)最近與 AT&T 合作建立了一個全球網路,將世界上所有 F1 賽道的比賽數據,傳輸到位於英國米爾頓凱恩斯的車隊總部;在那裡,第二組數據科學家團隊「即時」監控紅牛的賽車—或者該說是近乎即時。系統性能受限的因素竟是光速,因為它在一秒鐘內只能環遊世界 7.5 圈!這種投資規模應該足以讓你清楚瞭解即時異常檢測對工程師的意義。

F1 車隊在即時監控方面表現非常出色,有些比較優秀的車隊已能向其他大公司出售他們的服務。例如,麥克拉倫車隊(McLaren)以旗下數據分析團隊為基礎,最近轉成立一家名為麥克拉倫應用技術(McLaren AppliedTechnologies)的獨立公司,立即與畢馬威(KPMG)國際會計師事務所簽約合作。其他正在合作的計畫還包括幫助石油業客戶監控鑽井平台的即時傳感器數據,偵測可能帶來麻煩的異常狀況。

運動場外的延伸發展

這些創新也延伸到其他運動項目。例如,2016 年,布魯克林籃網隊(Brooklyn Nets)與 Infor 商業數據分析公司簽署了贊助協議,該公司當時幾乎不為軟體業界人士所知。Infor 為大公司設計大數據分析軟體,客戶包括F1 法拉利車隊;雖然他們支付了數百萬美元在籃網隊球衣上廣告自家商標,但除了簽下贊助支票之外,他們也在談判桌上獲得更多利益。

籃網隊執行長布雷特‧尤馬克(Brett Yormark)解釋,出售球隊球衣的廣告版位,主要是希望找到一個戰略合作夥伴,「足以幫助我們實質提升球員在場內外的表現」。他與 Infor 公司簽下的協議象徵 NBA 的新魔球時代來臨,一些 NBA 明星球員,將穿上印有大數據分析公司商標的球衣。

NBA 這場革命,主要是由新的數據來源所推動,例如每個球員的運動追蹤器,以及覆蓋球場各個角度的攝影機。但是,團隊合作理念大幅改變,以及重金投資數據分析人才,都是促成這場革命的助力。例如,沙加緬度國王隊(Sacramento Kings)最近聘請前哈佛大學統計學助理教授盧克‧博恩(Luke Bornn)來探勘並挖掘所有錄影和球員追蹤資料,正如博恩在接受NBC 體育新聞採訪時所說:

許多在球場上發生的事情,都沒有真正顯現在比賽記分板上。許多做出重大貢獻的球員,表現都不明顯,既不是助攻、不是籃板球,也非蓋火鍋。

反而是一些從未被教練發現的特質,隱藏在數據中等待被挖掘。博恩深信,利用 AI 挖掘所有有趣的異常數據,有助於國王隊發掘被低估的球員,並以創新的方式指導他們。最近,他與合作者共同發表了一篇關於進階測量籃球防守技巧的論文;利用所有安裝在 NBA 球場上的攝影機所拍攝的資料,他們能夠回答以前從未在籃球統計中發揮作用的兩個簡單問題:哪個球員無時無刻都在防守誰?特定防守球員對特定對手的表現如何?

博恩團隊的研究發現,出手選擇(shot selcection,球員投籃的時間和地點)和投籃命中率(shot efficiency,是否得分)是籃球防守技巧兩個不同的要素,這些技能也具有明確的空間結構:取決於防守者在球場上的位置。比如,在籃框附近防守時,中鋒魔獸霍華德(Dwight Howard)在降低對手投籃次數方面優於聯盟平均水準,但在降低對手投籃命中方面則低於平均;然而,當他離籃框很遠時,兩方面的表現都低於平均水準。這些發現讓博恩團隊能夠預測特定防守對決的結果。

例如,他們的模型推斷雷霸龍‧詹姆斯(LeBron James)與效力於聖安東尼奧馬刺隊(San Antonio Spurs)時的科懷‧雷納德(Kawhi Leonard)對陣時,得分應會低於 NBA 任何防守球員;不只因為雷納德本身就是出色的後衛,也因為他特定的防守技巧對上詹姆斯的進攻技巧時,特別有利。

為了偵測異常,NBA 球員的日常作息數據也需要挖掘,而這種魔球衍生的「行為版」乃全新的經驗。時任籃網隊控球後衛的林書豪認為,他的球隊與 Infor 的合作已有成效,幫助他照顧自己的身體,一如 F1 車隊照顧賽車一樣。特別值得一提的是,他讚揚先進的數據分析幫助改善他的睡眠品質,也讓惱人的腿傷恢復得更快。

其他職業體育聯盟的球隊也開始擁抱 AI,如同他們接受球衣廣告贊助一樣,因為商機無限。例如,英格蘭足球超級聯賽的萊斯特城足球俱樂部(Leicester City Football Club)在2015∼16 賽季的冠軍賽期間,非常巧妙地利用結合攝影機和穿戴式傳感器的 Prozone3 系統,取得球員追蹤數據。

如同所有英超球團,萊斯特城足球俱樂部利用這些數據來調整對戰的戰術策略,同時也挖掘其他數據,如球員的行動和工作負荷,從中偵測可能增加受傷風險的異常現象。這些努力使得球隊在英超聯賽中傷病率最低,而且擁有最穩定的 11 名先發球員。

責任編輯:林舫如
核稿編輯:洪婉恬

書籍簡介_AIQ:不管你願不願意,現在已是AIQ比IQ、EQ更重要的時代

作者:尼克‧波爾森, 詹姆士‧史考特
譯者:何玉方
出版社:商業周刊
出版日期:2019/01/24

☛若想跨域轉型求生,唯一致勝方程式!購書連結

作者簡介

尼克‧波爾森Nick Polson

芝加哥大學布斯商學院(Chicago Booth School of Business)計量經濟學和統計學教授,鑽研領域包括人工智慧、貝氏統計學和深度學習,經常在國際會議上發表演講。現居芝加哥。

詹姆士‧史考特James Scott

德州大學奧斯汀分校統計學副教授。取得馬歇爾獎學金之後在劍橋大學主修數學,2009年於杜克大學取得統計學博士學位。目前發表超過45篇同儕審查的學術文章,同時進行許多跨領域的研究合作,幫助合作者瞭解自家領域數據的力量。史考特與妻子艾碧蓋爾(Abigail)現居德州奧斯汀市。