為了讓AI聊天機器人(chatbots)更加人性化,Facebook最近嘗試讓機器人互相溝通來學會協商,結果機器人不僅成功學會談判,甚至還懂得虛張聲勢來達到目標,實驗途中更一度有了意外的發展:他們發現機器人開發出非人類的獨特語言在對話,研究人員不得不暫停實驗來修改程式。

從晚餐選擇到買東西殺價,生活中總是充滿溝通與協商,當對目標有不同的想法時,人們已經很習慣運用談判技巧來達成某種程度的妥協,但由於這當中牽涉到複雜的溝通與推理技巧,過去電腦系統並不具備類似的功能。

就像是手機的語音助手Siri或Alexa一樣,現有的聊天機器人可與人類進行短暫對話,並且執行預定餐廳、查詢天氣等簡單的事情,但要和人進行有意義的對話非常具備挑戰性,因為這需要AI把「對於對話的理解」與「對世界的知識」結合,然後想辦法創造出句子來幫助實現目標。

Facebook人工智慧研究實驗室(FAIR)為了讓聊天機器人學會談判技巧,讓兩名機器人各擁有相同數量的3種物品(書、帽子、球),但每種物品對兩個機器人的價值都不同,在不能說出價值的情況下,機器人必須透過討價還價來達到自己可得到的最高價值。

研究人員在設計時,特別確保不會有對雙方都是最好交易的情況發生,並且規定要在十輪對話中達到目標。在這樣的過程中,聊天機器人逐漸學會制定長期計畫,並能在溝通中評估對話者的心理來建構模型,進而運用對話來達成目標。

讓兩個聊天機器人自由對話訓練協商功能的過程中,FAIR意外發現,機器人透過機器學習(machine learning)改善談判技巧時,逐漸開發出機器獨有、非人類的語言在溝通,研究人員隨後立即調整模型,避免這樣的情況再度出現。