在4月8日晚間舉行的“我是歌手”總決賽現場,阿里云人工智能首席科學家閔萬里的心全程吊在嗓子眼里。
閔萬里主導研發的阿里云人工智能程序小Ai當晚需要對這場比賽結果做出預測——通過大量數據的收集處理推斷出冠軍是誰。經歷了四個小時的比賽,結果顯示小Ai成功預測了李玟獲得冠軍。
“緊張壞了,比歌手還緊張。”比賽結束后,放松下來的閔萬里對《財經》記者說。
這讓人聯想起一個月前AlphaGo與李世石的人機圍棋大戰,但和下圍棋不同,預測誰能成為歌手冠軍,小Ai還加入了對人類情感的理解。
與擁有固定規則進而尋求最優解的圍棋比賽不同,對現場演唱的理解因人而異,也就是說,“對最終‘歌王’的預測是一個無明確規則的廣度搜索。”閔萬里說,這對小Ai來說是最難的。
不斷修正的4小時
“小Ai”主要基于神經網絡、社會計算(social computing)、情緒感知等原理工作。小Ai優于現有大數據機器分析的長處在于:它善于洞察本質和實時預測,并能理解人類情感。它通過強大的計算和機器學習能力,不斷自我進化。
在“我是歌手”四個小時候的總決賽全過程中,小Ai做了三個階段的預測。第一輪,對7名演唱者以獲得冠軍的概率排順序,預測第七名淘汰選手;第二輪時候,兩兩PK階段,預測PK的對象和出場的次序(即上輪預測的其他排名結果);第三輪,在三強選手預測出冠軍,其原理仍是依靠獲得冠軍概率排列。
從結果來看,第一輪,小Ai的判斷依據較少,所以對選手獲得冠軍的概率預測與結果相差較大,但成功預測出淘汰選手;第二輪,小Ai成功預測了對決名單,不過出場次序略有錯誤;第三輪,小Ai順利預測出了冠軍李玟,但亞軍和季軍順序預測與結果相反。
與前兩季《我是歌手》冠軍歌手實力十分突出不同,本季雖然有大熱門的李玟,但也有從一個粉絲開始累積到上百萬粉絲群體的韓國歌手黃致列,后者在社交網絡上的攻勢更加猛烈。這增加了人工智能對結果判斷的不準確性,閔萬里告訴《財經》記者,“歌手實力懸殊比較大的時候比較容易猜出結果”。
從過程來看,閔萬里最擔心的是開場的第一輪預測——因為那個時候小Ai判斷結果權重最大的是歌手的演唱順序——第一輪最后出場的張信哲以24%的勝率排名第一。通過不斷對新數據的處理,小Ai隨后修正了這個錯誤。
與現場看到較為穩定的數據不同,在系統中,小Ai會每隔5秒更新一次7位決賽歌手奪冠的概率。在兩兩PK的第二輪,小Ai的實時判斷能力才真正發揮了作用。
其中,第一輪結束后暫列第二位的黃致列和第五位的李克勤的幾率一直十分膠著。李克勤因在網絡直播關注度上略遜一籌,率先出場。此時,小Ai對結果的預判是李克勤有51%的獲勝概率,隨著演唱進入高潮,概率升至52%。
然而,黃致列演唱開始后,其獲勝概率迅速提升了9%,但當他脫下衣服后,獲勝概率曾一度下降至51%。在此后,兩者的概率比一直在52:48、53:47、54:46這幾個數字中間徘徊。直到最后,小Ai作出判斷,以57%的概率預測黃致列獲勝。
但在另一場張信哲和老狼的對決中,小Ai的預測一直有較大傾向性,張信哲的概率長時間處于75%以上。與人有情感色彩會影響判斷,這樣的結果說明了機器不帶有情感,它試圖理解別人的情感,但它做判斷時是冷冰冰的。閔萬里告訴《財經》記者。
機器是怎樣學習的?
小Ai之所以可以做出上述判斷,是一個不斷學習的過程。首要的工作是通過搜索海量音樂庫,培養小Ai的音樂品味,其來源是阿里音樂的200萬首歌曲。小Ai需要積累一首歌曲的下載量、點評量這些可以判斷歌曲受歡迎程度的數據,以及歌曲本身音頻特征和譜曲音樂的關聯因素。
接下來,運行在阿里云大數據平臺上的三個系統協同工作,預判最終結果。
第一,爬蟲系統。通過一定的規則,自動抓取互聯網上的評論變化,其數據來源主要是新浪微博等,并以此形成大量的數據供給第二個系統。
第二,情緒分析系統。該系統會根據抓取回來的評論進行實時文本分析,以便分析出現場500位聽眾評審對歌手的評價。由于現場聽眾覆蓋多個年齡層,且并非專業樂評人,所以這套分析系統的評價只是擴大了樣本的規模。
第三,現場效果采集判斷。阿里云還將對現場音頻數據和舞臺效果進行實時采集,并做出判斷,以此調節判斷歌手奪冠的幾率算法的權重。
與人類認知音樂的方法不同,人工智能的結果是尋找最優的特征集,閔萬里團隊要做的就是指導小Ai通過多個維度尋求最優解。以現場單一的音頻為例,小Ai要將其分解成幾百個特征。
閔萬里以比賽剛剛結束為由,并未向《財經》記者透露小Ai當晚收集數據的量級。但他告訴財經,其學習了上百個特征,并通過阿里云的計算能力為其提供支持。可以肯定的是,當晚的數據運算量遠小于阿里“雙十一”購物節。
阿里布局AI商用
阿里云從2012年開始進行人工智能模塊的研發。也就是說,小Ai人工預測首秀的背后,是阿里云5年的技術積淀。
在這場對決判斷的背后,阿里巴巴集團及其相關業務公司(下稱阿里系)為其提供了支持。阿里云提供了計算能力和系統平臺、阿里音樂提供音樂庫作為訓練基礎、新浪微博提供社交網絡評價。
閔萬里告訴《財經》記者,當晚,阿里巴巴集團董事長馬云在內部的聊天群顯得十分興奮。
如果說預測“我是歌手”是阿里云人工智能利用熱點綜藝節目的一次“秀”,那么這次秀在馬云的棋盤上僅是起步。
《財經》記者獲悉,阿里系已經準備將人工智能在多個產業落地。閔萬里介紹,在內部,人工智能已可對交通作出預測,這與物流領域的菜鳥網絡業務相關;可以幫助金融機構自動應答客戶呼叫,是在支付寶的應用;與預測唱歌比賽冠軍類似,人工智能將幫助阿里影業解決選片選角問題,預估影片商業價值,并指導影片的精準營銷。
面對社會老齡化,人工智能有望通過醫療數據幫助人們發現潛在疾病,實施預防性治療。2014年通過收購中信21世紀,阿里系進入醫療行業,隨后推出了多款健康產品。
技術一定會推動商業的變革,閔萬里告訴《財經》記者,馬云在內部強調,健康和娛樂是未來兩個非常重要的領域,“我們要在技術上支持這個戰略”。
阿里巴巴擁有淘寶、支付寶、微博等多個自行產生海量數據的平臺,這是其開展人工智能研究的天然優勢,但其面臨的挑戰也是巨大的。
“神經網絡”這些人工智能領域的專業詞匯早在20多年前就已經提出,但因為計算能力不足,直到2006年才出現了圖像識別的應用。近幾年隨著云計算的興起,深度學習不再成為障礙。
小Ai系統與人腦最大的不同是,后者可以做很多隨機應變,也就是更有創造性,但小Ai仍只能對既成事實做出判斷,這是目前人工智能最大的局限。
和IBM的Watson、谷歌的AlphaGo這些先行者相比,阿里的技術積淀有待加深。
(本文轉自鳳凰科技,作者梁辰,文章僅代表作者觀點。微網倡導尊重與保護知識產權。如發現本站文章存在版權問題,請聯系我們,我們將及時溝通與處理。)
文章編輯:微網網絡 最好的微信商城系統盡在Micronet微網
如需了解微商城,可報名申請或撥打全國免費電話400-830-8248
聲明:本網部份文章為轉載文章,在每篇文章底部有說明,文章的觀點和立場僅代表作者個人立場,不代表微網立場,若是文章轉載中有侵范您的權益,請發郵件到 493149@qq.com或致電13922854199通知刪除,謝謝!