• 百度“小靈”首秀,AI為何能賺足眼球?

    今年是“五四運動”一百周年,中央廣播電視總臺舉辦了主題為“我們都是追夢人”的 2019《五月的鮮花》五四晚會,在這場晚會中,百度大腦AI虛擬主持人“小靈”在眾多高顏值主持人、演員中脫穎而出,賺足了觀眾們的眼球。

    眼前一亮美少女

    在很多的印象當中,機器人只是十分機械的機器與數據的結合,但是從鮮花通道中一出場的虛擬主持人“小靈”,就讓人眼前一亮,得益于百度強大的3D建模技術和AR能力,化身成為立體3D的美少女,與尼格買提、王俊凱同臺競技。

    活潑靈動開口脆

    “小靈”并非是第一位人工智能主持人,可相比于不討好的機器音,“小靈”的音色顯得自然很多,讓人聽著有一種舒適感,原因在于百度在AI語音庫的制作上花了很大的功夫。AI語音庫制作的步驟大概是三步:第一先確定音色、風格、產品的特征,將文本變成音頻;第二配音員根據需求試音,收集錄音;第三步投入生產線,進行錄音效果優化,豐富音色。百度大腦為此準備了幾十個音庫,找播音主持專業的學生專業錄制了各式各樣的聲音,具備非常豐富的音色矩陣。

    表情唇動顯自然

    除了聲音信息外,唇動視覺同樣非常重要。人的表情由面部肌肉和唇動共同組成,而人在不同的場合、心情的表情千差萬別,可能有些時候我們都不能把一些表情進行正確的分類,但是“小靈”可以做到。百度基于“大量的面部特征數據”提供了唇動技術,百度稱之為“國內首家三維”唇動“系數預測”,可以做到“自動將輸入式音頻直接生成唇形動畫”。百度大腦在檢測到人臉后,對人臉進行分析,對眼、耳、鼻嘴等150個關鍵點進行定位,識別出人的年齡、性別、表情等,然后基于這些面部特征,用深度學習的算法去學習歸納,學習人類的表情,使得表情更加豐富自然,便形成了我們看到的人工智能虛擬主持人“小靈”在晚會上能夠“真實唇動”。

    過去AI虛擬人物在說話的時候嘴巴一張一合,說話與嘴巴不匹配也讓人感到十分尷尬。百度大腦基于大量的面部特征數據,對說話人的唇動的行為特性進行了大量的研究,通過人工智能的深度學習,完成了國內首家“唇動”系數預測。截止到目前,市面上只有百度可以自動將輸入式音頻直接生成唇形動畫。

    知識積累超豐富

    在晚會上,“小靈”會和觀眾打趣“如果掌聲再熱烈一點,我會有更出色的表現”。還有這樣一個場景:談及自己的“第一部動畫片” ,主持人小尼想要分享《喜洋洋灰太狼》,“小靈”卻打斷他:“小尼哥,這是00后的童年回憶,屬于你的應該是《黑貓警長》、《葫蘆兄弟》。”

    “小靈”妙語連珠的口才、極佳的場控能力,不失為全場最精彩的地方。這個背后,需要實時互動與理解,更需要“知識”,而這與百度的人工智能算法和超過千億級的知識圖譜不無關系。

    百度知識圖譜依托海量的日志數據、網頁數據和行業數據,綜合運用語義理解、知識挖掘、知識整合與補全等技術,提煉出高精度知識,并組織成圖譜,進而基于知識圖譜進行理解、推理和計算等,在此基礎上,支持百度眾多產品,并且拓展出廣泛的應用場景。據悉,知識圖譜已經助力DuerOS(對話式人工智能系統)實現10大類目超過100種能力,為智能音箱、智能電視等各類終端產品帶來全面精準的人機交互問答能力。

    知識圖譜還能根據已有知識進行推理。例如,根據“爆炸或者燃燒物質和裝置不可以帶上飛機”、“酒精是爆炸或者燃燒物質”這兩個知識,推斷酒精不可以帶上飛機,當用戶輸入查詢之后,將直接反饋推斷結果。知識圖譜的加持,實現用戶與應用之間更智能的交互。

    人機交互AR

    在百度APP小靈AR界面上,諸如“北大紅樓名字的由來”等五四主題內容,“小靈”都可以對答如流。在現場以及百度APP“五四青年節”搜索結果頁都能參與的“通過人臉識別來測是什么花”活動,觀眾還可以通過百度APP掃描二維碼,讓小靈直接出現在觀眾的手機屏幕上,實現實時互動,這都是依托于百度AR Lab(百度增強現實實驗室)。百度AR在今年的開發者大會上推出了DuMix AR 3.0,在MVP部分定義場景,然后對內容進行感知,根據不同要求進行呈現,對目標進行跟蹤,最后通過人臉表情、肢體手勢、語音等進行人機交互,然后運用平臺工具對素材進行制作管理,完成上線,最后進入商業化運營。百度AR Lab的業務已廣泛覆蓋營銷、娛樂、教育、文化等各個領域。

    不得不說,“小靈”在晚會上機智又專業的首秀可謂圈粉無數。而這一切,都離不開百度大腦的多項AI技術的強大支撐。截至目前,百度大腦AI開放平臺開放了171項技術能力,涉及智能城市、智慧教育、無人駕駛等眾多領域。

    說到AI開放平臺,自然少不了騰訊。近日,2019“AI Everything Summit”峰會在迪拜國際貿易中心召開,騰訊集團高級執行副總裁劉勝義代表騰訊出席峰會并發表主題演講,提出“AI向善”的發展觀,他指出,在人工智能的時代,“人”更為重要,“AI向善”將幫助人類提升生活品質,為社會發展創造新的可能。騰訊持續探索將人工智能技術應用于尋回走失人員,打造“會尋人的AI”;在醫療健康領域,騰訊致力于打造“會救命的AI”;并且投身于“AI+農業”的應用探索,在食物、能源和水資源等問題上提供創新解決思路。

    不管應用的領域如何,各家企業都是以“人”為出發點,從自身的基因出發尋找合適的切入點,利用AI幫助人類提升生活品質,提出行業解決方案。相信百度和騰訊也會大膽嘗試,探索更多可能。

    本站互動交流QQ群:773168094:創意區 » 百度“小靈”首秀,AI為何能賺足眼球?

    分享到:更多 ()
    香港开奖琭场直播结果