AI成精?谷歌AI機器人的背后
發(fā)布時間:2018-07-02 來源: 日記大全 點擊:
AI訂餐 一場機器與人類的真實對話
電話訂餐,相信很多吃貨們都使用過。不過大家可能沒有想過使用機器人來向商家訂餐,因為雖然只是簡單的對話,但是在對話過程中需要向商家確定諸如就餐時間、人數(shù)、包間等信息。另外還可能有許多“意外”發(fā)生,比如餐館預(yù)約人數(shù)太多,就需要臨時改變計劃,經(jīng)雙方協(xié)作溝通才能最終順利完成訂單。這些對于人類來說可能非常簡單,但如果全程是由機器人來完成的,我們就不得不驚嘆機器人的智慧了。谷歌的AI訂餐視頻展示中,AI機器人就通過語音電話和實體餐廳完成了訂餐活動,而且商家根本沒有察覺是在和機器人對話(圖1)。
AI訂餐的背后——自然語言處理技術(shù)
很多人意識不到一次簡單的訂餐活動對AI來說有多大難度。因為在對話過程中,AI機器人需要理解、思考人類的回話,并作出得體的回復(fù),這意味著機器人能夠完全讀懂并處理人類的自然語言。谷歌AI機器人是怎樣擁有這些“超能力”的呢?
一方面要讓AI可以“聽”懂人類的對話,就需要讓機器人熟悉人類的對話場景。谷歌科技人員準備了海量的對話場景,并通過這些場景對機器人進行訓(xùn)練(上述訂餐的例子中,谷歌就將我們常用的訂餐對話輸入到機器人的數(shù)據(jù)庫中進行訓(xùn)練)。通過海量的數(shù)據(jù)訓(xùn)練后,AI機器人基本熟悉人類某個場景的對話,就知道該怎么與對方進行交流,從而可以在接收對方的回復(fù)后選擇合適的語句進行回復(fù)。
另一方面借助AI強大的自我學(xué)習(xí)能力,它可以在海量數(shù)據(jù)訓(xùn)練后實現(xiàn)自我學(xué)習(xí)和提高。在谷歌展示的訂餐視頻中,AI機器人在整個對話中語氣非常自然,包括停頓、縮略語,甚至?xí)诨貜?fù)中增加一些看似“無用”的口語性語氣助詞“Mmhmm”、“uh”等,這些語氣助詞的出現(xiàn)非常自然。這是AI典型的自我學(xué)習(xí)能力,這種逼真的模擬場景讓對方根本不知道是在和機器人對話(圖2)。
為了讓機器人的發(fā)音顯得更加自然、逼真,谷歌借助強大的TTS引擎技術(shù),不僅可以使AI機器人的語音和人類的語音非常類似,還可以根據(jù)不同的情境控制語音的語調(diào),這樣使得AI的發(fā)音、語氣、語境水平和真正的人類相差無幾。在上述訂餐視頻中出鏡的就是谷歌智能助理Google Assistant,它成功地“騙”過人類,完成了一項人工電話訂餐(圖3)。
AI機器人成功訂餐視頻,展示的實際上是谷歌在自然語言處理方面的技術(shù)積累。谷歌賦予了AI機器人進行多輪自然對話的能力,也是通過這種多輪對話能力的延伸,谷歌聯(lián)合使用了一個級聯(lián)TTS引擎和一個生成式TTS引擎,來根據(jù)不同的情境控制語音的語調(diào),讓AI機器人的語音對話達到了和真正的人類相比都難以區(qū)分的地步。
當(dāng)然類似人工智能的應(yīng)用,同樣出現(xiàn)在谷歌的其他產(chǎn)品中。我們常用的Gmail新增了一種全新的智能回復(fù)功能——Smart Compose,通過機器學(xué)習(xí)理解一封郵件的上下文,這樣在你寫郵件時都不用將一個句子寫完,機器學(xué)習(xí)就能通過理解幫你補全你想說的話,實現(xiàn)非常智能的回復(fù)(圖4)。
AI智能 還可以帶給我們更多好處
從上述介紹可以看到,AI不僅可以理解人類的對話,而且可以根據(jù)人們的需要智能協(xié)助完成很多的工作。將上述AI訂餐機器人的技術(shù)應(yīng)用到大型超市、熱門景區(qū)等場所的前臺,就可以完全實現(xiàn)無人化操作,甚至可以提供比人工客服更好的導(dǎo)游服務(wù)。
一些APP上的人工智能,比如 Google Photos,可以幫你一鍵分享照片給同框入鏡的好友,這樣一起出游的朋友在完成合影照片上傳后,同框好友就會自動收到合影照片。再如Google Map運用圖像識別實景導(dǎo)航,這樣在手機上使用谷歌地圖導(dǎo)航時,前面商店、餐館、加油站的信息會自動顯示出來,成為一個非常智能的導(dǎo)航專家(圖5)。
當(dāng)然AI應(yīng)用場景還會出現(xiàn)在我們生活的方方面面。在手機上練習(xí)英語口語,每讀一句話,AI會給你打分;當(dāng)你洋洋灑灑寫完一篇作文,AI會圈出作文中出現(xiàn)的多詞、缺詞、錯詞和次序錯誤等……總之,隨著AI技術(shù)的發(fā)展,它必定會給我們的生活帶來各種意想不到的便利(圖6)。
熱點文章閱讀