1月16日消息,據(jù)國外媒體報(bào)道,阿里和微軟各自開發(fā)的AI(人工智能)模型,在日前舉行的斯坦福閱讀測試中勝過人類。

在上周進(jìn)行的測試中,參賽公司讓各自的人工智能系統(tǒng)解答斯坦福問答數(shù)據(jù)集(Stanford Question Answering Dataset)的提問,該數(shù)據(jù)集評估閱讀理解能力。計(jì)算機(jī)的答案被與普通人的答復(fù)進(jìn)行比較,然后據(jù)此排名。
該項(xiàng)測試提出的問題包括:“尼古拉特斯拉(Nikola Tesla)是什么種族的人”,以及“亞馬遜雨林有多大?”
斯坦福大學(xué)的測試題基于500多篇維基百科文章編制而成,旨在通過這套試題梳理出線索,看機(jī)器學(xué)習(xí)模型是否能夠在經(jīng)過大量信息處理后給出問題的確切答案。
這些題目所構(gòu)成的試卷被認(rèn)為是當(dāng)前世界檢測機(jī)器閱讀水平的最權(quán)威標(biāo)準(zhǔn)之一。
微軟和阿里巴巴開發(fā)的AI模型以微小優(yōu)勢勝出,在回答的精確匹配度上比人類的82.3%高出幾個基點(diǎn)。
阿里數(shù)據(jù)科學(xué)研究院的自然語言處理首席科學(xué)家Luo Si稱,這個勝利是一個里程碑,該技術(shù)有很多用途,包括客戶服務(wù)、博物館講解、醫(yī)療查詢,其中一些在全球范圍內(nèi)已經(jīng)由聊天機(jī)器人(chatbot)處理。
類似的技術(shù)已被用于買家提出的常見問題(比如“我的包裹在哪里?”)。在阿里的光棍購物節(jié)期間,這類問題會大量涌入。
下一篇:Gartner:人工智能將改變個人設(shè)備領(lǐng)域的游戲規(guī)則上一篇:樂高與騰訊達(dá)成戰(zhàn)略合作 推出首個兒童數(shù)字體驗(yàn)系統(tǒng)性解決方案
責(zé)任編輯:黃焱林
相關(guān)推薦
美國科學(xué)家訓(xùn)練AI,用路上車輛判斷人們的政治立場
近日,斯坦福大學(xué)的科學(xué)家團(tuán)隊(duì)開發(fā)了一種AI人工智能模型,能夠通過谷歌街景View圖像數(shù)據(jù)的訓(xùn)練,來準(zhǔn)確地判斷各個地理區(qū)域的社會結(jié)構(gòu)組成。比如通過查看人們駕駛的車輛型號品牌等,研究者的深度學(xué)習(xí)網(wǎng)絡(luò)模型就能夠判斷出這一社區(qū)的種族、政治觀點(diǎn)和經(jīng)濟(jì)的構(gòu)成。此AI模型采用卷積神經(jīng)網(wǎng)絡(luò)方法,能夠進(jìn)行深度學(xué)習(xí),并通過數(shù)據(jù)和圖像的訓(xùn)練,讓AI構(gòu)建街景圖像