在新近發(fā)展的人工智能技術(shù)的幫助下,研究人員能夠分析大量的圖像、提取可以進(jìn)行排序和挖掘的數(shù)據(jù)來預(yù)測(cè)一些事情,比如某個(gè)社區(qū)的收入水平、政治傾向、購物習(xí)慣等。
據(jù)了解,來自斯坦福大學(xué)的研究人員們完成了一個(gè)雄心勃勃的項(xiàng)目——通過分析谷歌街景(Google Street View)上收集到的數(shù)百萬張照片,可以對(duì)社區(qū)投票模式作出準(zhǔn)確的預(yù)測(cè)。這一跡象表明,計(jì)算機(jī)能夠像文本分析一樣流利地進(jìn)行圖像分析。
雖然其他學(xué)術(shù)項(xiàng)目早已開始使用人工智能挖掘谷歌街景來獲取社會(huì)創(chuàng)見的見解,如街道變化,但是此項(xiàng)目值得注意是因?yàn)樵谡麄€(gè)過程中,AI軟件處理了大量圖像。
在斯坦福大學(xué)計(jì)算機(jī)視覺科學(xué)家Timnit Gebru的帶領(lǐng)下,研究人員使用軟件分析了近五千萬幅街景和位置數(shù)據(jù)的圖像。他們的目標(biāo)是找到可用于預(yù)測(cè)郵政編碼和分區(qū)(通常包含大約1000人)水平的人口統(tǒng)計(jì)數(shù)據(jù)。
從這些圖像中,他們能夠搜集到大約2200萬輛汽車(占全國所有汽車的8%),3000個(gè)郵政編碼和39000個(gè)投票區(qū)的信息。研究人員將這些數(shù)據(jù)與包括人口普查局的美國社區(qū)調(diào)查和總統(tǒng)選舉投票記錄在內(nèi)的其他資料交叉引用后發(fā)現(xiàn),他們能夠準(zhǔn)確預(yù)測(cè)鄰里的收入,種族,教育以及投票模式。
為了讓他們的人工智能算法準(zhǔn)確地對(duì)汽車進(jìn)行分類,研究人員通過招募來自Mechanical Turk等地方的數(shù)百人以及汽車專家來對(duì)其進(jìn)行訓(xùn)練,以識(shí)別出數(shù)百萬張圖片中的汽車。最終,他們的軟件能夠在短短兩周內(nèi)對(duì)5000萬張圖片中的汽車進(jìn)行分類?!都~約時(shí)報(bào)》稱如果是人類完成這項(xiàng)任務(wù)的話,至少需要15年的時(shí)間。
在《美國國家科學(xué)院院刊》上發(fā)表的一篇文章中,研究小組寫道,他們的技術(shù)可以作為美國社區(qū)調(diào)查的補(bǔ)充,這項(xiàng)調(diào)查每年的花費(fèi)都要超過2.5億美元。由于調(diào)查也是勞動(dòng)密集型的,調(diào)查員需要挨家挨戶地進(jìn)行調(diào)查,這意味著人口少于6.5萬的小地區(qū)往往會(huì)被忽視。隨著技術(shù)進(jìn)步,人口統(tǒng)計(jì)數(shù)據(jù)最終可能會(huì)實(shí)時(shí)更新。但研究人員指出,政策制定者需要小心確保數(shù)據(jù)只在社區(qū)層面收集,以保護(hù)個(gè)人隱私。