您好,登錄后才能下訂單哦!
小編給大家分享一下關于人工智能的簡介,相信大部分人都還不怎么了解,因此分享這篇文章給大家學習,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學習方法吧!
簡介
在跟非IT行業的朋友解釋人工智能總是一個比較費勁的事情,他們對這塊也有比較大的誤區,本人雖然不是什么知名人士,但也從事過一段時間相關內容的學習與研究,本篇文章就嘗試從較高的層面去討論一下人工智能以及它目前的局限。
我會以我比較擅長的NLP(自然語言處理)領域作為例子,下面都是我個人觀點,如有不對,還請斧正。
當前人工智能的本質
我們常說的人工智能通常指的是深度學習,因為近年大數據的興起,讓深度學習大展拳腳,但深度學習「理論層面的東西并沒有大的突破」,依舊是舊的東西,本質依舊是概率論與統計學。
這里以微軟小冰、蘋果Siri這些智能助手為例,它們的技術原理其實都是對話系統+語音識別。當我們說一句話給小冰時,小冰此時做了什么?
小冰接收到這句話時,首先會進行語音識別,所謂語音識別就是利用它此前訓練好的概率模型,計算這些語音數據對應了哪些文字,然后再進行對話預測,即這些文字下一句出現概率最大的文字是哪些,「小冰本身并沒有理解我說的話,它只是通過計算概率給出回答」。
訓練一個可以商用的聊天機器需要很多工程技巧的支撐,但本質就是概率模型這么回事,我們可以從微博上、從論壇上爬取大量的語料數據,這些數據是我們正常人類在網上留下的,進行復雜的預處理后,得到訓練數據,而訓練大致就是從這些數據中找到文字之間的規律。
舉個例子,比如一個100T的語料中,出現了很多次「快來關注HackPython」這句話,那么模型就會記住「關注」這個詞后大概率要接「HackPython」,但模型并沒有理解這句話,它并不知道「HackPython」是一個公眾號,并不知道「快來關注」是一種宣傳表述,它知道的就只有概率。
NLP領域中,無論是「LSTM」、「GRU」,還是「注意力機制」,亦或是當前比較熱門的「知識圖譜」,都是基于文本在玩概率游戲,不同的方式只是在使用訓練數據的信息時不同。
當前所有知名模型的本質都是如此,通過矩陣運算訓練數據來獲得某種概率分布,復雜模型的概率分布通常是高維的,這里又會引申出各種數學方法,如測度論、流形,但本質的思想依舊是想通過概率分布來描述訓練數據的特征。有了這些,對于同類的數據,就可以使用相同的概率分布去描述,從而實現所謂的「識別」。
獲得了概率分布后,其實還有問題纏繞著我們,如:為什么會訓練出這樣的概率分布?
這塊對我們來說依舊是黑盒,我們也不知道這些數據通過這種模型訓練后,為什么是這樣的概率分布,即不可解釋。
不可解釋性的問題讓深度學習在某些領域的使用受到一定的障礙,如金融領域,模型說這樣投,大概率賺錢,但你無法嚴格的去證明這個結論的可靠性,只能直觀的去解釋,這就會讓人猶豫,畢竟可能損失大量金錢。
同樣的,自動駕駛也受到模型不可解釋帶來的困擾,自動駕駛依賴于圖像識別技術。通過大量數據訓練出的圖像識別模型雖然有很高的識別率,但依舊存在問題,這點從「對抗攻擊」領域的研究可以看出,當我們改變圖像中少量的數據,圖像識別模型就無法識別或識別錯誤。因為我們無法從數據層面去解釋圖像識別模型的概率分布,所以不清楚它在什么情況會失效。
識別與理解的差異
通過前面的討論,可以知道,目前的深度學習做到的是「識別」,如語言識別、圖像識別等,而并沒有做到「理解」,這點從NLP領域可以很直觀的看出,最智能的對話系統表現的依舊強差人意。
我們通過大量的數據的訓練,在「識別」上已經有了不錯的效果,這些效果已經可以產生很大的作用,比如人臉識別用于安檢領域、車牌識別用于交通系統等等,「但關于理解的工作可能才剛剛開始」。
人工智能并不像我們想象的那么智能,無論是多么大的公司,推出多么先進的框架,什么自動調參、什么自動學習等牛逼的功能,本質都是如此,先進的框架只是讓我們更快、更好的獲得可以描述數據特征的概率分布,而這些概率分布并不能實現「理解」。
我們思考一下,人類是怎么做到「理解」的?
我們「理解」某個東西,通常指知道其背后抽象的概念,如「蘋果」這個詞,當我們看到這個詞時,腦中會浮現出「蘋果」相關的信息,這些信息并不來自「蘋果」這個詞,而是來自我曾經經歷的生活,這些生活給了我們相應的背景知識,而這些背景知識讓我們可以理解「蘋果」這個詞。
這些背景知識我們是怎么得到的?目前也還在研究。
這讓很多學者開始質疑當前深度學習的研究路徑是否正確,這里給出一個著名的討論來展現當下我們訓練模型的方式與自然界中真正學習方式的巨大差異。
日本的街頭有很多烏鴉,研究人員發現這些烏鴉會偷堅果來吃,但烏鴉本身無法破開堅果的殼,那它們是怎么吃到堅果果肉的呢?它們在電線桿上觀察十字路口的紅綠燈,當紅燈的時候,將堅果放在馬路上,然后飛走,等綠燈,綠燈時,車流走過,將堅果果殼碾碎,當下次紅燈時,烏鴉再飛過去悠閑的吃其中的果肉。
這件普通的事情表現了生物的學習其實只需要簡單的觀察就可以習得某個技能,這與深度學習學習方式完全不同,深度學習會利用大量的數據,然后反復的訓練試錯,使用試錯獲得的損失,利用梯度下降與反向傳播的算法去更新模型,最終得到可以描述數據特征的概率分布,而烏鴉沒有那么多命去試錯,也沒有那么多時間去試錯。
可以說,烏鴉通過少量的觀察「理解」了紅綠燈的規律,而深度學習獲得的模型無法做到。
自然界生物的學習方式與當前深度學習主流的學習方式之間具有的差異難以不讓人疑惑。
莫拉維克悖論
1980 年漢斯?莫拉維克提到:要讓電腦如成人般地下棋是相對容易的,但是要讓電腦有如一歲小孩般的感知和行動能力卻是相當困難甚至是不可能的。這便是著名的莫拉維克悖論(Moravec's paradox),這個悖論在當下依舊適用,簡單而言,「困難的問題是簡單的,簡單的問題是困難的」是當下人工智能的處境。
對計算機而言,實現邏輯推理、數學運算等人類高級智慧只需要相對很少的計算能力,而實現感知、運動等低等級智慧卻需要巨大的計算資源,這剛好與人類相反,對于感知、運動等,我們自身并不用費多少腦子就可以做好,而邏輯推導、數學計算這類問題卻需要思考很久。
如何讓人工智能具有「理解」能力?如何讓人工智能對真實世界有基本的背景知識與反應?
當這兩個問題解決了,我們才需要開始擔心,人類會不會被人工智能取代。
但,深度學習帶來的對數據特征的描述能力已經可以對一些職業產生致命的沖擊,如工廠的工人,加了圖像識別的機械臂可以很好的代替工人的大部分工作。
尾
如果你擔心一種技術或某件事情會對自己的產生影響,最好的方法就是去了解它,弄明白它的原理,而不是看各種媒體文章,他們只能擾亂視線,增加游戲難度。知道原理后,無知帶來的擔憂就會消散,自己也可以做出相應的調整。
文章雖然主要從NLP的角度去討論問題,但這些現象存在于不同的領域,如圖像處理、強化學習等。
以上是關于人工智能的簡介的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。