人工智能作為當(dāng)今最前沿的科技之一,正在以令人驚嘆的速度改變著我們的生活。從智能語(yǔ)音助手到無(wú)人駕駛汽車,從 AI 繪畫到機(jī)器學(xué)習(xí),它為我們打開(kāi)了一個(gè)充滿無(wú)限可能的未來(lái)。本欄目將以通俗易懂的方式,用視頻和文字給孩子講述人工智能的原理、應(yīng)用及其對(duì)社會(huì)的深遠(yuǎn)影響。
快跟我們一起開(kāi)啟這場(chǎng) AI 之旅吧!
人工智能靠著自己強(qiáng)大的學(xué)習(xí)能力,對(duì)人類語(yǔ)言的理解、處理能力,給各個(gè)行業(yè)帶來(lái)翻天覆地的變化。
在享受人工智能帶來(lái)的便利的同時(shí),有些人可能會(huì)產(chǎn)生一個(gè)疑問(wèn)。人工智能到底有多聰明呢?或者換句話說(shuō),人工智能真的擁有了“智能”嗎?
這一集,我們就來(lái)說(shuō)一說(shuō),AI 離智能還有多遠(yuǎn)。
圖靈測(cè)試
早在上個(gè)世紀(jì)人工智能誕生之前,一些科幻小說(shuō)里,就涉及到對(duì)機(jī)器人、外星生命的智能判斷。但之前對(duì)智能的探討,更多地聚焦于智能的定義層面。
即便在今天,想給“智能”一詞下個(gè)全面的定義也非常困難,存在各種各樣跨行業(yè)、跨領(lǐng)域的爭(zhēng)議。
在 1950 年,大名鼎鼎的數(shù)學(xué)家圖靈在論文《計(jì)算機(jī)器與智能》中提出了一個(gè)巧妙的想法,他并沒(méi)有從定義上去探討到底什么是智能,而是提出了一個(gè)更直接、更好操作的測(cè)試,來(lái)衡量機(jī)器是否具備了智能。這個(gè)測(cè)試,被圖靈稱之為“imitation game”,即模仿游戲,也就是被后人津津樂(lè)道的“圖靈測(cè)試”。
圖靈測(cè)試的具體方法如下,測(cè)試需要由兩方來(lái)完成,人類評(píng)估者和受試者。
受試者可能是一臺(tái)機(jī)器,也可能是一個(gè)真人。評(píng)估者并不知道受試者的真實(shí)身份,但可以通過(guò)文本信息的方式,跟受試者進(jìn)行交流。可以理解成,隔著屏幕聊一會(huì)天,然后判斷對(duì)方是不是人。
在這期間,機(jī)器會(huì)盡量偽裝成人類。經(jīng)過(guò)一段時(shí)間的交流之后,如果機(jī)器騙能騙過(guò) 30%的人類評(píng)估者,那就可以認(rèn)為它具有了智能。
想要做到這一點(diǎn)并不容易。畢竟一個(gè) AI 要盡量多地了解人類的語(yǔ)言和知識(shí),才能更好地“偽裝”成人類。
另外,AI 還需要模擬人類的心理特征。比如,如果連續(xù)問(wèn) 5 遍“明天會(huì)下雨嗎”。如果對(duì)面是個(gè) AI,它可能會(huì)一遍遍耐心地回答你的問(wèn)題,而假如是個(gè)真人,可能在你問(wèn)到第三遍的時(shí)候,就已經(jīng)不耐煩了。
目前,已經(jīng)有聊天機(jī)器人通過(guò)了圖靈測(cè)試。其中最出名的,要數(shù)一款叫尤金·古斯特曼的聊天機(jī)器人了。
這個(gè)機(jī)器人偽裝成了 13 歲的烏克蘭小男孩參加測(cè)試。因?yàn)檫@個(gè)身份,人類評(píng)委覺(jué)得它有些問(wèn)題答得比較奇怪。但這是可以理解的,畢竟一個(gè)處于青春期的外國(guó)小男孩,難免會(huì)有些叛逆。
用這種方式通過(guò)圖靈測(cè)試,不免讓人覺(jué)得有一些討巧。也很難不讓人懷疑,通過(guò)圖靈測(cè)試的 AI,就真的意味著它們擁有了智能。
中文房子思想實(shí)驗(yàn)
事實(shí)上,在圖靈測(cè)試提出之后,就不斷有科學(xué)家對(duì)它的可靠性提出質(zhì)疑。最有代表性的,要數(shù) 1980 年,約翰·塞爾提出的中文房子思想實(shí)驗(yàn)。
這個(gè)思想實(shí)驗(yàn)是這樣的,假如把一個(gè)懂英文,但是對(duì)中文一竅不通的人關(guān)在一個(gè)房間里,房間外的人可以通過(guò)中文寫成的紙條,跟里面的人交流。
雖然房間里的人不懂中文,但有一本問(wèn)答手冊(cè),手冊(cè)上記錄了幾乎所有可能碰到的中文問(wèn)題,以及對(duì)應(yīng)的答案,當(dāng)然了,答案也是用中文寫的。這個(gè)人只需要在手冊(cè)上找到問(wèn)題,把答案抄下來(lái),遞給外面的人。
外面的人可能會(huì)覺(jué)得里面的人是一個(gè)中文天才。但其實(shí),里面的人只是查手冊(cè),至于這些問(wèn)題和答案到底是什么意思,他并不知道。所以,并不能說(shuō)這個(gè)人真的懂了中文。
這個(gè)思想實(shí)驗(yàn),說(shuō)明了即便計(jì)算機(jī)能夠用人類的語(yǔ)言回答人類提出的問(wèn)題,但也并不意味著計(jì)算機(jī)真的在思考,只是按照人類給定的規(guī)則、手冊(cè)生成答案罷了——這樣的反駁顯然很有力量。
除此之外,其他反對(duì)的聲音也此起彼伏。所以到了今天,雖然圖靈測(cè)試依然存在,但它并不是判斷人工智能是否“智能”的唯一標(biāo)準(zhǔn)。
在 2023 年,AI21 Labs 公司對(duì)包括 Chat GPT 在內(nèi)的多種大模型進(jìn)行了一次線上圖靈測(cè)試,總共進(jìn)行了 200 萬(wàn)次對(duì)話,有 32%的人錯(cuò)把 AI 當(dāng)成了人類,說(shuō)明這些大語(yǔ)言模型已經(jīng)通過(guò)了傳統(tǒng)的圖靈測(cè)試。
現(xiàn)在,人們?cè)谠u(píng)價(jià) AI 智能的時(shí)候,可能會(huì)從邏輯推理能力、問(wèn)題回答的準(zhǔn)確性、錯(cuò)誤率、對(duì)特定內(nèi)容的理解力等幾個(gè)方面綜合打分,盡可能全面地做出判斷。
而對(duì)于具有特定功能的機(jī)器人,比如圍棋機(jī)器人 Alpha Go,也是用圍棋能力來(lái)對(duì)它進(jìn)行評(píng)估,而不是讓它來(lái)跟人類對(duì)話,這樣顯然是更合理一些。
相信在未來(lái)一定會(huì)出現(xiàn)更好、更客觀的方法來(lái)評(píng)價(jià) AI 的“智能”。這不僅能使得我們對(duì) AI 的能力有更直觀地了解,也給了我們更多機(jī)會(huì),深入地思考到底“智能”的含義。
來(lái)源:科普中國(guó)