居然有32%的人把AI當(dāng)成了人類！AI離智能還有多遠(yuǎn)？

稿件來(lái)源：發(fā)布時(shí)間：2025-01-17

歡迎來(lái)到科普中國(guó)特別推出的寒假精品欄目“給孩子的高新科技課”！

人工智能作為當(dāng)今最前沿的科技之一，正在以令人驚嘆的速度改變著我們的生活。從智能語(yǔ)音助手到無(wú)人駕駛汽車，從 AI 繪畫到機(jī)器學(xué)習(xí)，它為我們打開(kāi)了一個(gè)充滿無(wú)限可能的未來(lái)。本欄目將以通俗易懂的方式，用視頻和文字給孩子講述人工智能的原理、應(yīng)用及其對(duì)社會(huì)的深遠(yuǎn)影響。

快跟我們一起開(kāi)啟這場(chǎng) AI 之旅吧！

人工智能靠著自己強(qiáng)大的學(xué)習(xí)能力，對(duì)人類語(yǔ)言的理解、處理能力，給各個(gè)行業(yè)帶來(lái)翻天覆地的變化。

在享受人工智能帶來(lái)的便利的同時(shí)，有些人可能會(huì)產(chǎn)生一個(gè)疑問(wèn)。人工智能到底有多聰明呢？或者換句話說(shuō)，人工智能真的擁有了“智能”嗎？

這一集，我們就來(lái)說(shuō)一說(shuō)，AI 離智能還有多遠(yuǎn)。

圖靈測(cè)試

早在上個(gè)世紀(jì)人工智能誕生之前，一些科幻小說(shuō)里，就涉及到對(duì)機(jī)器人、外星生命的智能判斷。但之前對(duì)智能的探討，更多地聚焦于智能的定義層面。

即便在今天，想給“智能”一詞下個(gè)全面的定義也非常困難，存在各種各樣跨行業(yè)、跨領(lǐng)域的爭(zhēng)議。

在 1950 年，大名鼎鼎的數(shù)學(xué)家圖靈在論文《計(jì)算機(jī)器與智能》中提出了一個(gè)巧妙的想法，他并沒(méi)有從定義上去探討到底什么是智能，而是提出了一個(gè)更直接、更好操作的測(cè)試，來(lái)衡量機(jī)器是否具備了智能。這個(gè)測(cè)試，被圖靈稱之為“imitation game”，即模仿游戲，也就是被后人津津樂(lè)道的“圖靈測(cè)試”。

圖靈測(cè)試的具體方法如下，測(cè)試需要由兩方來(lái)完成，人類評(píng)估者和受試者。

受試者可能是一臺(tái)機(jī)器，也可能是一個(gè)真人。評(píng)估者并不知道受試者的真實(shí)身份，但可以通過(guò)文本信息的方式，跟受試者進(jìn)行交流。可以理解成，隔著屏幕聊一會(huì)天，然后判斷對(duì)方是不是人。

在這期間，機(jī)器會(huì)盡量偽裝成人類。經(jīng)過(guò)一段時(shí)間的交流之后，如果機(jī)器騙能騙過(guò) 30%的人類評(píng)估者，那就可以認(rèn)為它具有了智能。

想要做到這一點(diǎn)并不容易。畢竟一個(gè) AI 要盡量多地了解人類的語(yǔ)言和知識(shí)，才能更好地“偽裝”成人類。

另外，AI 還需要模擬人類的心理特征。比如，如果連續(xù)問(wèn) 5 遍“明天會(huì)下雨嗎”。如果對(duì)面是個(gè) AI，它可能會(huì)一遍遍耐心地回答你的問(wèn)題，而假如是個(gè)真人，可能在你問(wèn)到第三遍的時(shí)候，就已經(jīng)不耐煩了。

目前，已經(jīng)有聊天機(jī)器人通過(guò)了圖靈測(cè)試。其中最出名的，要數(shù)一款叫尤金·古斯特曼的聊天機(jī)器人了。

這個(gè)機(jī)器人偽裝成了 13 歲的烏克蘭小男孩參加測(cè)試。因?yàn)檫@個(gè)身份，人類評(píng)委覺(jué)得它有些問(wèn)題答得比較奇怪。但這是可以理解的，畢竟一個(gè)處于青春期的外國(guó)小男孩，難免會(huì)有些叛逆。

用這種方式通過(guò)圖靈測(cè)試，不免讓人覺(jué)得有一些討巧。也很難不讓人懷疑，通過(guò)圖靈測(cè)試的 AI，就真的意味著它們擁有了智能。

中文房子思想實(shí)驗(yàn)

事實(shí)上，在圖靈測(cè)試提出之后，就不斷有科學(xué)家對(duì)它的可靠性提出質(zhì)疑。最有代表性的，要數(shù) 1980 年，約翰·塞爾提出的中文房子思想實(shí)驗(yàn)。

這個(gè)思想實(shí)驗(yàn)是這樣的，假如把一個(gè)懂英文，但是對(duì)中文一竅不通的人關(guān)在一個(gè)房間里，房間外的人可以通過(guò)中文寫成的紙條，跟里面的人交流。

雖然房間里的人不懂中文，但有一本問(wèn)答手冊(cè)，手冊(cè)上記錄了幾乎所有可能碰到的中文問(wèn)題，以及對(duì)應(yīng)的答案，當(dāng)然了，答案也是用中文寫的。這個(gè)人只需要在手冊(cè)上找到問(wèn)題，把答案抄下來(lái)，遞給外面的人。

外面的人可能會(huì)覺(jué)得里面的人是一個(gè)中文天才。但其實(shí)，里面的人只是查手冊(cè)，至于這些問(wèn)題和答案到底是什么意思，他并不知道。所以，并不能說(shuō)這個(gè)人真的懂了中文。

這個(gè)思想實(shí)驗(yàn)，說(shuō)明了即便計(jì)算機(jī)能夠用人類的語(yǔ)言回答人類提出的問(wèn)題，但也并不意味著計(jì)算機(jī)真的在思考，只是按照人類給定的規(guī)則、手冊(cè)生成答案罷了——這樣的反駁顯然很有力量。

除此之外，其他反對(duì)的聲音也此起彼伏。所以到了今天，雖然圖靈測(cè)試依然存在，但它并不是判斷人工智能是否“智能”的唯一標(biāo)準(zhǔn)。

在 2023 年，AI21 Labs 公司對(duì)包括 Chat GPT 在內(nèi)的多種大模型進(jìn)行了一次線上圖靈測(cè)試，總共進(jìn)行了 200 萬(wàn)次對(duì)話，有 32%的人錯(cuò)把 AI 當(dāng)成了人類，說(shuō)明這些大語(yǔ)言模型已經(jīng)通過(guò)了傳統(tǒng)的圖靈測(cè)試。

現(xiàn)在，人們?cè)谠u(píng)價(jià) AI 智能的時(shí)候，可能會(huì)從邏輯推理能力、問(wèn)題回答的準(zhǔn)確性、錯(cuò)誤率、對(duì)特定內(nèi)容的理解力等幾個(gè)方面綜合打分，盡可能全面地做出判斷。

而對(duì)于具有特定功能的機(jī)器人，比如圍棋機(jī)器人 Alpha Go，也是用圍棋能力來(lái)對(duì)它進(jìn)行評(píng)估，而不是讓它來(lái)跟人類對(duì)話，這樣顯然是更合理一些。

相信在未來(lái)一定會(huì)出現(xiàn)更好、更客觀的方法來(lái)評(píng)價(jià) AI 的“智能”。這不僅能使得我們對(duì) AI 的能力有更直觀地了解，也給了我們更多機(jī)會(huì)，深入地思考到底“智能”的含義。

來(lái)源：科普中國(guó)

居然有32%的人把AI當(dāng)成了人類！AI離智能還有多遠(yuǎn)？