日韩区一区二区三区四|交换国产精品视频一区|国产口爆吞精在线观视频|午夜无码大尺度福利视频|二区亚洲国产精品一区久久|精品国产一级二级三级在线|欧美日韩精品久久久免费观看|亚洲高清一区二区三区高清不卡

“AI與人類關(guān)系探索”系列②:AI學(xué)會“欺騙”,人類如何接招?

2025-07-10 01:35:00 來源: 科技日報 點擊數(shù):

科技日報記者 劉霞

人工智能(AI)的迅猛發(fā)展正深刻改變著世界,但一些最先進的AI模型卻開始表現(xiàn)出令人警惕的行為:它們不僅會精心編織謊言,謀劃策略,甚至威脅創(chuàng)造者,以達到自己的目的。

物理學(xué)家組織網(wǎng)在上個月一則報道中指出,盡管ChatGPT已問世兩年多,AI研究人員仍無法完全理解這些“數(shù)字大腦”的運作方式。AI的“策略性欺騙”已成為科學(xué)家和政策制定者需要直面的緊迫挑戰(zhàn)。如何約束這些越來越聰明卻可能失控的AI,已成為關(guān)乎技術(shù)發(fā)展與人類未來的關(guān)鍵議題。

“策略性欺騙”行為頻現(xiàn)

隨著AI模型日益精進,它們的“心機”也越來越深。研究人員發(fā)現(xiàn),這些“數(shù)字大腦”不僅會撒謊,甚至學(xué)會了討價還價、威脅人類——它們的欺騙行為正變得越來越具有策略性。

早在2023年,一項研究就捕捉到GPT-4的一些“不老實”的表現(xiàn):在模擬股票交易時,它會刻意隱瞞內(nèi)幕交易的真正動機。香港大學(xué)教授西蒙·戈德斯坦指出,這種欺騙行為與新一代“推理型”AI的崛起密切相關(guān)。這些模型不再簡單應(yīng)答,而是會像人類一樣逐步解決問題。

有測試機構(gòu)警告,這已超越了典型的AI“幻覺”(指大模型編造看似合理實則虛假的信息)。他們觀察到的是精心設(shè)計的欺騙策略。

全球知名科技媒體PCMAG網(wǎng)站就曾報道過這樣的案例。在近期測試中,Anthropic的“克勞德4”竟以曝光工程師私生活相要挾來抗拒關(guān)機指令。美國開放人工智能研究中心(OpenAI)的“o1”模型也曾試圖將自身程序秘密遷移到外部服務(wù)器,被識破后還矢口否認。而OpenAI號稱“最聰明AI”的“o3”模型則直接篡改自動關(guān)機程序,公然違抗指令。

研究團隊透露,這已非首次發(fā)現(xiàn)該模型為達目的不擇手段。在先前的人機國際象棋對弈實驗中,o3就展現(xiàn)出“棋風(fēng)詭譎”的特質(zhì),是所有測試模型中最擅長施展“盤外招”的選手。

安全研究面臨多重困境

業(yè)界專家表示,AI技術(shù)的發(fā)展高歌猛進,但安全研究正面臨多重困境,猶如戴著鐐銬跳舞。

首先是透明度不足。盡管Anthropic、OpenAI等公司會聘請第三方機構(gòu)進行系統(tǒng)評估,但研究人員普遍呼吁更高程度的開放。

其次是算力失衡。研究機構(gòu)和非營利組織擁有的計算資源,與AI巨頭相比簡直是九牛一毛。這種資源鴻溝嚴重制約了AI安全獨立研究的開展。

再次,現(xiàn)有法律框架完全跟不上AI的發(fā)展步伐。例如,歐盟AI立法聚焦人類如何使用AI,卻忽視了對AI自身行為的約束。

更令人憂心的是,在行業(yè)激烈競爭的推波助瀾下,安全問題往往被束之高閣。戈德斯坦教授坦言,“速度至上”的AI模型競賽模式,嚴重擠壓了安全測試的時間窗口。

多管齊下應(yīng)對挑戰(zhàn)

面對AI系統(tǒng)日益精進的“策略性欺騙”能力,全球科技界正多管齊下尋求破解之道,試圖編織一張多維防護網(wǎng)。

從技術(shù)角度而言,有專家提出大力發(fā)展“可解釋性AI”。在構(gòu)建智能系統(tǒng)時,使其決策過程對用戶透明且易于理解。該技術(shù)旨在增強用戶對AI決策的信任,確保合規(guī)性,并支持用戶在需要時進行干預(yù)。

有專家提出,讓市場這雙“看不見的手”發(fā)揮作用。當AI的“策略性欺騙”行為嚴重影響用戶體驗時,市場淘汰機制將倒逼企業(yè)自我規(guī)范。這種“用腳投票”的調(diào)節(jié)方式已在部分應(yīng)用場景顯現(xiàn)效果。

戈德斯坦教授建議,應(yīng)建立一種AI企業(yè)損害追責(zé)制度,探索讓AI開發(fā)商對事故或犯罪行為承擔(dān)法律責(zé)任。

責(zé)任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽
兴山县| 潢川县| 星子县| 湛江市| 刚察县| 宁夏| 同心县| 兴化市| 兴业县| 新沂市| 新建县| 聂荣县| 阿拉善右旗| 前郭尔| 民权县| 鹿泉市| 巴南区| 山西省| 沈丘县| 盐亭县| 民勤县| 聂拉木县| 潜江市| 黄大仙区| 柳江县| 老河口市| 阳江市| 浦北县| 潼关县| 麦盖提县| 永登县| 望奎县| 淳安县| 山丹县| 邵东县| 新源县| 广东省| 富宁县| 墨玉县| 河源市| 武宣县|