當(dāng)前位置: 首頁(yè) ? 資訊 ? 產(chǎn)業(yè) ? 正文

人類正在被AI「幻覺(jué)」欺騙

作者：藍(lán)鯨科技朱俊熹來(lái)源：藍(lán)鯨TMT 92908/20

2025年，行至21世紀(jì)前四分之一，AI早已不是科幻電影中的概念，而是人人可用的工具。如果從一些機(jī)構(gòu)發(fā)布的統(tǒng)計(jì)報(bào)告來(lái)看，在全球超81億人口中，已有17億至18億人使用過(guò)AI工具，其中每天使用者約為5億至6億。特別是對(duì)25歲以下的年輕人而言，

標(biāo)簽： AI DeepSeek AI產(chǎn)品

但你有被AI生成的虛假信息欺騙過(guò)嗎？又或者說(shuō)，你意識(shí)到自己被騙了嗎？

譬如最近傳出的DeepSeek將在8月下旬發(fā)布R2模型的消息，雖然最終被證偽，但相關(guān)話題不僅登上社交平臺(tái)熱搜，還一度拉動(dòng)了AI概念股的上漲。追溯其傳播過(guò)程，最初是部分媒體在報(bào)道中引述了和DeepSeek產(chǎn)品的對(duì)話記錄。隨后，這些未經(jīng)官方核實(shí)的內(nèi)容又被一些AI搜索產(chǎn)品作為可信信源收錄，最終呈現(xiàn)出似乎已被多方印證的假象。

圖片來(lái)源：媒體報(bào)道

類似的情況并非個(gè)案。從“DeepSeek向王一博道歉”的烏龍事件，到用AI炮制的“三層游船倒扣江中30人墜江”謠言，過(guò)去一段時(shí)間以來(lái)，AI引發(fā)的假新聞層出不窮。

美國(guó)西北大學(xué)計(jì)算機(jī)科學(xué)博士生陳燦宇曾發(fā)起過(guò)應(yīng)對(duì)大模型時(shí)代虛假信息的相關(guān)項(xiàng)目，其研究方向正是真實(shí)、安全、負(fù)責(zé)任的大語(yǔ)言模型及智能體。陳燦宇告訴藍(lán)鯨科技，這類虛假信息可大致分為兩種：一是用戶惡意利用大模型生成的，另一類則是模型自身的幻覺(jué)所致，往往是無(wú)意的，卻可能在不知不覺(jué)中誤導(dǎo)用戶。

大模型的幻覺(jué)指的是其生成的內(nèi)容看似合理流暢，實(shí)際卻是虛假的、不準(zhǔn)確或不存在的信息，就像是人類在自信地胡說(shuō)八道。

幻覺(jué)問(wèn)題由來(lái)已久，且成因復(fù)雜。主流大語(yǔ)言模型采用自回歸生成機(jī)制，即通過(guò)前面的內(nèi)容預(yù)測(cè)下一個(gè)最可能的詞，它的目標(biāo)并不是事實(shí)準(zhǔn)確，而是語(yǔ)言流暢、上下文合理。同時(shí)，大模型的訓(xùn)練數(shù)據(jù)存在時(shí)效性限制，難以實(shí)時(shí)獲取到最新的信息，其中還可能夾雜了來(lái)自互聯(lián)網(wǎng)的虛假信息。即使目前可以通過(guò)對(duì)齊技術(shù)（如RLHF）、檢索增強(qiáng)生成（RAG）等手段來(lái)緩解，幻覺(jué)問(wèn)題依然難以被徹底根除。

學(xué)界此前曾認(rèn)為，推理模型能夠減少幻覺(jué)問(wèn)題，但實(shí)測(cè)數(shù)據(jù)卻并非如此。OpenAI的推理模型o3和o4-mini的幻覺(jué)率不僅高于前代推理模型，也超過(guò)了GPT-4o等非推理模型。DeepSeek推理模型R1的幻覺(jué)率也顯著高于V3模型。在5月版本更新時(shí)，DeepSeek特別強(qiáng)調(diào)稱，新版R1模型針對(duì)幻覺(jué)問(wèn)題進(jìn)行了優(yōu)化，在改寫潤(rùn)色、總結(jié)摘要、閱讀理解等場(chǎng)景中，幻覺(jué)率較舊版降低了45-50%左右。

一位AI算法工程師對(duì)藍(lán)鯨科技解釋稱，推理模型提升了最終答案的精確度上限，但中間過(guò)程可能存在極大的幻覺(jué)。他將其歸因于以DeepSeek為代表所采用的強(qiáng)化學(xué)習(xí)方法，這類方法主要關(guān)注在數(shù)學(xué)、代碼等有明確正答的任務(wù)上，模型給出的最終結(jié)果是否正確，而不關(guān)注中間推理步驟是否合理。

DeepSeek在R1技術(shù)報(bào)告中提到，模型訓(xùn)練中采用了基于規(guī)則的獎(jiǎng)勵(lì)系統(tǒng)，主要包括兩類獎(jiǎng)勵(lì)：一是準(zhǔn)確性獎(jiǎng)勵(lì)，用于評(píng)估模型的回答是否正確；二是格式獎(jiǎng)勵(lì)，看模型輸出內(nèi)容是否符合規(guī)定的格式規(guī)范。DeepSeek沒(méi)有選擇用神經(jīng)網(wǎng)絡(luò)來(lái)給模型的輸出或推理過(guò)程打分的獎(jiǎng)勵(lì)機(jī)制，以避免訓(xùn)練復(fù)雜化和獎(jiǎng)勵(lì)投機(jī)。

DeepSeek的橫空出世推動(dòng)了AI的普及，也放大了幻覺(jué)可能帶來(lái)的虛假信息風(fēng)險(xiǎn)。陳燦宇認(rèn)為，在大模型時(shí)代抗擊虛假信息需要多方合力，除了大模型廠商盡可能地降低幻覺(jué)率外，也要求平臺(tái)和用戶合理使用大模型。他建議，對(duì)于沒(méi)有相關(guān)技術(shù)背景的普通用戶，可以通過(guò)讓同一模型多次生成回答，或?qū)Ρ炔煌Ｐ偷慕Y(jié)果，來(lái)更好地辨別幻覺(jué)。

目前，許多C端AI產(chǎn)品還會(huì)在生成結(jié)果后附上參考來(lái)源，方便用戶進(jìn)一步驗(yàn)證。陳燦宇提醒道，引用來(lái)源也存在一定局限性?！耙?yàn)楝F(xiàn)在大模型有嚴(yán)重的虛假引用問(wèn)題，引用不準(zhǔn)確或者亂引用，可能會(huì)導(dǎo)致一些副作用，讓用戶更加盲從答案?！?/p>

前述AI算法工程師也表示，雖然可以通過(guò)調(diào)用搜索引擎或外部知識(shí)庫(kù)來(lái)緩解幻覺(jué)，但大模型降低了造假的成本，核心挑戰(zhàn)還是在于信息源和搜索引擎端的建設(shè)。

在科技社區(qū)中，另一種常用的減輕幻覺(jué)的方式是調(diào)節(jié)模型的溫度參數(shù)。具體而言，低溫度系數(shù)會(huì)讓模型生成更保守、確定性高的內(nèi)容，高溫度系數(shù)則會(huì)產(chǎn)生更隨機(jī)、富有創(chuàng)造性的輸出，同時(shí)也更容易出現(xiàn)幻覺(jué)。

多位受訪者均表示，在某些場(chǎng)景下，幻覺(jué)實(shí)際上是有利且必要的，它體現(xiàn)的是多樣性、發(fā)散性?！叭绻Ｐ筒徽f(shuō)胡話，它的創(chuàng)造性很有可能就不那么強(qiáng)了，這存在一定的權(quán)衡?！?/p>

免責(zé)聲明：本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息，并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性，信息僅供參考，不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有，如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之，本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者，視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596，謝謝。

首頁(yè)

資訊

財(cái)中號(hào)

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

熱點(diǎn)

國(guó)資

產(chǎn)業(yè)

券商

基金

金融

上市公司

財(cái)富

專題

人類正在被AI「幻覺(jué)」欺騙

從經(jīng)開(kāi)區(qū)、高新區(qū)和港區(qū)擴(kuò)容，看鄭州與中牟、滎陽(yáng)、新鄭糾結(jié)關(guān)系

首頁(yè)

資訊

財(cái)中號(hào)

品牌

專題

投資學(xué)院

發(fā)布文章

APP下載

人類正在被AI「幻覺(jué)」欺騙

您可能感興趣的文章