當前位置：首頁 > 科技 > 網絡

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

來源：責編：時間：2023-11-02 17:12:35 319觀看

導讀有網友找到了GPT-4變“笨”的又一證據。他質疑：OpenAI會緩存歷史回復，讓GPT-4直接復述以前生成過的答案。明顯的例子就是講笑話。證據顯示，即使他將模型的temperature值調高，GPT-4仍重復同一個&ldquo

有網友找到了GPT-4變“笨”的又一證據。

他質疑：

OpenAI會緩存歷史回復，讓GPT-4直接復述以前生成過的答案。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

明顯的例子就是講笑話。

證據顯示，即使他將模型的temperature值調高，GPT-4仍重復同一個“科學家與原子”的回答。

就是那個“為什么科學家不信任原子？因為萬物都是由它們編造/構造（make up）出來的”的冷笑話。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

在此，按理說temperature值越大，模型越容易生成一些意想不到的詞，不該重復同一個笑話了。

不止如此，即使咱們不動參數，換一個措辭，強調讓它講一個新的、不同的笑話，也無濟于事。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

發現者表示：

這說明GPT-4不僅使用緩存，還是聚類查詢而非精準匹配某個提問。

這樣的好處不言而喻，回復速度可以更快。

不過既然高價買了會員，享受的只是這樣的緩存檢索服務，誰心里也不爽。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

還有人看完后的心情是：

如果真這樣的話，我們一直用GPT-4來評價其他大模型的回答是不是不太公平？

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

當然，也有人不認為這是外部緩存的結果，可能模型本身答案的重復性就有這么高：

此前已有研究表明ChatGPT在講笑話時，90%的情況下都會重復同樣的25個。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

具體怎么說？

證據實錘GPT-4用緩存回復

不僅是忽略temperature值，這位網友還發現：

更改模型的top_p值也沒用，GPT-4就跟那一個笑話干上了。

（top_p：用來控制模型返回結果的真實性，想要更準確和基于事實的答案就把值調低，想要多樣化的答案就調高）

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

唯一的破解辦法是把隨機性參數n拉高，這樣我們就可以獲得“非緩存”的答案，得到一個新笑話。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

不過，它的“代價”是回復速度變慢，畢竟生成新內容會帶來一定延遲。

值得一提的是，還有人似乎在本地模型上也發現了類似現象。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

有人表示：截圖中的“prefix-match hit” （前綴匹配命中）似乎可以證明確實是用的緩存。

那么問題就來了，大模型到底是如何緩存我們的聊天信息的呢？

好問題，從開頭展現的第二個例子來看，顯然是進行了某種“聚類”操作，但具體如何應用于深度多輪對話咱不知道。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

姑且不論這個問題，倒是有人看到這里，想起來ChatGPT那句“您的數據存在我們這兒，但一旦聊天結束對話內容就會被刪除”的聲明，恍然大悟。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

這不禁讓一些人開始擔憂數據安全問題：

這是否意味著我們發起的聊天內容仍然保存在他們的數據庫中？

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

當然，有人分析這個擔憂可能過慮了：

也許只是我們的查詢embedding和回答緩存被存下來了。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

因此，就像發現者本人說的：

緩存這個操作本身我不太擔心。

我擔心的是OpenAI這樣簡單粗暴地匯總我們的問題進行回答，毫不關心temperature等設置，直接聚合明顯有不同含義的提示，這樣影響很不好，可能“廢掉”許多（基于GPT-4的）應用。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

當然，并不是所有人都同意以上發現能夠證明OpenAI真的就是在用緩存回復。

他們的理由是作者采用的案例恰好是講笑話。

畢竟就在今年6月，兩個德國學者測試發現，讓ChatGPT隨便講個笑話，1008次結果中有90%的情況下都是同樣25個笑話的變體。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

像“科學家和原子”這個更是尤其出現頻率高，它講了119次。

因此也就能理解為什么看起來好像是緩存了之前的回答一樣。

因此，有網友也提議用其他類型的問題測一測再看。

不過作者堅持認為，不一定非得換問題，光通過測量延遲時間就能很容易地分辨出是不是緩存了。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

后，我們不妨再從“另一個角度”看這個問題：

GPT-4一直講一個笑話怎么了？

一直以來，咱們不都是強調要讓大模型輸出一致、可靠的回答嗎？這不，它多聽話啊（手動狗頭）。

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

所以，GPT-4究竟有沒有緩存，你有觀察到類似現象嗎？

參考鏈接： https://twitter.com/hammer_mt/status/1719150885559812379

文章出處：量子位

本文鏈接：http://www.www897cc.com/showinfo-17-16587-0.htmlGPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：潮州事故與車輛無關！自媒體回應被判向特斯拉道歉：永遠不會有

下一篇：網友母親網購一頭豬引熱議：坐空調車隔日達一周內死亡補發

標簽：

熱門焦點

Redmi Pad評測：紅米充滿野心的一次嘗試

從Note系列到K系列，從藍牙耳機到筆記本電腦，紅米不知不覺之間也已經形成了自己頗有競爭力的產品體系，在中端和次旗艦市場上甚至要比小米新機的表現來得更好，正所謂“大丈夫生居
最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬

來源 | 電商在線文｜易琬玉編輯｜斯問受訪店鋪：Ringdoll戒之人形圖源：微博@御座的黃山、“Ringdoll戒之人形”淘寶店鋪有關外貌的評價，黃山已經聽累了。生于1985年的他，哪
騰訊VS網易，最卷游戲暑期檔，誰能笑到最后？

作者：無銹缽來源：財經無忌7月16日晚，上海1862時尚藝術中心。伴隨著幻象的精準命中，碩大的熒幕之上，比分被定格在了14：12，被寄予厚望的EDG戰隊以絕對的優勢戰勝了BLG戰隊，拿下了總決
三星折疊屏手機去年銷售近1000萬臺今年目標定為1500萬

7月29日消息，三星率先發力可折疊手機市場，在全球市場已經取得了非常亮眼的成績，接下來會進一步鞏固和擴大這一優勢。三星在推出Galaxy Z Flip5和Galax
三星Galaxy Z Fold/Flip 5國行售價曝光：最低7499元/12999元起

據官方此前宣布，三星將于7月26日也就是明天在韓國首爾舉辦Unpacked活動，屆時將帶來帶來包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
2299元起！iQOO Pad明晚首銷：性能最強天璣平板

5月23日，iQOO如期舉行了新品發布會，除了首發安卓最強旗艦處理器的iQOO Neo8系列新機外，還在發布會上推出了旗下首款平板電腦——iQOO Pad，其最大的賣點
iQOO Neo8 Pro搶先上架：首發天璣9200+ 安卓性能之王

經過了一段時間的密集爆料，昨日iQOO官方如期對外宣布：將于5月23日推出全新的iQOO Neo8系列新品，官方稱這是一款擁有旗艦級性能調校的作品。隨著發布時
iQOO Neo8系列今日官宣：首發天璣9200+ 全球安卓最強芯！

在昨日舉行的的聯發科新一代旗艦芯片天璣9200+的發布會上，iQOO官方也正式宣布，全新的iQOO Neo8系列新品將全球首發搭載這款當前性能最強大的移動平臺
Android 14發布：首批適配機型公布

5月11日消息，谷歌在今天凌晨舉行了I/O大會，本次發布會谷歌帶來了自家的AI語言模型PaLM 2、谷歌Pixel Fold折疊屏、谷歌Pixel 7a手機，同時發布了Androi

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

GPT-4更笨了！一個笑話講八百遍：讓換新的也不聽

Redmi Pad評測：紅米充滿野心的一次嘗試

最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬

騰訊VS網易，最卷游戲暑期檔，誰能笑到最后？

三星折疊屏手機去年銷售近1000萬臺今年目標定為1500萬

三星Galaxy Z Fold/Flip 5國行售價曝光：最低7499元/12999元起

2299元起！iQOO Pad明晚首銷：性能最強天璣平板

iQOO Neo8 Pro搶先上架：首發天璣9200+ 安卓性能之王

iQOO Neo8系列今日官宣：首發天璣9200+ 全球安卓最強芯！

Android 14發布：首批適配機型公布

最新推薦

猜你喜歡

熱門推薦

相關資訊