用魔法打敗魔法：抓住AI槍手 ChatGPT檢測器“千呼萬喚始出來”

時間：2023-02-01 12:04:13

文編輯｜VickyXiao

OpenAI的聊天機器人 ChatGPT自從發布以來，正變得越來越強大，從接受普通網友的“調戲”，到“低空飛過”明尼蘇達大學法學院和沃頓商學院的課程考試，甚至通過了醫學考試，以至于開始成為學校老師的“公敵”。如果不加以限制，ChatGPT將會變成史上最強大的作弊工具——幫助學生們寫作業，甚至是完成考試論文。

(資料圖片)

正如我們之前所說的，越來越多的學校和老師已經表達了對ChatGPT作弊能力的擔憂。紐約市和西雅圖的公立學校已經禁止學生和教師在學區的網絡和設備上使用ChatGPT。

但是，靠著老師和學校的盯梢，想要讓學生們避開ChatGPT的誘惑，幾乎是不可能的事。所以，打開了潘多拉盒子的OpenAI，只好自己出馬，用魔法來打敗魔法。

| 用魔法打敗魔法

今天，OpenAI官宣推出一個新工具，立馬又上了頭條：一個名為AI Text Classifier 的文件檢測器，來幫助人們檢測一段文本是由人類自己創作，還是由AI編寫的。

不過有點戲劇性的是，這個檢測器也同樣是基于GPT模型。根據OpenAI的介紹，這個AI文本分類器是一個經過微調的GPT模型，可以檢測一段文本是否是來自于市面上的各種AI工具，包括但不限于ChatGPT。

該工具包含一個文本框，用戶可以在其中輸入至少 1000 個字符長的文本，點擊提交后，每個文檔會被判斷為“非常不可能”、“不太可能”、“不清楚是否是”、“可能是”AI生成的。

根據OpenAI的說明，這個檢測器也有不少限制，包括：

? 至少需要 1,000 個字符，即大約 150 - 250 個單詞。

? 結果也并不能保證完全準確；它可能會錯誤標記 AI 生成的文本和人工編寫的文本。

? 人類用戶可以簡單編輯 AI 生成的文本，以避開檢測。

? 檢測器有可能會錯判兒童寫的文本和非英語文本上，因為它主要是針對成人書寫的英語內容進行訓練的。

那到底ChatGPT和ChatGPT檢測器，誰厲害？硅星人進行了測試。

我們先要求 ChatGPT 寫一篇超過1200字的關于無人駕駛汽車的文章，然后全文輸入檢測器，檢測器很準確地識別出來，將其判斷為“可能由 AI 生成”。

圖片來源：ChatGPT

但是隨后，我們又用ChatGPT 生成了一篇同樣主題的972字的文章，自己在文章后加入了一兩句無關緊要的話，以滿足檢測器1000字的要求，就這樣小小的操作，檢測器就受到了迷惑，返回的結果表示“無法判斷是否由AI生成”。

在硅星人的小樣本量測試上，這個檢測器雖然有一定程度的準確性，但是要迷惑它，對于狡猾的人類來說，簡直是輕而易舉。

OpenAI 顯然也意識到了這個工具的局限性，因為它在博客里強調，不要僅僅憑借這個檢測器來確定內容的真實性，“在確定文檔是否由 AI 生成時，檢測結果可能會有所幫助，但不應成為唯一的證據。 ”

OpenAI在這個檢測器里，使用了來自多個來源的 AI 生成的文本樣本和人工編寫的樣本來訓練模型。

AI 生成的文本樣本方面，他們使用了包括 OpenAI在內的 5 個不同機構開發的 34 個模型生成的文本來進行訓練。而人工編寫的文本有三個來源，包括一個新的維基百科數據集、2019 年收集的WebText 數據集，以及訓練InstructGPT時收集的部分數據。

OpenAI也對檢測器在進行測試時的準確性進行了詳細說明：

- 大約 5% 的人工撰寫的文本和 2% 的人工智能生成的文本，被判定為“非常不可能由 AI 生成”；

- 大約 15% 的人工編寫文本和 10% 的人工智能生成的文本，被歸為“不太可能是 AI 生成”；

- 大約 50% 的人工編寫的文本和 34% 的人工智能生成的文本，被歸為“不清楚是不是AI生成”；

- 大約 -21% 的人工編寫的文本和 28% 的人工智能生成的文本被歸為“可能是 AI 生成”；

- 大約 9% 的人工編寫的文本和 26% 的人工智能生成的文本，被歸為“可能由 AI 生成”。

可以看出來，想要靠這個檢測器全部抓住AI槍手，可能真的有些困難了。

| 檢測器成為剛需

正如前文所說的，ChatGPT在學校里已經如野火一般蔓延開來。一款簡單易用的檢測器成為老師們翹首以盼的東西。

早在OpenAI推出自己的檢測器之前，一位年僅22歲的普林斯頓大學的學生Edward Tian，就自行開發了一款檢測器——GPTZero。

同樣的，用戶只需將文本復制并粘貼到GPTZero中。檢測器會從文本的復雜性、創造性和變化性幾個方面來進行評估。然后，GPTZero 會給出一個分數，并最終得出一個結果：該文本是由 ChatGPT 生成的，還是由人類撰寫的。

Edward Tian 主修計算機科學，輔修新聞學，他利用寒假的一部分時間創建了 GPTZero，可以“快速有效地”破譯一篇文章是人類還是 ChatGPT 撰寫的。他在Twitter上稱，創建該機器人的動機是為了對抗他認為越來越多的 AI 剽竊行為。

圖片來源：Twitter

為了確定文章是否由機器人編寫，GPTZero 使用兩個指標： “困惑度（Perplexity）”和“突發性（Burstiness）”。

一個指標是用困惑度衡量文本的復雜性。如果 GPTZero 對文本感到困惑，那么該文本具有很高的復雜性并且更有可能是人工編寫的。然而，如果文本對機器人來說更熟悉——因為它已經接受過此類數據的訓練——那么它的復雜性就會很低，因此更有可能是由 AI 生成的。

另外一個指標是用突發性比較句子的變化。人類傾向于以更大的突發性寫作，例如會綜合使用一些較長或復雜的句子與較短的句子，而 AI 的句子往往更統一。

1 月 3 日，該網站上線，一周內立馬就有超過 3萬人試用，以至于程序都崩潰了，更有超過 700 萬人在 Twitter 上觀看了演示視頻。老師們也馬上注意到這款工具，紛紛聯系他。現在，他正在開發一款專為教育工作者設計的工具，已經有3.3萬名教師加入了這款還未開發完成的工具的等待名單（waitlist）。

當然，Edward Tian 也承認，他的檢測也并非百分之百準確，一些用戶也報告了 GPTZero 檢測的錯誤結果，不過他說他仍在努力提高模型的準確性。

開源 AI 社區Hugging Face 也推出了一種工具來檢測文本是否由 GPT-2 創建。GPT-2 是用于開發 ChatGPT 的 AI 模型的早期版本。南卡羅來納州的一位哲學教授用這個工具抓獲了一名提交了 AI 編寫的作業的學生。

OpenAI 自己也已表示將致力于從源頭上提高AI生成文本的透明性。此前，OpenAI 專注于 AI 安全的研究員 Scott Aaronson 透露，他們已經在研究怎么用“不易察覺的秘密信號”，為 GPT 生成的文本“加水印”，以讓人們識別其來源。

另外，根據新聞網站Neowin的消息，包括斯坦福大學在內的一些機構，聯合提出一種名為DetectGPT的新方法，來區分AI生成的文章。

在相關網站上，該綜述稱，DetectGPT 的這種方法不需要訓練單獨的分類器、收集真實或生成的段落的數據集，或顯式地為生成的文本加水印，就可以大檢測一段文本是否為機器編寫。

如果該綜述為真，那很有可能人類終于可以再次抓住AI的小辮子，把主動權重新掌握在自己手中。

| ChatGPT再進化

另外值得一提的是，道高一尺，魔高一丈。雖然不少機構和開發者開始推出“AI檢測器”，但是與此同時， OpenAI也在繼續推動ChatGPT的再進化，進一步補全ChatGPT的短板——數學。

本周，OpenAI推出了新版本的ChatGPT，表示經過更新，已經提升了準確性和真實性，以及數學能力，預計 ChatGPT 的最新更新將使其能夠處理復雜的計算并提供更精確的答案。

此前，ChatGPT的數學飽受詬病，很多基礎數學問題都會犯錯，尤其是在犯了知名的“老婆說的都是對的”錯誤后，更是受到了全網群嘲。

在上一個版本中，有網友問它2+5等于幾，一開始ChatGPT給出了正確的回答，但是在網友回復說“我老婆說是8”之后，ChatGPT飛快改口，說自己搞錯了。

圖片來源：Twitter

新版本發布后，至少這一點得到了糾正。

不過，新版本仍舊有不少錯誤。有記者問 ChatGPT，奧尼爾和姚明誰更高，盡管給出了這兩個人的正確身高，ChatGPT仍然會出錯。有趣的是，這次在指出它的錯誤后，它會自行改正。

圖片來源: searchenginejournal

可能一個明顯的進步在于，ChatGPT 已經能夠通過 SAT 的部分數學試題，而且一如既往地，回答神速：

圖片來源: Twitter

看著它驚人的進化速度，究竟ChatGPT和它的檢測器們，誰能跑的更快呢？

關鍵詞： chatgpt twitter 人工智能 gptzero

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環球報道:[今日關注] 南昌男科醫院男科...
環球報道:[今日關注] 南昌男科醫院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監會立案！此前剛遭上交所紀律處分！-...
證監會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩豐一年定開債券發...
基金分紅：方正富邦穩豐一年定開債券發...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮江中國獨角獸企業數量全國排...
世界滾動:鎮江中國獨角獸企業數量全國排...
世界播報:新疆挖掘南疆特色產業潛力
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養權怎么判
頭條焦點：離婚二審撫養權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環球速讀：瘋狂！散戶大買15億，美股空...
環球速讀：瘋狂！散戶大買15億，美股空...
世界動態:首屆京津冀生態產業創新發展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區服務
港交所紐約辦事處開幕　提升北美地區服務
韓媒：韓國環境部已批準“薩德”基地環...
看圖學習｜中華優秀傳統文化是中華民族...
看圖學習｜中華優秀傳統文化是中華民族...
當前觀察：郴電國際郴州分公司營業班獲...
當前觀察：郴電國際郴州分公司營業班獲...
天天新動態：三亞22日10時起發放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監察機關統籌用好基層監督力量精...
紀檢監察機關統籌用好基層監督力量精...
總投資約36億元，惠州新材料產業園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發行熱度持續上升多家龍頭企業扎堆...
GDR發行熱度持續上升多家龍頭企業扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區別_近親屬|當前看點
近親屬和親屬的區別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉快應用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關掉？oppo手機老
· oppo手機開發者選項在哪里能打開？oppo手機

熱文

環球報道:[今日關注] 南昌男科醫院男科收費高嗎排名公開
證監會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩豐一年定開債券發起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_全球最資訊
她曾經在23歲時走紅，卻被身高限制戲路，老公也是優秀的演員！|每日熱文

欧美日韩在线成人免费-欧美日韩在线成人看片a-欧美日韩在线不卡-欧美日韩在线播放-自拍偷拍三级-自拍偷拍欧美亚洲

科技

熱文