過去一年,全世界的學生都恨上了一個名叫 Edward Tian 的人。他剛剛 22 歲,是普林斯頓大學計算機專業大四學生。
Tian 在 X 上發的個人照丨@edward_the6
恨意來自於他的作品——去年底放假時熬夜敲代碼,Tian 寫出了一個叫「GPTZero」的軟體。而 GPTZero ,就是個檢測「一段文本是否是 AI 生成」的應用。
https://gptzero.me/|應用頁面
GPTZero 發出來的第二天,Tian 的手機就「爆炸」了,各種咒罵蜂擁而至,很多人說他就是個「打小報告」的「狗腿子」——因為老師們以後會用 GPTZero 來檢查他們的作業是不是 AI 生成的。
讓人更恨的是,Tian 還因此拿到了 350 萬美元的風投基金,創辦同名的公司 GPTZero。
高校是什麼態度?
去年這會兒,ChatGPT 一問世就在全球迅速颳起了 AI 風暴。在幾秒鐘之內,它就可以輸出一篇相當工整的文章。有時,你甚至無法分辨,電腦那頭的到底是 AI 還是真人。
對於沒什麼「人味兒」的八股文作業,「AI 寫的」和「人寫的」,差距可能就更小了。
一些聰明的學生很快掌握了這種未來工具,用它來應付作業。沒有人可以確切地說出,已經有多少學生在使用 ChatGPT。
美國在線教育網站 Study.com 調查了 1000 多名 18 歲以上的學生,結果顯示,高達 89%的學生會用 ChatGPT 寫作業,53%的學生甚至會用它寫論文。但調查問卷總是不準確的,因為填寫者會撒謊。以 ChatGPT 的便利性來說,真實的數字可能會高得多。
圖源:Unsplash
另一邊是老師們的反制。一些老師認為 ChatGPT 是一種作弊工具,他們擔心學生們因此無法真正掌握學習內容。其中特別激進的一批人,只允許學生在教室裏手寫作業。
還有一些老師態度更開放些,把 ChatGPT 視為比搜尋引擎更優秀的學習資源,但他們也擔心 ChatGPT 會被學生濫用。
作為美國最大的公立學校系統,紐約的學校已經禁止學生通過校內網絡接觸 ChatGPT。這份禁用名單上,還包括牛津大學、巴黎政治學院、香港大學等一連串頂級高校。
也有一些大學質疑這種做法是否有效,畢竟學生們總是可以很容易地接觸到 ChatGPT,而禁用 ChatGPT 是否侵害了學術自由,也是一個值得商榷的問題。
無論如何,ChatGPT 的介入意味著,人們的教學方式正在改變。
做 GPTZero 前,他沒想到會火
Tian 在普林斯頓大學主修計算機,在寫出 GPTZero 前,他在自然語言處理實驗室研究了如何檢測人工智慧生成的文本。同時,他還輔修了新聞。在 BBC 實習時,他工作中的很大一部分就是核實新聞的真實性——假新聞一直都是存在的,但 AI 能力的大幅提升,已經讓假新聞越發泛濫。
Tian 說,以上這些經歷都是他研發 GPTZero 的動力:「實際上,這個工具的目標受眾是我自己,因為我們對網際網路上的虛假信息進行了大量調查,這個工具是非常理想的。」
圖源:Unsplash
GPTZero 的受歡迎程度有些讓人出乎意料。Tian 最初以為最多只會有幾十個人使用這款產品,但在幾個小時之內,就有超過 2000 人註冊了測試版,甚至導致了 GPTZero 所在的託管平台的崩潰。
發布一周後,就有超過 3 萬人使用了 GPTZero。截止到 2023 年 5 月,這個數字擴展到了 120 萬。
Tian 並非反對 AI:「這項技術令人難以置信,我相信這就是未來。但與此同時,我們就像打開了潘多拉魔盒。我們需要採取安全措施,以負責任的方式採用它。」實際上,以他目前取得的成就來說,他也是 AI 風潮的受益者。
GPTZero 本身就是一種人工智慧;在開發過程中,Tian 也藉助了基於 GPT-3 的編程輔助軟體 GitHub Copilot 的幫助。
GPTZero 啥原理?
GPTZero 宣稱對 AI 文本的準確率為 85%,對人類文本的準確率高達 99%。
如果從原理來理解 GPTZero 的話,「困惑性」(Perplexity)和「突發性」(Burstiness)是兩項關鍵指標。
從統計學的角度來說,人類文本和 AI 文本會呈現不同的統計特徵。GPTZero 會根據這種統計特徵為文本打分,分數越低,就越有可能是 AI 生成的文本。
具體而言,困惑性指的是文本中語句的隨機程度。畢竟相比混亂的人類而言,接受過大量文本訓練的 AI 已經形成了產生文本的範式。假如 GPTZero 接收到了它不熟悉的文本,產生「困惑」的 GPTZero 就更有可能判定這是人類生成的。
舉個例子,「你好,我是一個 AI __」,如果這個句子後面接的是「助手」,那 GPTZero 就不會產生困惑。但如果接的是「土豆」,GPTZero 就會更有可能判定,這個句子是人類寫的。
以數百字的文本長度來說,GPTZero 會分別計算出「文字總困惑度」、「所有句子的平均困惑度」和「每個句子的困惑度」,計算出一個綜合分數。
當這個分數大於 85 時,那這段文本就很有可能是人類寫的。
另一個關鍵指標突發性,則指的是某個句子、詞在文本中突然出現的現象。這是一個衡量文本全文句子長度和結構變化的參數。人類往往會有比較動態的寫作風格,由此產生的文本結構相對參差。另一方面,AI 會更傾向於使用更加一致的結構生成文本。同時,大模型也會使用相同的規則來預測下一次單詞,由此導致低突發性。
不過,Tian 也承認,GPTZero 會出現錯誤。就比如說,對於經過人工編輯的 AI 文本,GPTZero 還不具備檢測能力。
7 月,開發 ChatGPT 的 OpenAI 就關停了旗下檢測 AI 生成文本的 AI Text Classifier。根據官方 Blog,它只能正確識別 26%的 AI 生成文本。
與其糾結於檢測學生是否抄襲,提供文本的「可信度」可能是一個效率更高的方法。
GPTZero 最新的產品 Origin,就是一個集成到 Word 和瀏覽器中的插件。它可以跟蹤學生寫作過程、生成全周期的寫作報告,以向老師證明,學生是獨立完成寫作的。
圖源:Unsplash
今年春天,GPTZero 募集到了 350 萬美元的種子資金。有消息說,GPTZero 本來也在著名的風投基金 a16z 的關注名單中,但 a16z 並未參與此輪融資。比較微妙的是,這兩家公司的創始人對於 AI 有著相反立場。
a16z 的創始人 Marc Adreessen 曾經在 X 上發帖稱:「如果你寫不出比機器更好的東西,那你還寫什麼呢?」。
而 Tian 相信:「人類的文章中蘊含著一些美妙的東西,計算機永遠無法做到這一點。」
在監管範圍內擁抱?
Tian 在 X 上說:「任何學生都不應該因為使用 AI 而受到老師的懲罰……直到政策得到全面制定前。」
這種態度與最近多家香港大學的轉變有些不謀而合——既然無法禁止,不如在監管範圍內擁抱。
曾經禁止 ChatGPT 的香港大學已經宣布,在 9 月份的新學年中為師生免費提供多個 AIGC 工具,包括 ChatGPT 和 AI 繪畫軟體 DALL·E。
香港科技大學、香港理工大學、嶺南大學、香港城市大學等高校擁抱了 AI。
當然,這種免費福利是有前提的,學生必須註明哪些內容是由 AI 生成的。
故事也還沒完。有做 AI 檢測的,就有人做反 AI 檢測的。
在 GPTZero 發出後,就有一些狡猾的學生把攻略放在網上去,比如,用西里爾字母替換掉英文字母,就騙過了 AI 檢測……Tian 之後修補了漏洞。
比如,一個叫 Joseph Semrai 的史丹福大學新生就做了一個 app——WorkNinja。這個 app 可以生成文本,你拿去 GPTZero 檢測後如果發現被判定為「AI 生成」,就再返回去按「Rephrase (修改措辭)」 按鍵,文本會被改寫(比如同義詞替換)。
AI 的背後是人類,只要人類還存在,這場貓鼠遊戲就不會停止。
參考文獻
[1] https://www.youtube.com/watch?v=0GrS3Edsm-4
[2] https://news.gptzero.me/perplexity-and-burstiness-what-is-it/
[3] https://www.youtube.com/watch?v=JGYQg2snF34
[4] https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism?utm_source=twitter.com&utm_medium=social&utm_campaign=npr&utm_term=nprnews
[5] https://www.washingtonpost.com/technology/2023/08/14/prove-false-positive-ai-detection-turnitin-gptzero/?utm_campaign=wp_main&utm_source=twitter&utm_medium=social
[6] https://www.wired.com/story/ai-detection-chat-gpt-college-students/
作者:ttt
編輯:malt
如有需要請聯繫 [email protected]