<samp id="tgzrj"><video id="tgzrj"><nav id="tgzrj"></nav></video></samp>

    <samp id="tgzrj"></samp>
    <legend id="tgzrj"><font id="tgzrj"><tr id="tgzrj"></tr></font></legend>

      AI檢測AI:“矛”更利還是“盾”更堅_精選

      來(lái)源:科技日報時(shí)間:2024-08-16 18:39:17
      近年來(lái),人工智能(AI)技術(shù)推動(dòng)生產(chǎn)力快速發(fā)展,但同時(shí)也因技術(shù)濫用導致各種問(wèn)題。

      為監督AI技術(shù)使用,如今市面上不乏各類(lèi)用于檢測AI生成內容(AIGC)的工具,如普林斯頓大學(xué)學(xué)生開(kāi)發(fā)的GPTZero、斯坦福大學(xué)研究團隊推出的DetectGPT等。我國一些研究團隊也陸續發(fā)布各類(lèi)檢測工具,如西湖大學(xué)文本智能實(shí)驗室研發(fā)的Fast-DetectGPT。

      人類(lèi)的創(chuàng )作與AIGC之間存在哪些差異?AI檢測工具如何根據差異進(jìn)行識別?AI檢測工具如何應對越來(lái)越聰明的大模型?帶著(zhù)這些問(wèn)題,記者采訪(fǎng)了有關(guān)專(zhuān)家。

      2024世界人工智能大會(huì )暨人工智能全球治理高級別會(huì )議上,觀(guān)眾在參觀(guān)由人工智能生成的圖片

      AI創(chuàng )作套路化明顯

      “雖然大模型在不斷發(fā)展迭代,但到目前為止,AIGC與人類(lèi)的創(chuàng )作在用詞用語(yǔ)、邏輯語(yǔ)法等方面依舊存在明顯區別。”Fast-DetectGPT研發(fā)者之一、西湖大學(xué)文本智能實(shí)驗室博士生鮑光勝說(shuō)。

      在用詞用語(yǔ)上,AIGC有相對固定的偏好。“不難發(fā)現,一些詞語(yǔ)會(huì )反復在語(yǔ)段中出現。”鮑光勝舉例說(shuō),有研究發(fā)現,大模型應用于英語(yǔ)學(xué)術(shù)論文寫(xiě)作時(shí),“delve”(深入研究)一詞的使用頻率大大提高,這是因為大模型習慣用這個(gè)詞對語(yǔ)句進(jìn)行潤色修改。

      在邏輯語(yǔ)法上,AIGC慣常使用的一些語(yǔ)法搭配方式,在人類(lèi)創(chuàng )作中可能并不常見(jiàn)。“受模型建模的影響,AIGC有相對固定的行文邏輯和表述模式,且這些模式會(huì )不斷地被重復。人類(lèi)在行文上則更為靈活,沒(méi)有固定套路。”鮑光勝說(shuō)。

      北京大學(xué)信息管理系師生比較了AI生成與學(xué)者撰寫(xiě)的中文論文摘要。研究結果同樣顯示,AI生成的摘要具有較高同質(zhì)性和較強寫(xiě)作邏輯性,并慣用歸納總結等學(xué)術(shù)話(huà)語(yǔ)體系;學(xué)者撰寫(xiě)的摘要則具有顯著(zhù)個(gè)性化差異,使用凸顯實(shí)際含義的搭配較多,并常用與國家政策密切相關(guān)的詞語(yǔ)。

      哈爾濱工業(yè)大學(xué)一名研究生向記者講述了他使用大模型的實(shí)際感受:“當我給大模型提供一些材料讓它擴寫(xiě),它每次都用相同的套路——把給定的材料拆解開(kāi),分為若干點(diǎn)論述??傮w來(lái)說(shuō)感覺(jué)它寫(xiě)得比較‘僵’。”

      AIGC相對套路化的創(chuàng )作,可能會(huì )影響人類(lèi)的用語(yǔ)習慣。“隨著(zhù)越來(lái)越多人用AI創(chuàng )作或潤色文字,人類(lèi)會(huì )受到潛移默化的影響,這或將影響整個(gè)社會(huì )對語(yǔ)言的使用。”鮑光勝說(shuō)。

      三種路徑識別文本

      如何準確識別AI生成內容?鮑光勝介紹,目前主要有三種技術(shù)路徑進(jìn)行檢測,分別是模型訓練分類(lèi)器法(也被稱(chēng)為監督分類(lèi)器法)、零樣本分類(lèi)器法、文本水印法。“三種檢測方法本質(zhì)上都是利用AI檢測AI,且各有優(yōu)劣。”鮑光勝說(shuō)。

      模型訓練分類(lèi)器法,首先要收集大量人類(lèi)創(chuàng )作內容與AIGC,然后以此為基礎訓練一個(gè)能區分兩類(lèi)內容的分類(lèi)器。“這是目前被廣泛使用的一種方法,但缺點(diǎn)較為明顯。”鮑光勝解釋?zhuān)糜谟柧毞诸?lèi)器的數據有限,很難覆蓋所有類(lèi)型和語(yǔ)言的文本。分類(lèi)器在訓練數據覆蓋的文本領(lǐng)域或語(yǔ)言上檢測準確率較高,反之準確率則較低。而且,模型訓練往往需要較高成本,數據規模越大,訓練成本越高。

      相比之下,零樣本分類(lèi)器法不需要對機器進(jìn)行訓練,也無(wú)需收集數據。它利用已訓練好的大模型,抽取語(yǔ)言模型生成文本的特征,據此來(lái)區別人類(lèi)與機器。“似然函數是零樣本檢測法中比較常用的基準之一,它可以簡(jiǎn)單理解為一段文本在某個(gè)模型的建模分布中出現的概率。概率是一種特征,不同的概率體現了人類(lèi)創(chuàng )作內容與AIGC的差異。”鮑光勝進(jìn)一步解釋?zhuān)?ldquo;零樣本分類(lèi)通過(guò)綜合考慮多種函數特征來(lái)區分人類(lèi)創(chuàng )作內容與AIGC。”

      如今,很多大語(yǔ)言模型幾乎覆蓋了互聯(lián)網(wǎng)上的全部數據。因此,相比于模型訓練分類(lèi)器,零樣本分類(lèi)器在不同領(lǐng)域、不同語(yǔ)言的文本上表現較為一致。

      不過(guò),零樣本分類(lèi)器也存在明顯缺點(diǎn)。一方面,現有零樣本分類(lèi)器依賴(lài)生成文本的源語(yǔ)言模型進(jìn)行檢測,這意味著(zhù)如果是未知源模型生成的文本,分類(lèi)器就無(wú)法準確檢測。另一方面,為提高檢測準確率,零樣本分類(lèi)器往往需要多次調用模型,這增加了模型的使用成本和計算時(shí)間。

      “文本水印法則是一類(lèi)‘主動(dòng)方法’。區別于前兩類(lèi)方法,它不是檢測已生成的文本,而是在A(yíng)I生成文本時(shí)加入水印。人類(lèi)雖然看不出這些水印,但卻能通過(guò)技術(shù)手段檢測出來(lái)。”鮑光勝說(shuō),文本水印法的準確率較高,但缺點(diǎn)在于水印可能被人為弱化甚至移除。此外,對于無(wú)法訪(fǎng)問(wèn)模型內部結構的大語(yǔ)言模型,技術(shù)人員可能無(wú)法在生成內容時(shí)成功加入水印。

      檢測技術(shù)需不斷改進(jìn)

      “未來(lái),我們要不斷更新、完善現有技術(shù),力爭實(shí)現快速、準確、低成本檢測,在大模型這把‘矛’越來(lái)越鋒利的同時(shí),讓檢測技術(shù)這面‘盾’更為堅固。”鮑光勝說(shuō)。

      記者了解到,為提升檢測準確性,目前市面上的商用AI檢測軟件大多融合了多種技術(shù)手段。國內外研究團隊也在進(jìn)一步完善相關(guān)技術(shù)。

      例如,西湖大學(xué)文本智能實(shí)驗室團隊在DetectGPT基礎上研發(fā)的Fast-DetectGPT模型,可提升AI檢測準確性,縮短檢測時(shí)間。“Fast-DetectGPT與其他零樣本分類(lèi)器原理一致。其中一個(gè)創(chuàng )新點(diǎn)在于,我們提出通過(guò)條件概率曲率指標進(jìn)行檢測。”鮑光勝說(shuō),“與DetectGPT相比,Fast-DetectGPT在速度上提升340倍,在檢測準確率上相對提升約75%。”

      對AI檢測AI的前景,有兩種截然不同的觀(guān)點(diǎn)。一種觀(guān)點(diǎn)認為,未來(lái)AIGC將會(huì )與人類(lèi)創(chuàng )作極為相似,以至于檢測工具無(wú)法判別。還有一種觀(guān)點(diǎn)認為,隨著(zhù)技術(shù)發(fā)展,檢測技術(shù)或將趕超大模型技術(shù),實(shí)現對AIGC的有效識別。

      “目前,無(wú)論是AI生成的文字、圖片還是視頻,都在技術(shù)可識別的范疇之內。相較于文字,圖片和視頻甚至可以直接被專(zhuān)業(yè)人士肉眼識別。期待未來(lái)通過(guò)大模型技術(shù)的不斷進(jìn)步,推動(dòng)檢測技術(shù)發(fā)展。”鮑光勝說(shuō)。

      標簽:

      責任編輯:FD31
      上一篇:海外網(wǎng)評:“奧運經(jīng)濟”讓多領(lǐng)域消費收獲好成績(jì)
      下一篇:最后一頁(yè)

      精彩圖集(熱圖)

      熱點(diǎn)圖集

      最近更新

      信用中國

      • 信用信息
      • 行政許可和行政處罰
      • 網(wǎng)站文章

      久爱免费观看在线精品_亚洲综合一区二区三区_最新国产国模无码视频在线_中文字幕无码精品亚洲资源网久久

      <samp id="tgzrj"><video id="tgzrj"><nav id="tgzrj"></nav></video></samp>

      <samp id="tgzrj"></samp>
      <legend id="tgzrj"><font id="tgzrj"><tr id="tgzrj"></tr></font></legend>