谷歌旗下“深層思維”公司的研究人員設(shè)計(jì)了一種“水印”,,可以無(wú)形地標(biāo)記人工智能生成的文本,,并將其提供給數(shù)百萬(wàn)聊天機(jī)器人用戶,。該研究成果日前發(fā)表在英國(guó)《自然》雜志上,。
隨著大語(yǔ)言模型在質(zhì)量,、連貫性,、覆蓋范圍和專(zhuān)業(yè)性方面的進(jìn)步,區(qū)分其生成的高質(zhì)量合成文本和人工書(shū)寫(xiě)文本變得越來(lái)越困難,。鑒于大語(yǔ)言模型在教育,、軟件開(kāi)發(fā)和網(wǎng)絡(luò)內(nèi)容生成中的廣泛使用,人工智能生成文本的識(shí)別和歸屬對(duì)于確保安全和負(fù)責(zé)任使用該技術(shù)至關(guān)重要,。
各國(guó)都希望通過(guò)水印來(lái)識(shí)別人工智能生成文本并限制意外或故意濫用問(wèn)題,,以幫助鑒別和打擊虛假新聞和學(xué)術(shù)造假等,同時(shí)避免因使用人工智能生成內(nèi)容訓(xùn)練而導(dǎo)致未來(lái)模型質(zhì)量下降的問(wèn)題,。但迄今開(kāi)發(fā)的水印都較容易被移除,,或者用于欺詐。
此前,,“深層思維”公司已經(jīng)開(kāi)發(fā)出圖像水印技術(shù)——SynthID,,可以識(shí)別并應(yīng)用在人工智能生成圖像上。在此基礎(chǔ)上該公司開(kāi)發(fā)了一種被稱為SynthID-Text的文本水印技術(shù),,可以將水印應(yīng)用于文本,。
該技術(shù)將水印整合到大語(yǔ)言模型本身文本生成的步驟中,以一種隱秘但公式化的方式標(biāo)記模型選擇的單詞,,而這可以用密鑰檢測(cè)到,。與其他方法相比,,這樣產(chǎn)生的水印更容易被檢測(cè)到,而且應(yīng)用它不會(huì)減慢文本的生成速度和質(zhì)量,。此外,,由于密鑰復(fù)雜,移除水印或使用水印欺詐變得更加困難,,即使使用第二個(gè)大語(yǔ)言模型來(lái)解釋文本,,水印仍然可以被檢測(cè)到。
目前,,“深層思維”公司已將該水印技術(shù)開(kāi)源,,開(kāi)發(fā)人員可以將這種水印應(yīng)用于他們的模型。(記者 郭爽)
編輯:周大為