一種新的論文偽造方式,即用同義詞替換常規(guī)用語以躲過查重,正在浮出水面。
法國研究人員對部分此類短語進(jìn)行了檢索,在引文數(shù)據(jù)庫中發(fā)現(xiàn)860多篇論文涉及此類情況。其中,500篇來自同一本期刊《微處理器和微系統(tǒng)》(Microprocessors and Microsystems,影響因子1.525)。
對這些論文進(jìn)行人工檢查后,他們發(fā)現(xiàn),這些論文還涉及引用虛假文獻(xiàn)、重復(fù)使用他人等問題。其中,大部分論文的作者來自中國。
最近,該雜志的出版商——愛思唯爾對其中400多篇論文表達(dá)關(guān)切,目前調(diào)查工作仍在進(jìn)行中。
近60%問題論文來自同一期刊
據(jù)Nature網(wǎng)站日前報道,今年4月,法國圖盧茲大學(xué)計算機(jī)科學(xué)家Guillaume Cabanac等人對論文中的奇怪短語產(chǎn)生了興趣。
這些短語通常有約定俗成的術(shù)語,但論文作者故意回避常規(guī)叫法,而用同義詞來替換,顯得非常奇怪。Cabanac等人稱之為“扭曲短語”。其研究結(jié)果于7月12日發(fā)布在arXiv預(yù)印本網(wǎng)站上。

計算機(jī)科學(xué)論文中的扭曲短語。截圖自自然網(wǎng)站
誠信研究調(diào)查人員說,這是一種新的偽造論文方法,這一研究可能只暴露了偽造論文的冰山一角。
為了解到底多少論文存在這類問題,研究人員在引文數(shù)據(jù)庫中搜索了30個扭曲短語,結(jié)果涉及860多篇文章。令人驚訝的是,其中有500篇論文都來自同一本雜志:《微處理器和微系統(tǒng)》。
“這是對科學(xué)的損害。你不能相信這些論文,我們需要找到并撤回它們。”Cabanac說。他們懷疑,這是使用了自動翻譯或文本轉(zhuǎn)換軟件的結(jié)果。
研究者借助了一種名為GPT的工具,它能識別文本是否由人工智能轉(zhuǎn)寫工具生成。他們利用GPT對《微處理器和微系統(tǒng)》和其他期刊上的一些摘要進(jìn)行篩查,并對被標(biāo)記的論文再次人工檢查后發(fā)現(xiàn),其中一些論文存在“嚴(yán)重錯誤”,如奇怪扭曲的寫作風(fēng)格、引用不存在的文獻(xiàn)、重復(fù)使用他人的圖像。
大部分問題論文作者來自中國
為更深入地了解問題,研究人員下載了2018-2021年間在《微處理器和微系統(tǒng)》上發(fā)表的所有論文。
分析顯示,2021年2月后,論文的平均接收時間比原來縮短5倍,發(fā)表的論文數(shù)量比此前發(fā)表總數(shù)還要多。
這些論文中有很大一部分來自中國的作者。還有一部分論文的提交日期、修訂日期和接收日期完全相同,大部分發(fā)表在該期刊的特刊上。
研究人員認(rèn)為這很可疑。不同于常規(guī)標(biāo)準(zhǔn)期刊,特刊通常由總編輯提出,由客座編輯監(jiān)督,專注于特定的研究領(lǐng)域。
除《微處理器和微系統(tǒng)》外,研究人員還在其他35種期刊的論文中發(fā)現(xiàn)了扭曲短語。
該研究論文寫道:“初步調(diào)查顯示,在主要數(shù)據(jù)庫中有數(shù)千篇帶有扭曲短語的論文被編入索引”,并補(bǔ)充說“其他科學(xué)領(lǐng)域的扭曲短語尚未被揭露”。
愛思唯爾“點(diǎn)名”400多篇論文,并展開調(diào)查
針對這些情況,《微處理器和微系統(tǒng)》的出版商——愛思唯爾發(fā)起了一項(xiàng)調(diào)查。7月中旬,愛思唯爾對該期刊6個特刊上的400多篇論文表達(dá)關(guān)切,涉及對特刊論文正在逐一“重新獨(dú)立評估”。截至目前,調(diào)查工作仍在進(jìn)行中。
愛思唯爾的一位發(fā)言人透露,調(diào)查發(fā)現(xiàn),這些作者可能使用了反向翻譯軟件來掩飾剽竊行為,這很可能是這些扭曲短語的來源。
調(diào)查還顯示,49篇被Cabanac等人標(biāo)記為可疑的論文,最初是提交給特刊的,也被客座編輯接受了,而后卻發(fā)表在了正刊上。聲明中提到,是應(yīng)作者的要求在正刊上發(fā)表的,這也是愛思唯爾調(diào)查的一部分。
著名學(xué)術(shù)“打假人”Elisabeth Bik認(rèn)為,“Cabanac的研究結(jié)果‘令人震驚’,這是一種非常新且令人不安的論文編造方式”。
澳大利亞悉尼大學(xué)分子腫瘤學(xué)研究者Jennifer Byrne表示,這可能是冰山一角,對于有些人工智能生成的、可信度更高的論文,更難發(fā)現(xiàn)其問題。
這并不是學(xué)術(shù)界第一次發(fā)現(xiàn)奇怪的用詞與問題論文之間的關(guān)系。
一項(xiàng)2015年發(fā)表于《語言和社會心理學(xué)期刊》的研究中,美國斯坦福大學(xué)的研究者對已撤回的253篇生物醫(yī)藥研究領(lǐng)域的文章進(jìn)行了分析。
他們發(fā)現(xiàn),問題論文讀起來更晦澀、專業(yè)術(shù)語更多,文章更含混不清。
不過,他們同時指出,語言識別并非揭示科研造假的完美方法,他們的試驗(yàn)準(zhǔn)確率僅為57.2%。誠信文章也有可能被“誤傷”,因?yàn)橛行┤耸枪室馄垓_,而有些人可能只是不擅長寫文章。
參考資料:
https://www.nature.com/articles/d41586-021-02134-0
https://arxiv.org/abs/2107.06751
https://www.sciencedirect.com/journal/microprocessors-and-microsystems/about/aims-and-scope
http://news.sciencenet.cn/htmlpaper/201512310245547337912.shtm
免責(zé)聲明:本網(wǎng)站所轉(zhuǎn)載的文字、圖片與視頻資料版權(quán)歸原創(chuàng)作者所有,如果涉及侵權(quán),請第一時間聯(lián)系本網(wǎng)刪除。
官方微信
《中國腐蝕與防護(hù)網(wǎng)電子期刊》征訂啟事
- 投稿聯(lián)系:編輯部
- 電話:010-62316606-806
- 郵箱:fsfhzy666@163.com
- 中國腐蝕與防護(hù)網(wǎng)官方QQ群:140808414



