虚构的论文

2014-04-11 16:26:35
来源: 时代周报
过去的几年里,120多篇由计算机自动生成的“论文”被提交给学术出版机构并得以发表。不久前,这些虚构的论文被一名法国计算机科学家检测出来,发现它们几乎全部来自中国。

本报记者 陈舒扬 发自北京

过去的几年里,120多篇由计算机自动生成的“论文”被提交给学术出版机构并得以发表。不久前,这些虚构的论文被一名法国计算机科学家检测出来,发现它们几乎全部来自中国。

事件曝光后,相关出版机构纷纷撤稿。但人们认为对学术造假行为的追究不该止于此。这些论文如何产生?作者为何人?这一荒诞离奇之事的背后,到底有什么样的逻辑和真相?

公众对学术不端往往采取零容忍的态度,但在学术界内部,却早已对各种学术不端的行为司空见惯。相较于内部举报,向公众和媒体曝光似乎成为更有效的监督方式。不管其中原因为何,不诚实的行为都会给社会带来有形无形的损害,而受害者将是所有人。

发现机器人论文

西里尔•拉贝决定将虚假论文事件公之于众,他认为这些欺诈行为应该得到更多的警告,尽管他不是十分清楚人们为什么会这么做。

拉贝是法国约瑟夫傅立叶大学的计算机科学家,他的研究课题之一便是学术论文鉴别。

不过拉贝也曾是“虚假论文”的制作者。早在2010年,拉贝虚拟了一个叫做IkeAntkare的作者,制造了102篇虚假的论文,来测试这些论文是否会被“谷歌学术”(GoogleScholar)收录,他的花招成功了,并且IkeAntkare还成为了世界上第21位被引用次数最高的“科学家”。

用虚假论文投稿,证明学术会议评审论文极其不严格的做法由来已久。2005年,麻省理工学院的研究人员发明了一个叫做SCIgen的计算机程序,这一程序可以在网上自由使用,任何人能用它快速生成一篇格式规范、图文并茂的“论文”,只不过其内容是词汇和句子的无意义组合。拉贝以IkeAntkare的名义提交的论文的真正“作者”便是SCIgen。

SCIgen的开发者表示这一程序的主要目的是“娱乐”。在SCIgen的官方网页上,开发人员建议人们用它生成论文并提交给那些群发广告邮件的学术会议,“这会给我们带来无穷的乐趣,事实上我们的一篇论文竟然被SCI(作者注:科学引文索引,是国际公认的进行科学统计与科学评价的主要检索工具)接受了!”

既然如此,“其他的学术文献数据库是否存在同样的问题?”拉贝告诉时代周报,他希望继续求证,但是不想再用“欺骗”的老办法,而是决定研发针对SCIgen论文的鉴别技术,直接找出这些由机器制造的论文。

“这些自动生成的论文是否也可以被自动检测出来?我的答案是肯定的。”拉贝说。2012年,他成功开发出了自己的鉴别技术,并将成果发表在《科学计量学》杂志上。

与此同时,拉贝利用自己的检测软件检测出了85篇由SCIgen生成的虚假论文,它们均被IEEE文献数据库收录。据了解,IEEE文献数据库主要涉及计算机科学、电机工程学和电子学等领域,隶属于美国电气和电子工程师协会(IEEE),后者是全球最大的国际性的电子技术与信息科学工程师协会。

拉贝将这一情况告知IEEE后,对方删除了这些论文,为此他当时并没有曝光此事。几个月后,拉贝又在IEEE文献数据库中发现了新的一批SCIgen论文,拉贝再次与对方联系,“不过这一次,他们好像自己已经发现了。现在IEEE数据库似乎已经被清理‘干净’了。”

差不多同时,拉贝在德国学术出版机构Springer的数据库中发现了另一批SCIgen论文,其中有一些是在2013年最新发表的。拉贝前后发现的SCIgen论文总共加起来有120多篇。

尽管拉贝的工具在检测SCIgen论文上十分有效,但也只能应对一时。他告诉时代周报,现在至少有两种SCIgen程序的翻版,一个用在数学领域,一个用在物理学领域。“市场上”是否还有其他论文生成器?没有人知道。

“就像对付那些剽窃行为一样,他们也该刊登公示,但看上去他们只是移除了这些论文了事。”拉贝说。今年年初,对出版方的处理方式感到不满的他向《自然》杂志披露了此事。

寻找中国“作者”

在拉贝发给时代周报的120多篇虚假论文中,除了两篇论文的署名作者来自伊朗,两篇来自台湾,其他的署名作者均来自中国大陆,它们几乎都是会议论文,以会议论文集的形式被上述两家数据库收录的。这些论文发表时间最早是2008年,最晚是2013年。

一名高校学者告诉时代周报,会议论文是在学术会议等正式场合首次宣读发表的论文,通常正式的学术交流会议都会出版会议论文集,属于公开发表,这体现出学术上的正规和严肃性。

《自然》杂志曾报道称,他们试图通过邮件跟论文作者和会议主办方取得联系,但鲜有回复,唯一一名回复的作者称不知情。但《自然》杂志认为,“至少其中一些人是真实存在的”。

为了证实这一存在,时代周报记者与少数署名作者取得了联系,其中几名作者告知了论文来历。

浙江某专科学院的一名教授表示,论文是自己的一名同事“帮助”发表的,自己不懂英文,对论文内容毫不知晓,更没有参加过编辑该论文的学术会议;时代周报联系上的这一同事,告知当初找的是论文代写代发机构,只需交2000元或3000元的“会议注册费”。

另一名哈尔滨某学院的副教授告诉时代周报,自己的论文也是“交钱委托别人做的”,并告知Springer出版方已经联系过自己,自己“做了解释”。

在时代周报致电江苏某工学院的一名作者时,他表示的确发现自己的论文在数据库里检索不到了,并询问记者发生了什么,在记者作出解释后,他自称时间过去太久、且投过的会议论文太多,回忆不起来了。直到记者将论文发过去,该作者才承认,当初的确是“别人帮投的”,并且分析说,可能不少虚假论文都是这种情况,“从写到发都有组织”,而当事人并不知道这些论文的内容。

另一些时代周报联系上的作者没有正面回应,有的表示“找错人了”,有的不予应答,有的表示时间太久记不得。

经时代周报核实,虚假论文名单中的署名,其身份不少是高校的教授、副教授,任职机构有全国重点大学,也有职业或专科院校。专业集中在计算机、信息科学和电子电气工程等领域。

值得注意的是,这120多篇虚假论文中,许多作者发表的虚假论文不止一篇,有的甚至先后发表了四篇。一篇2012年发表的论文还标明“得到中央高校基本科研业务费专项资金的支持”。

时代周报还发现,其中一个名叫郝汉舟的作者在2013年曾因学术不端行为被举报,国家自然科学基金委员会监督委员会对其进行过通报批评。

更多的作者未能取得联系或确认身份。“我不认为谁真正了解这些SCIgen论文的意图,人们必须一个个地去核查。我们甚至不知道是谁提交了这些论文。”率先报道虚假论文事件的《自然》杂志记者在回复读者留言时如是说。

“参加这些学术会议都是要钱的,这些作者怎么可能没有直接的利益目的?”长期关注学术不端问题的第二军医大学教授孙学军对时代周报说。

论文买卖生意

被发现的虚假论文几乎都来自会议论文集,由各种“国际学术会议”进行编辑,德国Springer出版社撤销的16篇虚假论文中,有多篇论文来自同一次“学术会议”。

时代周报拨通了其中一个名为“通讯、电子和自动化工程国际会议”组织方的电话、询问如何参加,对方告知今年暂时没有举办这个会议的活动,并推荐了其他两个将在近期举办的“国际会议”,这些会议都不需要报名者实地参加,只需要交会议注册费,以及提交论文。

经记者进一步的搜索发现,这类“国际学术会议”非常多,其宣传口径也大同小异,都会强调自己的会议论文会被相关学术数据库收录。

比如,一个名为“电路系统和电子工程国际学术研讨会(CSEE)”的会议网站上,用红色字体突出显示:“CSEE2014将被WIT工程科学出版,并被EI(记者注:工程索引,由美国工程信息公司编辑出版,历史上最悠久的大型综合性检索工具)检索,目前,该期刊2013年EI检索正常”,并附上检索截图。

该会议的注册费是3100元。而上述16篇虚假论文中,其中2011年发表的一篇就来自这一会议。

据时代周报记者了解,在科研圈内部,人们早已将这类会议概括为“垃圾学术会议”,其特征是,会议网站或征文通告中给出的联系方式通常只是邮箱或电话,没有地址;举办会议的目的只是获利,对收到的论文没有任何审稿程序,论文集的质量十分低下;会议服务很糟糕,组织方通常不希望作者参加会议,有的还承诺给不参加会议者一定的注册费优惠。

除了这类以组织国际学术会议为名的牟利行为,“代写代发论文”的广告也充斥着网络。一家“中介”给时代周报的报价是,发表能被EI检索的论文,版面费2800元,如果要代写,总共需要6000元。

当被问及写作者身份时,对方表示“我们有一个几百人的团队”,而当记者表示担心拿来投稿的是虚假论文时,对方称“我们有机检、人检,放心”。

事实上,论文生意早已不是新闻。去年11月,美国《科学》杂志曾以“中国论文发表市场”为题,报道了中国的论文买卖,揭露了一个繁荣的学术黑市。在这个市场上,许多有实质内容、甚至高质量的论文被标价出售。

而这120多篇虚构的论文,究竟由谁制作、被谁提交?由于时间相距已久和当事人的回避,难以进一步追究。从已了解的情况看,最大的一种可能是,这些虚假论文是繁荣的学术黑市上最低等级的商品。那些当初花钱购买论文发表的人,没有得到靠谱的服务,由于法国人拉贝的发现和检举,他们的论文最终被撤销。

谁是受害者

“如果是学生写篇论文,加上我的名字,我觉得是可以的,但是没想到是这种情况。这是在害我。”上述浙江某专科学院的教授、两篇虚假论文的“作者”有些激动地对时代周报解释。他承认,当初答应让人帮忙发表论文,是因为年度考核的压力。他告诉记者,年度考核时,多发论文能够加分,考核结果就有可能“上一个级别”。

但是两篇论文并没有起到作用,该教授表示,后来才知道这种会议论文已不被学校承认,而且自己很快要退休,这些论文对自己没有任何价值。除了表达后悔和歉意,他强调自己并未因此得到任何利益,反倒是受害人。

上述江苏某工学院的教师告诉记者,发论文一般都是为了满足评职称的需要和完成“任务”,自己当初“主要是为了完成任务,找人发能快一点”,以及“各个学校都把科研当做很重要的指标”,不过他也表示,自己所在学校当年发会议论文还算数,现在已经不算了。

据记者了解,在许多学科领域,学术会议论文集的档次通常被认为低于正规学术期刊,学术论文集的质量基本取决于会议组织方把关是否严格,这也是垃圾学术会议大行其道的原因,许多学校早已不承认会议论文。

有评论人士指出,对于科研能力较弱的学校,不承认会议论文意味着论文数量大幅减少,在评比和排名中会显著下降,因此只有那些有科研实力的学校才有底气拒绝会议论文。时代周报查阅发现,120多篇虚假论文的作者,多是一些专科院校的师生,综合性大学的相对少见,重点大学的更少。

尽管没有任何含金量的论文也可以通过会议论文集被某些数据库收录,但仍有“失信”的交易。时代周报在网络上发现了对一些学术会议的“申讨”:交了钱的学生们在EI数据库里检索不到自己的论文。而当记者电话咨询某“国际会议”的工作人员时,被对方误解为是前来追问论文发表履行情况的。由此看来,并非所有“会议”都能百分百实现承诺。

如果不是虚假论文被揭发,如果会议组织方也能“守信”,论文发表的造假行为似乎没有明确的受害者,科研人员、中间商、“会议”组织者都从中获利。真正受到损害的,或许是中国的学术声誉。《科学》杂志对中国论文买卖的深度报道,让关心学术道德问题的国内学者感到尴尬,第二军医大学教授孙学军曾撰文感叹:“论文交易会把中国学者们的脸面丢尽。”

发表,或者出局

中国是科研论文发表大户,各种学术文献数据库的数据显示,中国人的论文数飞速增长,官方媒体几年前就自豪地报道:“我国在国际顶尖学术期刊上发表的论文数量大幅上升,居世界第二”。

孙学军曾总结,论文买卖现象多被归罪于两点,一是研究生扩招,二是国内的学术评价标准,一切向论文成果看齐,计件式管理学者业绩推动了论文交易市场的繁荣。

国家自然科学基金委员会主任、浙江大学教授杨卫去年底曾在《科学》杂志撰写社论,将导致当前中国科研环境不健康的因素归纳为“占据了大部分经费来源的竞争性科研基金带来的经济诱惑”、“重数量而非质量的方法衡量学术水平”和“基于绩效的补贴收入”。

盲目追求论文发表数量,以及学界对此的抗议,并非中国学术界独有。“发表或者出局(publishorperish)”,是一句描述学术界面临的发表压力的习语,最早流行于美国,指科研工作者必须高产地发表学术成果,才能维持自己的职业生涯。

捅出虚假论文事件的拉贝对时代周报表示:“这些作者也可以被看作是盲目和愚蠢的管理制度的受害者,或者至少是这一管理制度的合乎逻辑的结果,这一管理体制强加给人一些荒谬的规矩。当然,这是一种解释,但是否可以成为开脱的理由?某些情况下,或许可以。”

“研究人员面临的评估压力正在改变学术出版的进程。”拉贝评价道,“知识的传播是学术的核心,如今在学术的‘核心’里正发生着一场‘垃圾战争’,科学家们在压力之下生产出数量越来越多意义却越来越小的出版物,包括那些并非毫无意义的真论文。”拉贝指出,在物理学、计算机科学、科学计量学、文献计量学等领域,企图用数字去衡量学者的学术水平,是在扰乱学术本身。

近几年来,国际上在逐步探讨用更合理的方式评价科学家的工作。2013年5月,78个科学组织的155位科学家签署了关于科学评价的旧金山宣言。这是一份2012年12月在美国细胞生物学协会会议上起草的文件。宣言认为,科学界应该停止使用“影响因子”(注:国际上通行的期刊评价指标)评价科学家个人的工作,影响因子不能作为替代物用于评估科学家的贡献,以及招聘、晋升和项目资助等的评审。

外媒报道称,汤森路透正在与中国自然科学基金、科技部的中国科学技术信息研究所和教育部合作,一起寻找评价作者的其他方法。

至于中国教育和学术界的应对,杨卫在上述社论中表示,“如今中国科协和教育部已经开展了一项大规模运动,训练研究生、博士后以及年轻教员的科研诚信。中国科学院、中国科协和国家自然科学基金委起草了新的道德守则以规范生命科学领域的研究者。中科院与许多重点高校重新审核了评职标准,更加重视研究质量、而非仅仅关注论文数目。”




 

本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com

相关推荐
北京半马调查结果公布,特步就报名失误道歉
疯狂小杨哥不想当网红?减少直播带货场次,首部短剧开拍
甘肃银行资产突破3800亿元,去年净利润6.45亿元
联想向AI要增长:六年投资超百亿元,杨元庆能定义AI PC吗
扫码分享