论文查重利益链繁复:失灵的“测谎仪”
■我们的记者刘和宋
每当毕业临近,学生手中的每一份试卷都将面临一次“毕业考试”——试卷考试。所谓的重复检查是指通过软件检测毕业论文的重复率和相似度。如果复读率太高,学生将面临诸如推迟辩护和取消辩护资格等制裁。
为了通过一次测试,许多毕业生会在网上购买软件“自测”。记者在淘宝上输入“纸质搜索”进行搜索,会有100多页的产品,价格从1元到几百元不等。按照销售量的顺序,一个月有10个以上的周转单位。
一方面,这块蛋糕越来越大,已经逐渐成为一个产业。另一方面,缺乏监管,而且有许多地下运河。然而,学生们仍然渴望这样。魔法是什么?机械测试能抑制纸张腐败吗?考虑到这些问题,记者进行了深入的调查。
从调查中得出的利益链
从鱼龙混杂、真假难辨,到挖掘窃取和转移论文牟利的“隐性渠道”,再到淘宝网上商店的一系列“再强调”售后服务,完整的产业链清晰可见,隐性利益链也隐约可见。
一篇在线论文评论将王芳(化名)拖入了他最初一步步生活的无底漩涡。用她的话说,“它毁了我的毕业和工作。”
在她的导师和同学眼中,王芳都是一个标准的“学生恶霸”。她的导师对她的评价是“认真认真地做好学术工作,不丧失敏感性”。她的硕士论文“元语言学的社会认知”也受到专家们的青睐。为了不断改进,确保自己的论文达到优秀毕业论文的复读率要求,她花了250元在淘宝上查看论文的复件。
4月份,她的论文被选入国外考试,但结果出乎所有人的意料。外部审判报告称她“涉嫌剽窃全文”这份报告提供了一篇文章的截图,内容与她在网站“道客巴巴”上的内容相同,并且同一篇文章也被上传到了百度图书馆。经过仔细比较,她发现论文没有署名,与她上传到网上商店的空白版本完全一样。证据指向淘宝店主。
为了摘掉那顶抄袭的大帽子,为了洗清自己的罪名,她多次去找店主,但淘宝店主坚持说她没有这么做。经过几次谈判,她发现自己被店主弄昏了,而“24小时开机”电话只有嘟嘟嘟的忙音。绝望中,她报了警。在警方的帮助下,该网站取消了网上的相同文章,但更难证明这些文章是淘宝店主上传的。另一方面,消除剽窃的影响并不容易。如果她被认定为剽窃,她可能面临延期甚至无法完成工作的危险。
学校和学院的听证会从4月持续到6月。一轮又一轮的证据几乎耗尽了她的全部精力和耐心。虽然她证明了论文对她来说是原创的,并且成功地毕业了,但是她失去了找工作的黄金时期,错过了一份好工作。
王芳的经历只是该报调查的冰山一角。它的背后是一个发达的产业链。
"去搜查你的文件,看看你是否成功了?"8月15日,刚刚毕业的小李在他师傅的同学中燃起了熊熊大火。许多学生发现他们的硕士论文张贴在网上。在这个名为“提交文件赚钱”的文件分享网站上,小李也发现他的文件注定要挂在同一个账户下。他还发现,这个账户已经上传了90,000多篇本科生和硕士论文,这些论文的下载价格从10到30金币不等。“7月份提交给学校的论文的电子版和纸质版目前无法在中国知网上获得。这些人是怎么拿到我们的文件的?”小李充满了疑虑。
就在他不知所措的时候,小李想起他和他的同学在回复之前去淘宝网上商店购买过查重服务,在一些研究生论坛上,他经常看到一些帖子的标题是因为低价出售论文而遭受损失,而且没有任何证据。
对此,一位自称“相当正规”的淘宝店主并不感到意外。他坦率地承认,虽然他没有做这种生意,但目前这种“变废为宝”的偷纸行为已经成为这些商店的一个重要副业,给他们带来了大量利润。
在上传小李论文的“提交文件赚钱”网站上,记者发现只要上传一份文件,用户就可以获得20分,1000分可以兑换1元人民币。如果用户上传的文件质量高,网站也会增加该文件的奖励点数。这些文件标有100到300点的价格供人们下载,上传者可以从每次下载中获得80%的收入。
在网站的上传名单上,全年占据榜首的用户大多是纸质上传者,上传数量为数万。由于工作人员有限,不可能逐一检查网站是否有可疑来源的论文,这更多地取决于上传者的自律。该网站在显眼的地方发布了一则通知,称“未经授权,不得上传任何涉及侵犯版权的文件”。
许多知名上传网站的情况更糟糕。如此无用的监管使这个地方成了文件被盗的灾区。
对于第一次接触到重复检查系统的大学生来说,危险不仅在于他们的论文可能被非法出售,还在于那些接连出现的虚假重复检查测试就像无底洞。只要他们倒下,他们就可能无法按时毕业。
淮海工学院图书馆员王琪芸说:“学术不端行为检测系统的核心在于其巨大的资源库。一般来说,高校会选择知网、万方等拥有巨大数字资源的数据提供商提供的检测系统,具有较高的参考价值。然而,许多在线检查不受大型数据库的支持,只能检索在线资源。即使一些心理幸运的学生能够通过网上的假检测,他们也很容易在学校层面暴露出来。”
6月25日,烟台大学大四学生石源在淘宝上搜索“查重”。在弹出的4892件珍品中,他选择了销量排名第三且相对便宜的“papertest”。这个价格只有3元10000字,与每次花费数百元的《知网》测试相比,有点便宜得离谱。但在接下来的两个月里,他为自己对廉价资金的贪婪感到懊悔。
这家在线商店声称拥有“一个强大的指纹对比数据库,市场上最严格的测试,以及一个自建的数据库功能”,但是它的评估区域却充满了抱怨。“历史上最严格的考试制度”使得许多学生在学校的重考中中枪。
“杀得很惨,参考图书馆基本上是网络资源,和学校里的参考图书馆很不一样。《知网》中7%的重复率变成了70%,三个室友都被淘汰了,超过了60%。”石源和他的三个室友将面临推迟毕业的处罚。
经过几轮咨询,记者找到了这些假检测系统的原始雕像,PaperPass,它被显著地展示在这个检测系统的官方网站上。它说,“paperpass从未改变过它的名字,团队中没有人离开成为另一个品牌。其他的都是假的。当心被骗!”
网站上广告的产品特征也与papertest的口号相同。当然,这不是李鬼唯一的一个。纸质的重型检测系统,如Paperrate,会混淆好人和坏人,很难分辨真假。
在这些论文中,卖家用来“杀死”学生的方法是“一刀在光明面,一刀在黑暗面”。如果说李鬼的偷纸和复检是“一次秘密袭击”,那么一些商店提供售后服务以扩大其下游产业——专业的人工复检是一笔大买卖。
如果你的论文没有通过复试,现在改正已经太晚了,他们也可以做些什么。在号称行业领军人物的ZD纸网上,记者看到了“5年论文修改经验,7位资深教授,260位各领域的签约硕士和博士,368个学科,11601篇服务修改论文”的口号。
“与淘宝上的那些小作坊不同,我们是一条专业的流程导向生产线,拥有强大的专家资源基础。”在他的演讲中,网站的客服人员表现出了自豪。他说,为了确保论文的质量,除了由资深编辑进行编辑,还有专题编辑对论文进行润色和检查。他告诉记者,这些学科的主编都是“985”大学的教授。
在客服人员的指导下,记者将自己的论文输入到网站的“一分钟自动评价系统”中。系统根据抄袭程度和修改要求对论文进行评估后,得到的价格为2340元。如果他想在24小时内送报纸,他需要多加500元。
从鱼龙混杂、真假难辨,到挖掘窃取和转移论文牟利的“隐性渠道”,再到淘宝网上商店的一系列“再强调”售后服务,完整的产业链清晰可见,隐性利益链也隐约可见。
为什么学生要为“自我检查”付费
一些高校只对毕业论文进行抽查,比如1000名毕业生中有100名。然而,剩下的900个地方都闲置着。不幸的是,许多有子账号的老师嗅到了好处,就在淘宝上高价出售,或者在向学生收费后提供测试。
面对这浑水,为什么这么多学生急着要跳?
"许多学生提前检查自己,以消除剽窃的痕迹。"小昭是一所大学机械学院的研究生,今年即将毕业,他直言不讳。根据小昭的介绍,他们认识的学生在一个月内就写好了试卷,但由于担心学校的复试不会通过,他们在网上支付了自考的费用,在收到成绩后,他调整和修改了重复的分数以满足考试要求,这样他们就可以顺利通过考试。
“通过修改,我论文的重复率从22.5%下降到了8.5%。所谓的“修改”是指调整词序,甚至增加几个空格来通过测试一所大学历史系的李涛(化名)告诉记者,他放弃论文是因为实习期间忙于找工作。最后,他不得不抓紧时间写一篇文章。为了能够为自己在在线测试上的花费辩护几次,他最终降低了重复率。
记者从CNKI(中国知识网)科研诚信管理系统研究中心了解到,大多数学校已经采用了论文重复检查系统。今年1月29日,国务院学位委员会和教育部发布了《博士、硕士学位论文抽样办法》。根据规定,论文抽样每年进行一次。博士论文和硕士论文的抽样范围分别为10%和5%。
据了解,现在大多数学院和大学都在答辩前对试卷进行复试。如果重复率太高,他们将面临修改甚至推迟辩护的危险。北京师范大学规定,繁殖率不超过15%,即视为批准,最终确定后可报批。如果超过15%但低于30%,将被视为考试不及格,论文将在导师的指导下修改。只有在导师签字同意提交论文进行评审后,才能提交论文进行评审;否则,将不会提交审查。但是,如果繁殖率超过30%,将不会提交审查,也不会得到答复。“许多学校都有类似的规定。如果他们达到一定比例,他们可能会被取消辩护资格,推迟毕业,甚至被取消入学资格。”小昭告诉记者。
如果学校可以提供试卷自考服务,为什么不能免费向学生开放呢?
据了解,数据提供商向学校提供的重复检查服务不是免费的。无论年费多少,中国知网、万方、维普都将为高校等机构的用户提供不同数量的子账户,并分发给图书馆、教务处或院系。据王琪芸称,许多学校不为学生提供体检服务,这主要是基于成本。如果每个学生都进行体检,那将是一笔很大的费用。他告诉记者,"一篇博士论文的最高审查费用在80元左右"。
据了解,目前一些学校按照1: 1.2和1: 2的比例向教学单位分配复试机会。王力可·云起的海怀理工学院将为毕业生提供复检的机会。然而,许多学校不向学生提供免费复试服务。
无奈之下,学生只能从近处寻找距离,并花很多钱在网上购买体检。矛盾的是,许多纸质的重复检查系统是以团体账户的形式提供给大学和研究机构内部使用,而不是卖给个人。中国知网科研诚信管理研究中心也在2012年发布公告,驳回了淘宝网上热卖的论文。“在淘宝和其他在线交易平台上提供所谓的“中国知网检测服务”的所有行为都是非法和假冒行为。”
这些测试账户来自哪里?记者带着疑惑与淘宝店主交谈。
记者在网上找到了一个声誉很高的卖家,并作为消费者与卖家进行了交谈。"请问,你在这里和学校的《知网》考试一样吗?"记者问道。“是的,”店主回答。"但《知网》声明称,这只是针对学校,淘宝上的一切都是假的."记者进一步询问,商店的回答是:“我们是学校的。”"你是怎么得到这个测试账户的?"当记者再次提问时,回答是“无可奉告”。商店对如何获得账号保密。
记者还联系了其他卖家,他们说售出的《知网》测纸系统账号来自高校有测纸权限的老师,是最新的系统,在线测试,同步更新。除了每次测试14,000字的字数限制外,测试报告和重复检查率与官方的《知网》测试几乎没有区别。
“过去,测试任务是在研究生院的学位办公室完成的,但现在它被下放给了各个部门。系里负责教学事务的老师对此负责。基本上,每个学生都有机会检查账号是如何流入社会的。我真的不知道。”华东师范大学教育管理系的老师告诉记者,“但是,我们确实发现在测试过程中有一个系统的提示,即论文已经过测试,这表明论文确实通过了《知网》的测试”。
一些高校只对毕业论文进行抽查,比如1000名毕业生中有100名。然而,剩下的900个地方都闲置着。不幸的是,许多有子账号的老师嗅到了好处,就在淘宝上高价出售,或者在向学生收费后提供测试。
陈成武(化名),湖南某大学的一名大三学生,曾经帮助一名学校老师经营一家网上商店。他说:“老师因为他的身份不方便出面。当时,我以自己的名义申请网上商店资格,负责联系买家,收集买家发给老师的试卷,然后由老师带到教务处进行复试。虽然最后老师拿走了大部分钱,但运行费用也非常可观。”
有多少空间可以享受福利?陈成武告诉记者,“毕业时,每月销量约300份,每份报纸单价250元,一月份为7.5万元。此外,这是一只空手套白狼,是利用学校资源赚钱的一种方式”。
“测谎仪”故障
尽管*的初衷充满了防止学术不端行为的“正能量”,但其发展却逐渐走入歧途。一方面,它已经成为学生抄袭的辅助工具。另一方面,它的工具理性损害了生成的学术生命力。
最近的一次剽窃事件给已经受到批评的重复检查系统蒙上了一层阴影。
8月17日,学术月刊《国际新闻》(International Press)最近发布通知称,经过编辑部的仔细比较,于艳茹在2013年第7期杂志上发表的论文《1775年法国大众新闻业的扔石头党运动》(The Stone-throwing Party Movement in French Mass新闻学)在很大程度上是根据尼娜·基尔巴特(Nina Kilbart)1984年的文章《19世纪70年代新闻业的扔石头党运动:法国大革命前的戏剧批评和激进政治》(The Stone-throwing Party Movement in新闻学)翻译的。几个段落甚至没有改变,原文被复制,甚至基尔巴特引用的文件都被直接用作注释。公告还附上了两篇论文的全文,并用黄色标出了于艳茹的具体剽窃行为。
反剽窃软件包含有限的外语材料。将外文资料翻译成中文可以避免查重系统的“金眼”。正是由于这种查重制度的漏洞,许多像于艳茹这样的论文才能够安全地通过杂志和毕业生的查重考试。
全国人大教务处的一位老师说:“这种从英文到中文写文章的方法非常隐蔽,已经成为学生中公开的秘密。与简单的抄写书籍相比,它要“先进”得多。此外,教师还鼓励学生学习和吸收更多的外国文献和研究方法,但如果没有第三方的监督,学习和复制只有一步之遥。”
如今,随着高校需求的增加,论文研究已经成为一个行业。在被滥用的同时,它的反剽窃功能被异化了。复旦大学研究生院的一名工作人员告诉记者:“简单地说,这个系统是为了防范绅士,而不是恶棍。”。虽然这个软件有一定的威慑作用,但总体上没有多大效果。
“在我三年的工作中,我从来没有遇到过一个学生因为考试不及格而推迟答辩。我听说有些学生以前没有通过,但现在有太多的方法可以逃避。”华东师范大学负责学术事务的李彩桦(化名)告诉记者,“网上仍然流传着许多“查重策略”,比如将引用的外国文献翻译成中文;将抄袭的文本转换成图表,或将图表转换成文本;给重复的部分添加一些空格,或者只是先把重复的部分去掉,然后在回复的时候添加进去。人足以应付机器。”
记者将一篇临时拼凑的论文和几篇期刊文章一起发送到一家名为“纸张检测一站式服务”的淘宝店。测试结果为40%。在店主发回的测试报告中,记者还收到了一份pdf版本的《秘密论文修订稿》。在这本“书”中,针对查重系统中的漏洞,有几十种方法可以降低文章的重复率。
这家商店的老板告诉记者,这种“修改圣经”在学生中很受欢迎。许多学生在圣经的指导下拼凑论文。店主甚至夸口说:“如果你能熟练地使用这本圣经,即使整篇文章被抄袭,系统也找不到它。”
店主的吹嘘并非没有根据。目前,市场上的检测软件已经为系统检测的灵敏度设定了阈值。以中国知网为例,门槛是5%。就段落而言,剽窃或低于5%的引用不能被发现。许多学生抓住这个漏洞,将两个句子从一个地方复制到另一个地方,并保存一份有许多文件的论文,以安全地逃避“学术测谎仪”的检测。如今,在智能企业和学生中,体检系统已经成为一个不受保护的领域。
"大陆学生剽窃港台文学,而港台学生剽窃大陆文学."曾在华东师范大学工作的香港岭南大学教授许子东目睹了这种“奇怪的情况”。他说,由于目前的考试系统没有搜索港台的文献库,港台之间的这种“学术交流”成了他们通过笔试的捷径。
浙江大学图书馆副研究员赵说:“有了这个所谓的学术不端行为检测系统,一些管理者似乎找到了一个法宝,但是这个系统的缺陷却非常明显。一个是他们不能判断实质性的剽窃,它只会改变单个单词或句子模式。至于剽窃思想或观点,更难判断和识别。其次,它会将正常的引用误判为剽窃。老实说,测试系统实际上为作者提交文章和学生做论文设置了许多障碍。”
尽管*的初衷充满了防止学术不端行为的“正能量”,但其发展却逐渐走入歧途。一方面,它似乎成了学生剽窃的辅助工具。另一方面,它的工具理性损害了生成的学术生命力。
对于*的“工具理性”,北京大学教授陈平原有着深刻的体会。他的一篇博士论文因申请优秀博士论文时重复率高而被取消资格。陈平原说,“这个学生的论文是古代文学专业的,所以引用文献是很自然的。然而,重复检查系统以一刀切的方式将引文纳入总复制比率是荒谬的。根据这一原则,如果擅长写读书笔记的周作人的文章也经过测试,那就是剽窃。”
像这样被重型系统的“流弹”误伤的论文并不少。陈平原认为,体检应根据学科特点进行调整。它的本质是一种工具,应该被人们使用,而不是成为“奴役学术思想、禁锢学术*的绊脚石和牢笼”。
王琪芸说:“学生时期是培养科学精神和培养科学研究方法的黄金时期。经过一些“训练”,通过发现学术不端行为,大量学生的学术规范教育被严重扭曲。可以说,这是矫枉过正,背离了学术不端行为检测制度的初衷。”
许多专家认为,让学术不端行为检测系统对学术规范进行“标准化”是不可靠的,原因是它所依据的“定义标准”是不可靠的。
根据目前所有论文不端行为的定义标准,基本上每个学术不端行为检测系统都有自己的标准。虽然教育部颁布了各种意见和方法来规范学术行为,如《学术论文舞弊处理办法》和《博士和硕士学位论文抽样方法》,但没有关于如何界定学术不端行为的相关规定,这意味着目前市场上的这些标准仅限于行业规则,尚未正式成为法律或标准(国家、部委或行业)。
但在实际应用中,随机性也很大。以中国知网科研诚信管理系统研究中心为例,学术期刊论文(公开征求意见稿)中不端行为的定义标准使用了以下相关概念:比较范围、符合字数、文本复制比例、单源复制、多源复制、正面符合度、背面符合度、段落复制、整体复制等。然而,具体的比较范围和重叠单词的数量都是剽窃。这个按钮由学校控制。
王琪芸说。“界定学术不端行为需要一个可接受的范围,应该允许一个可接受的学位,而不仅仅是上升。”(原标题:文章中断背后的“业务”)
上一篇:王烈简介及代表作