(IvyP/译)两名计较机生物学家在操纵PubMed搜刮引擎领会最新研究动态时,偶尔发觉中国的论文销售公司仍然在运作,而在1年前,《科学》(Science)期刊就曾经颁发过一篇文章,深切阐发了这一布局复杂又利润丰厚的财产。
巴塞罗那基因组调控核心的吉拉姆·菲利翁(Guillaume Filion)和法布拉大学的卢卡斯·凯瑞(Lucas Carey)从PubMed下载了2012年1月到本年4月期间的论文出书记实。通过操纵一种称为天然言语处置(natural language processing,NLP)的手艺,二人将这200万篇论文的摘要部门进行比对阐发,找出了2014年呈现频次最高的词汇。
菲利翁暗示,他们本来是但愿通过这种方式找到会成为热点的新研究标的目的。不出所料,他们发觉与前沿话题相关的研究论文的数量有所添加,例如CRISPR(clustered regularly interspaced short palindromic repeats,纪律成簇的间隔短回文反复),一种被《科学》(Science)期刊提名为2013年最主要科学冲破第二名的基因编纂手艺;以及目前基因组学研究中的抢手——长链非编码RNA(long non-coding RNA,lncRNA)。
但除了这些预料之中的研究趋向,还有一个很凸起的词汇——由位于伦敦的弥补医学研究委员会(Research Council for Complementary Medicine)运作的一个不为人知的数据库CISCOM。菲利翁和凯瑞指出,2014年之前,“CISCOM”这个字眼每年仅会出此刻2-3篇论文中,而从2014年2月起,这个数据库俄然间起头每个礼拜就呈现一次。
二人通过进一步阐发发觉,一组32篇相关分歧主题的论文却都有着不异的特征——都是操纵数据库里已颁发得文章写出的综述文章,这些数据库不单包罗CISCOM,还包罗一些较常用的数据库,如谷歌学术搜刮、PubMed和Web of Science等。此外,这些文章全数来自分布于中国若干城市的28个分歧的研究小组。
菲利翁在10月4日颁发的一篇博文中描述了这些论文若何惊人的类似,后来他决定与凯瑞一路探查背后的隐情。他们通过各类体例下载了这25篇论文的全文。而将这些论文用抄袭检测法式iThenticate进行阐发后,他们并没有发觉抄袭的环境。
不外,所有这些文章的会商部门都有雷同的文字陈述,只要句式上有略微变化。好比一篇文章写道:“主要的是,相关研究对象和对照组的选择尺度在这些所有的研究中都没有明白描述,因而可能会对我们的成果形成影响(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies and thus might have influenced our results)”;而另一篇则写道:“主要的是,相关研究对象和对照组的选择尺度在这些所有的研究中都没有明白描述,而这可能也会对我们的成果形成影响(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies, which might also have influenced our results)”。
别的,4篇文章中呈现了不异的语法错误——在“我们的成果过去没有足够的数据支撑(our results had lacked sufficient statistical power)”中无缘无故呈现“过去(had)”一词。在试图找出这些文章之间的联系时二人留意到,文章作者们利用的文字描述似乎来自多个模板中,这意味着这些作者在成心调整这些文字的挨次,而这种方式恰是用来逃避抄袭检测软件的,这种手法被称为“洗文”(text laundering)。
这些论文中的大大都提交于2013岁暮,而统一期间颁发的论文之间不成能彼此抄袭。因而菲利翁和凯瑞猜测,这些论文可能都出自统一个公司之手。在来自上海复旦大学的遗传学家余垚的协助下,二人找到了一家公司,其网站告白称能够荟萃阐发论文。于是他们联系了该公司并扣问办事细节,公司暗示可在影响因子2或3的期刊上颁发荟萃阐发论文,价钱为每篇1万美元。
以“代文”为环节词在百度搜刮,能够找到大量衔接这种营业的公司,这些公司一般都有一整套完美的流程。图片来历:网站截图
2013年颁发在《科学》期刊上的一篇文章就是相关一次长达5个月的卧底查询拜访,查询拜访中发觉了许很多多雷同如许的公司。这些公司供给一系列的办事,旨在帮人颁发能出此刻主要索引中的论文,包罗汤森透(Thomson Reuters)的科学援用索引和社会科学援用索引,以及爱思唯尔(Elsevier)的工程索引,而这些目标在中国很多研究机构内都是提职称的主要参考。除了操纵客户供给的数据创作论文以外,这些公司还能够伪造尝试数据、在已被期刊领受的论文中加作者,并出售写好的原稿。
在论文成品中最受接待的就是荟萃阐发论文,可能是由于写这类论文不需要原始数据。2013年6月颁发在《公共科学藏书楼·分析》(PLOS ONE)期刊上的一篇研究论文发觉,2003到2011年间,来自中国的荟萃阐发论文的增加速度比美国快16倍。若是在PubMed中搜刮其它研究趋向,可能会找出更多相关不合理科研行为的,可是菲利翁暗示,他和凯瑞目前筹算将留意力转向其他处所,由于“我们不是打假人,而是大数据阐发专家”。(编纂:球藻怪)
这个大数据研究能发觉花钱请人做文字工作和完全让人写论文的区别么?若是数据是本人做出来的,花钱请公司帮手做文字润色说不上是学术造假吧。文字雷同很有可能就是统一小我润色形成的。润色这种工作工作十几年就有了,并且也不是中国独有。有时候你投个程度高的,人家reviewer还会你找个英语好点的人帮你点窜一下稿子,难不成那些reviewer在激励你学术造假?
顶[]评论
这个大数据研究能发觉花钱请人做文字工作和完全让人写论文的区别么?若是数据是本人做出来的,花钱请公司帮手做文字润色说不上是学术造假吧。文字雷同很有可能就是统一小我润色形成的。润色这种工作工作十几年就有了,并且也不是中国独有。有时候你投个程度高的,人家reviewer还会你找个英语好点的人帮你点窜一下稿子,难不成那些reviewer在激励你学术造假?
顶[]评论
1,我们也要看到外国的学术,免得只对中国悲伤……
2,中国的评价机制确实有点儿问题……就像他们那些临床大夫(我是根本医学生),既要完成临床使命,又要有科研才能评职称,这就有点儿过犹不及了,完全能够有一方面有就能够评职称啊,否则逼着一群临床的人集体搞科研,大部门人哪有精神和研究材料搞真正的科研(根本性研究该当是我们这些根本医学的搞,他们该当是切近临床的研究才合适学科分工吧)。当然,临床简直实欠好评估,大概也是一个缘由。
牢骚:比来评国,学校只认一作,所以虽然我有Plos one的二作,可是也不若有一篇焦点的一作,以至不如通俗期刊的一作……
别的良多华人PI对文章签名环境也不是很客观、诚笃(大概非华人PI也如许,可是还没深切接触过),良多时候小我会对能否签名、作者挨次有很大的影响。昔时本科时听本科老板说她在美国时隔邻尝试室一个华裔大老板的尝试室发文章的时候把本人的妹妹签名到作者里,虽然她妹妹是学数学的,而这个老板的尝试室是动物学的。不外至多他妹妹也算学术圈儿的人,最狠的是把他哥哥也署进去了,而他哥哥底子不是搞学术的。听说只是为了有几篇SCI签名,到时好申请绿卡……
中国人太聪了然,你懂得,估量从经济学的市场角度来看,中国人会让市场的效率提高良多良多,人底子想不起来的工作,中国人分分钟想出来怎样”操纵“”资本“
顶[]评论
p作为一个通俗的本科生,对于要本人发一篇论文需要做什么还没有深刻的领会,可是有时候专业课要求本人查文献写一些文献综述,这时候就能发觉,下载的95%中文文献,根基都是不异的一段话,大师拆开打碎了抄来抄去而且吧,援用同样一句话弄的你都不晓得该用谁当文献的好/p p/p p更有甚者,还碰到过两篇一模一样的文章,可是颁发在分歧期刊上,作者和单元也完全纷歧样也是让人醉了/p
顶[]评论
转载请注明来自:http://www.lunwencheng.com/lunwen/yix/5288.html