国际著名meta分析研究学者,斯坦福大学教授John Ioannidis在最近一篇论文中表示,科学文献分析的黄金标准真正遭受玷污。他的意思是说,荟萃分析和系统性评论本来是循证医学的重要工具,但现在被许多人作为灌水论文的手段,会危害这种研究的可信度,应该引起高度重视,提出解决问题的办法。
先复习一下功课,医学综述有三种基本类型,分别是:
1.传统综述是一种定性描述的研究方法,根据作者对某领域基础理论的认识和相关学科的了解,回顾分析该领域某段时期的研究文献,评价研究结果的价值和意义,发现存在的问题,为将来的研究方向提出建议,使读者能在短时间内了解该领域研究的历史、现状和发展趋势。
传统综述的写作没有固定的格式和规程,也没有评价纳入研究质量的统一标准,其质量高低受作者专业水平、资料收集广度及纳入文献质量的影响很大,不能定量分析干预措施的总效应量。不同作者对同一问题的研究很可能得出完全不同的结论。
2.Meta分析是一种将多项研究结果进行定量合成分析的统计学方法,始于20世纪70~80年代,最初被定义为“收集大量单项试验进行结果整合的统计学分析”。1991年Fleiss提出较严谨准确的定义,“Meta分析是用于比较和综合针对同一科学问题研究结果的统计学方法,其结论是否有意义取决于纳入研究的质量”。
并非所有Meta分析都能得出高质量结果和结论,只有对纳入研究进行同质性检验,分析异质性的原因,按同质性因素进行合并的Meta分析才可能有意义。仅纳入随机对照试验(RCT)的Meta分析得出的结果一般偏倚较小,其结论准确性远比单项试验高。Meta分析看起来是更客观的综合分析方法,但是如果恶意灌水,在缺乏专业素养的条件下,一些错误结论可能会成批出现,这会危害整个学术社会对这种论文价值的怀疑,最终导致这种方法的人为失效。
3.系统评价是针对临床问题收集全世界相关RCT,采用临床流行病学的方法,去伪存真,系统地评价其质量,合并分析有足够相似性的研究结果,可在一定程度上减少随机性的影响,获得全面的综合信息,为医疗卫生决策提供依据。
卫生政策决策者、医师和患者在决策时必须以高质量信息为依据。但面对大量医疗卫生信息时常难选择。因为多数信息都存在或多或少的问题,有的甚至是错误信息。另外由于全球医疗卫生信息更新极快,受时间、精力及检索技能等条件限制,大量有价值的信息被埋没浪费。RCT严格采取了控制偏倚的措施,可靠性通常较其他试验方法高,但受环境条件限制,很多RCT样本量太小,不能有效克服随机性的影响,或只专注于某特定问题,导致实用性受限。制作系统评价前,需预先设计研究方案,充分考虑如何全程减少偏倚,怎样评价相关研究质量,怎样收集和合并资料等。
(主题内容来自网络,作者根据理解进行了部分修改。)
系统评价和荟萃分析都是对已经发表文献中特定主题进行的综合评价,这种主题通常是对药物和治疗手段进行效果分析,是循证医学的关键工具。
但是根据John Ioannidis教授的研究,现在存在恶意大规模生产不必要的相互冲突的误导性系统评价和荟萃分析,导致这种文献的价值被稀释。Ioannidis教授的文章刚刚发表在The Milbank Quarterly,文章对这种问题进行量化分析。他说,文献的重要性越大,发生错误的危害性越大,这种重要文献大量存在错误需要引起重视。
PubMed是生物医学和生命科学的文献数据库,Ioannidis对PubMed数据库中标记为系统评价和荟萃分析(‘systematic reviews’和‘meta-analyses’)的文章数量进行了分析。从1991年到2014年,这种文献的数量年度增加高达26倍,其中系统系统评价为28,959篇,荟萃分析9,135篇。同期PubMed全部文献数量年度增加为1.53倍。
值得重视的是,这些荟萃分析类文献主要来自亚洲国家。例如2014年有63%的基因相关荟萃分析研究来自中国,其中大多数属于假阳性的范畴。这样的数据让我们尴尬万分,是我们写这类文章的能力高?是我们写这种文章的动力大?还是我们写这种文章的市场操作机制优势?
布朗大学生物统计学家Christopher Schmid负责处理《美国肾脏病杂志》的荟萃分析类稿件。Schmid教授认为,这种文章的增加的原因是学者论文发表压力的越来越大。大约10年前,他就注意到来自亚洲的这类稿件越来越多。开始这些稿件质量不太好,但是现在进步很大。其中一个原因可能是数据获取的途径有了比较大的改善。
Ioannidis认为,这些文章的一个目的是为了增加文章引用量,这甚至成为某些企业的营销工具。例如,使用他汀类药物预防心脏手术后心律失常的研究,七年来被21篇荟萃分析引用。另外185篇抗抑郁药物研究论文中,大约三分之一的作者受雇于同一个药商。Ioannidis说,这类为职称和为商业目的的论文会破坏生物医学论文的声望。这些文章多数发表在受人尊敬的期刊上,也会被其他文章引用。
今年另外一项对300篇系统评价综述文章的随机样本特征进行研究,结果发现一些采用了未发表的数据或偏见研究数据,大多数文章都缺乏文献的选择和甄别方法。
约翰霍普金斯大学临床试验和证据整合中心主任Kay Dickersin说,这些研究需要引起高度重视。不过,这些文献增加也是因为这些文献的重要性比较大。鼓励人们从事这些研究是因为这些文章在公众健康决策中的重要地位,而帮助科学家开展这种研究的方法也越来越多。但是Dickersin也承认,学术期刊处理这类稿件的能力有限,很难寻找到足够多能审阅这类稿件的评审员。
个人认为,针对目前中国学术论文爆发增长的局面,我们必须尽快实现从数量向质量的战略转移,对学术评价从简单量化向品质评价转移,从主管机构向第三方评价转移。淡化论文数量在职称晋升和学术地位中的份量,甚至要对灌水论文进行负面评价。比如一些荟萃分析专业户,比如横向作文大师,都要采取手段进行适当限制。另外要从论文引用、学术贡献度、行业认可度、社会贡献度等方面进行评价。把基础学术研究的品质提高上来,把技术研究的应用价值凸显出来。(孙学军)