錢煒
2001年,一個流言飄蕩在希臘的醫(yī)院里:年輕的住院醫(yī)師為了看誰開刀更快,將很多阿爾巴利亞移民誤診為闌尾炎,好拿他們做手術來比賽。這個說法引起了希臘約阿尼納大學醫(yī)學院附屬教學醫(yī)院一位剛畢業(yè)的年輕醫(yī)生塔西奧尼的興趣。當她與同事們談論這則八卦時,正好被路過的一位像“憨豆”一樣寬額大眼、留著卓別林式的小胡子的教授聽見。這名長相令人印象深刻的教授名叫約翰·約阿尼迪斯,是醫(yī)學院衛(wèi)生學與流行病學系的負責人。約阿尼迪斯便問她,可否想辦法證明這個流言是真的。
這番偶然的談話引發(fā)了一項正式的研究。在約阿尼迪斯等人的幫助下,塔西奧尼調查了希臘的6家醫(yī)院,結果發(fā)現(xiàn),盡管原因不明,被誤診割除闌尾的阿爾巴尼亞人確實是希臘患者人數(shù)的三倍?!皫缀鯖]有學術期刊愿意發(fā)表我們的結果”,塔西奧尼說,因為它很難歸類于任何一個醫(yī)學領域。還算幸運,最終,他們設法將論文發(fā)表在全球最大的開放獲取出版商BMC旗下的《健康服務研究》上。他們的結論是,在希臘定居的阿爾巴尼亞人面臨著更高的闌尾炎誤診風險。這預示著,受社會經(jīng)濟、文化與語言等因素影響,移民人口遭受的醫(yī)療服務不平等問題值得關注。
這項看起來有些“偏門”的研究,是約阿尼迪斯的學術生涯“偏離正軌”的序曲。他生在紐約,長在希臘,就讀于兩國最好的大學的醫(yī)學院,博士畢業(yè)后先是探索罕見病,后來又轉向人類基因組流行病學研究。但“闌尾炎研究”給予他新的靈感:醫(yī)學之外的因素會影響醫(yī)生的決策從而導致錯誤產(chǎn)生——盡管連他們自己可能都沒意識到,那么在科學領域是不是也是如此?他開始從常規(guī)科研工作中擠出部分精力,和一群年輕的臨床醫(yī)生與醫(yī)學博士一道,著手一項新課題——對“研究”本身加以研究,以科學的手段甄別“壞科學”。如今,這項看起來離經(jīng)叛道又易招惹眾怒的工作終于登堂入室,成為正兒八經(jīng)的學術命題:2014年3月底,美國斯坦福大學成立了由約阿尼迪斯領銜的“元研究創(chuàng)新中心(METRICS)”,向“壞科學”正式宣戰(zhàn)。
“壞科學”不完全等同于造假。2014年年初,國際科學界發(fā)生了一件大事:日本美女科學家小保方晴子在英國《自然》雜志上發(fā)表論文稱,他們采用非常簡單易行的辦法,培育出了能分化為多種細胞的新型“萬能細胞STAP”。很多人對此興奮不已,認為這一研究直接挑戰(zhàn)了兩年前獲得諾貝爾獎的日本科學家山中伸彌的成果,是干細胞領域的“世紀大發(fā)現(xiàn)”。但在今年4月,日本方面宣布,論文存在造假行為。盡管調查認為,造假不直接否定研究本身,結論是否成立還需要更多科學實驗來驗證,但至今,國際同行都沒有成功重復小保的實驗,因此,很多人已經(jīng)開始懷疑小保方晴子的研究從根本上就是個錯誤。
在科學領域,衡量你的發(fā)現(xiàn)能否成立的金標準就是可重復,即別人按照你的方法做實驗能得到相同的結果。TetraLogic制藥公司的首席科學家格倫·比格利,曾經(jīng)做過這樣一個測試:他們復制了癌癥領域53篇具有里程碑意義的論文里的實驗,結果有47個都無法重現(xiàn)結果。在這些無法重復的實驗中,甚至有一部分還得到了那些當初作出原創(chuàng)發(fā)現(xiàn)的科學家本人的幫助。
因此,小保方晴子的案例實際上并不罕見。這也是約阿尼迪斯要研究的問題:生物醫(yī)學領域充斥著大量不可復制的、錯誤的、無用的甚至虛假的研究與發(fā)現(xiàn),也就是他所說的“壞科學”。
在食品里添加荷爾蒙與維他命,可對某種疾病有療效或具有抗癌作用,每天一片阿司匹林,對心臟有好處——約阿尼迪斯宣稱,這些統(tǒng)統(tǒng)都是假的,根本經(jīng)不住更大范圍的科學實驗的檢驗。根據(jù)2005年他在《美國醫(yī)學會雜志》上發(fā)表的一篇論文,在生物醫(yī)學領域,大部分公開發(fā)表的文章都是完全錯誤的或者被夸大了的?!稌r代》周刊對此的報道有一個更加簡明又驚悚的標題:“90%的醫(yī)學研究都是錯的!”《柳葉刀》雜志最近也有文章指出,在2010年,有85%的全球醫(yī)學研究經(jīng)費共計2000億美元,都被驚人地浪費在了那些設計有缺陷、多余的、而且從未發(fā)表或者報道甚少的研究上。
對此,約阿尼迪斯解釋說,造成這個現(xiàn)象的原因,并非是科學家們有意作假,而是他們的試驗設計有瑕疵,或者他們使用了不被承認的數(shù)據(jù)。因此,他希望做一些實證研究,找出目前科研出問題的原因所在,以及如何去矯正它。
做這樣的分析,需要有堅實的數(shù)學基礎。而約阿尼迪斯恰恰具備這樣的優(yōu)勢:在雅典大學讀書時,他曾經(jīng)獲得了希臘數(shù)學學會的國家獎。根據(jù)他分析,在醫(yī)學研究中被廣泛使用的統(tǒng)計方法,其實是個非常脆弱的體系。如果一項研究的目的是考察某種藥物對人的健康是否有好處,而你又希望能證明有好處的話,你將很容易做到這一點。
這首先是因為,現(xiàn)在大部分醫(yī)學研究的效應其實都是比較微弱的,因為“不微弱”的效應早就被別人發(fā)現(xiàn)了。再者,也許一個病人的病情并沒有什么明顯好轉,但因為科學家希望這個藥物有效,他也許會刻意尋找好轉的證據(jù),因此可能會把本來沒什么好轉的病人當成好轉的病人。
這就是人類無意識的偏見對科學研究的影響。約阿尼迪斯強調說,科學家總有要打破常規(guī)找到新發(fā)現(xiàn)的雄心,受此影響,很多假設從一開始就已經(jīng)包含了很高的錯誤幾率。再加上人類的本能就是只看到他們想看到的,這種偏見造成的偏差幾乎是無法避免的。因此,即使不存在任何故意的動機,科學家也會推動數(shù)據(jù)分析工作朝著有利于他們結論的那一方向前進,哪怕這一解釋只是勉強行得通。
根據(jù)約阿尼迪斯的計算,如果某一微弱效應有10%,而科學家的偏見有30%的話,你的實驗得到正確結論的概率只有20%。他將這一基于數(shù)學原理的分析寫成文章,發(fā)表在2005年的《美國科學公共圖書館》(PLoS)雜志上。這篇名為“為什么大多數(shù)公開發(fā)表的發(fā)現(xiàn)都是錯的”文章,迄今訪問量已逾百萬次,成為PLoS上最熱門的文章之一。
造成科學研究走偏的原因還包括,約阿尼迪斯說,對日益縮水的科研經(jīng)費的激烈爭奪,制藥公司的商業(yè)利益影響,以及此類實驗的設計本身存在缺陷——都是小樣本而非大樣本,以及“什么才算是有統(tǒng)計學上的顯著意義”這一標準的日漸松弛,這一效應被大大地放大了。從統(tǒng)計學角度來看,一個更有趣的悖論則是:越是熱門的研究領域,同一個問題研究的人越多,出錯的可能性就越大。
將所有這些因素綜合起來考慮,約阿迪尼斯發(fā)明了一套數(shù)學模型,用于驗證一項研究是否可信。但令約阿尼迪斯感到憂慮的是,這些錯誤的結論一旦發(fā)表,它們在學界造成的壞影響就難以清除。比如,10年前,在美國和歐洲曾有一股風潮,要尋找諸如導致抽煙、抑郁、肥胖和哮喘等問題的相關基因。但實際上,只有極少部分的疾病可以找到直接相關的致病基因之外,大部分疾病的發(fā)病因素是錯綜復雜的,難以單從基因上找到根源。后來,歐美這些研究只有1%的成果被證明是有意義的。但直到今天,約阿尼迪斯指出,仍有大量科學家在這個領域白白地耗費精力,其中,60%的“無用研究”都來自于中國。
約阿尼迪斯認為,從根本而言,是目前對科學家的評判標準存在問題。他說“科學共同體應當允許科學家說:‘我已經(jīng)非常努力踏實地工作了,但就是找不到任何有價值的發(fā)現(xiàn)。只要他們努力工作,就不應當受到拿不到科研經(jīng)費的懲罰??茖W是一項高貴的事業(yè),但也是低產(chǎn)的事業(yè)。人們應當明白這一點:盡管有無數(shù)科學家付出了大量努力,只有,依然只有極少一部分的醫(yī)學研究成果可以提高醫(yī)療水平和改善人類的生命質量。”