朱慶華,陳瓊,陸冬梅,王雷,宋士杰,趙宇翔,趙月華
(1. 南京大學信息管理學院,南京 210023;2. 河海大學商學院,南京 211100)
近年來,互聯網環(huán)境下失真健康信息(health misinformation)現象引起業(yè)內學者們的廣泛關注。失真健康信息可以被定義為與現有客觀科學證據存在偏差,對信息接收者主觀感知造成誤導的各類健康信息[1-2]。在新型冠狀病毒肺炎(corona virus dis‐ease 2019,COVID-19)疫情爆發(fā)初期,大量有關疫情的失真信息在互聯網迅速傳播,混淆公眾視野,誤導公眾對疫情防治的認知,導致恐慌情緒的蔓延[3]。例如,有關某藥品能夠預防新冠病毒的失真信息一出現,微博相關話題迅速登上熱搜,引發(fā)群眾不顧疫情期間居家隔離的規(guī)定出門瘋狂搶購該藥品,嚴重影響疫情防控的正常進行。失真健康信息的主要危害在于其誤導性,混淆公眾對科學健康信息的判斷。公眾可能輕信失真健康信息中的內容與觀點,進而采取錯誤的健康決策與行為。
當前互聯網環(huán)境中,以微博、微信等為代表的社交媒體已經成為健康信息傳播的主要渠道。社交媒體的興起極大地改變了傳統的健康信息發(fā)布和傳播模式,公眾在快速、便捷地獲取海量健康信息資源的同時,也面臨來自新的傳播環(huán)境的挑戰(zhàn),失真健康信息是其中最為棘手的問題之一。互聯網環(huán)境下失真健康信息的傳播更加迅速、廣泛和深入[4],擴大了失真健康信息的危害。與此同時,目前互聯網監(jiān)管難以面面俱到,謠言和虛假信息更容易被創(chuàng)造和傳播。社交媒體中信息過載和碎片化特征使得用戶難以系統性地全面判斷和把握信息的質量[1,5];另外,社交媒體容易依據用戶特征形成小的社群[6],這導致不同觀點的信息無法流動,形成信息孤島。因此,互聯網環(huán)境下失真健康信息傳播不僅威脅公共衛(wèi)生管理,阻礙健康信息資源有效傳播,還不利于健康政策落實,遏制健康產業(yè)創(chuàng)新,甚至影響數字健康經濟的發(fā)展。
因此,本研究在獲取國內外互聯網環(huán)境下失真健康信息相關研究論文的基礎上,構建失真健康信息研究框架。首先,界定失真健康信息的概念內涵并篩選文獻進行計量分析;其次,從失真健康信息的傳播、失真健康信息的識別以及失真健康信息的干預3個方面進行文獻述評;最后,歸納總結互聯網環(huán)境下失真健康信息研究的不足和未來展望,以期推動失真健康信息傳播機制與協同治理方案的研究,促進互聯網健康信息生態(tài)環(huán)境的優(yōu)化。
失真信息一般是指錯誤的、不準確的信息[7]。失真健康信息則是指信息內容上與健康相關的失真信息?;谛畔⒏拍羁蚣埽琋yhan等[8]融入個體認知特征,將失真信息定義為“個體相信尚未得到明確科學證據和專家意見支持的信息”。失真信息首先強調客觀內容上的錯誤和不準確,與現有的科學知識相違背;從接收者的維度上看,它還強調個體認為錯誤信息在解決特定問題上是有用并且適用的。
在現有研究中,偽信息(disinformation/fake news)和謠言(rumor)同樣是表達客觀內容不準確的概念,雖然在部分情境下可以替代使用,但在概念內涵和實際研究側重點上存在區(qū)別。失真信息與偽信息雖然都是指信息內容上與客觀事實存在偏差,但偽信息側重強調故意創(chuàng)造和傳播以造成傷害的意圖,常見的偽信息有新聞諷刺、新聞模仿、事實捏造、廣告和宣傳等[9]。而失真信息不強調信息來源的意圖,它也有可能是正確信息在傳播過程中由信息解構和重組、部分信息丟失、外圍噪音等因素導致的信息失真[1,10]。謠言更容易被證偽,時效性較短[11],對個體產生的深層次影響較為有限,一般側重于研究謠言傳播帶來的群體性效應[12],但是失真信息由于客觀上的不準確性,對個體的認知、心理、信念和情感都有可能產生深遠的影響[13]。
本研究將對互聯網環(huán)境下失真健康信息相關研究進行文獻檢索和篩選(圖1)。在Web of Science(WoS)上根據關鍵詞“health misinformation”進行搜索,發(fā)表時間截至2022年12月31日,選擇核心數據集并剔除會議、報告類文獻,共得到文獻134篇。然后,基于摘要和標題對內容進行篩選,剔除明顯不是信息學領域的論文、與失真健康信息無關的論文、時間過早難以追溯原文的論文后,最終以98篇英文文獻作為主要研究對象。在中國知網核心期刊中檢索關鍵詞、主題為“失真健康信息”“虛假健康信息”“偽健康信息”,篩除與研究領域無關的論文、與失真健康信息無關的論文、編者前言等非研究型論文以及重復性文章,最后得到25篇文獻。
圖1 失真健康信息文獻來源篩選過程
針對篩選出來的文獻進行簡單的計量分析,如圖2所示,互聯網環(huán)境下失真健康信息研究逐年增加,且在2021—2022年數量上呈現井噴式增長,成為健康信息學領域的新興研究主題。
圖2 各年國內外失真健康信息文獻數量變化
基于Ho等[14]對疫情期間失真健康信息研究的問題梳理,可以概括為以下幾個方面:①失真健康信息的傳播問題,信息是怎么傳播的,為什么會產生并得到廣泛的傳播;②失真健康信息的識別問題,為什么健康問題中的失真信息更難被識別,如何從根源上更快過濾失真信息;③失真健康信息的干預問題,自動化的干預、人為教育的干預都是受到關注的話題。因此,本研究也將傳播、識別和干預作為三大核心主題并進行文獻的梳理。表1是已有文獻中不同主題的分布情況。
表1 各主題失真健康信息文獻分布
信息傳播包含三要素,分別為信息來源、信息內容以及信息接收者[9],三者在信息創(chuàng)建、生產、分發(fā)并且再次生產分發(fā)的循環(huán)過程中發(fā)揮不同的作用。本節(jié)分別從3個維度出發(fā)梳理失真健康信息傳播的影響因素,基于三要素對現有失真健康信息傳播的影響因素進行梳理,結果如表2所示。
表2 失真健康信息傳播的影響因素
信息來源是參與創(chuàng)建和生產失真健康信息的行動者,其主動發(fā)送信息,并且繼續(xù)參與信息分發(fā)和再生產過程。認識社交媒體上主動發(fā)布失真健康信息的主體,探究創(chuàng)造并生產社交媒體失真健康信息的動機以及信息來源方如何在整個信息鏈中發(fā)揮作用,可以幫助研究人員從信息鏈上游解決失真信息的傳播問題。
失真健康信息來源可以是非官方的個人用戶[10],他們可能具有相關的經驗或知識背景。例如,越來越多的患者開始積極在社交媒體平臺中分享自己的親身經歷或者解答其他類似疾病患者的困惑,逐漸模糊權威和經驗的界限,他們可能會表達一些并不科學的見解,導致失真信息進一步擴散。這些患者并不是有意傳達錯誤的經驗,但是囿于自身知識水平難免會有一些偏見,而這種看似真實的偏見往往可能令人信服。社交網絡中還存在許多偽科學家,他們在社交媒體將自己包裝成為醫(yī)學專業(yè)人才并獲得大量關注,從而進行失真健康信息的生產和傳播。社交媒體中的社交機器人(social bots)也是失真信息來源傳播中的研究對象之一。例如,研究人員對機器賬號在社交媒體上的信息表述特征進行分析[15],研究它們是如何影響疫苗接種信息的傳播等[16]。
除了個人用戶,一些看似權威的網站、出版物也是導致失真健康信息傳播的重要源頭。例如,掠奪性期刊(predatory journals)借用科學期刊的可信度,專注于接受盡可能多的論文,而不是著重篩選論文質量,魚龍混雜的期刊論文成為低質內容傳播的重要來源[17]。受部分組織資助的健康網站可能在利益驅使下發(fā)布誘導性的言論,如酒精工業(yè)組織贊助的健康網站會發(fā)布酒精有利于健康的論述[18]。
探究失真健康信息內容特征是治理其傳播的重要一環(huán),早期有關失真健康信息研究主要集中于此,尋找失真健康信息的共性特征。一方面,結合主題、語言、情感、用戶行為等特征構建識別模型,以優(yōu)化失真健康信息的識別和過濾[19];另一方面,基于實證方法研究失真健康信息特征對用戶認知、信息行為的影響[20]。
(1)語言表述。失真健康信息表現出更高的確定性,并在標題中包含更多的陳述句、更多的情感訴求、更少的范例和更少的可信來源[21-22]。大多數情況下,失真健康信息的表述方式更容易被理解,情感沖擊力強,更容易引起社交媒體用戶的負面情緒。當人們感到信任缺失、恐懼和懷疑時,更容易受到失真信息的影響,如果此時失真信息獲得信任就很難糾正。除此之外,整體上積極型的信息表征框架[1]、精細化的敘事內容[23]也更容易促進用戶對失真健康信息的信任。值得注意的是,有研究表明失真健康信息的傳播程度和情感詞的使用無關,包含積極情緒詞更可能被分享和評論[22]。
(2)主題特征。不同健康主題下失真健康信息的傳播特征也有所不同。已有研究中以流行傳染?。ㄈ缧鹿诜窝?、SARS病毒等[24-26])、癌癥相關的慢性病、疫苗接種為代表進行探索[27-28]。解決的問題包括:①互聯網環(huán)境下什么主題的失真健康信息占比較高。如基于描述性分析,研究發(fā)現與預防和治療方法相關的、與日常生活相關的失真健康信息在社交媒體上占比最高[29]。②互聯網環(huán)境下特定健康主題的失真健康信息的傳播特征。有研究表明在推特(Twitter)和臉書(Facebook)上新冠肺炎相關的帖子傳播失真信息的概率相較于其他健康主題更小[30],而且隨著疫情爆發(fā),失真信息的整體含量比前一年預期的少。
(3)圖像特征。除了文本類型的失真健康信息,有學者開始從圖像維度探究失真健康信息的傳播。隨著各類以圖片、視頻分享為主體的社交媒體,如INS(instagram)、TikTok、小紅書和抖音的流行,包含圖像的失真健康信息開始具有更強大的影響力,可能通過情感作用提升說服力[31]。You‐Tube上有關癌癥的失真信息相關內容的觀看數和點贊數反而多于科學性內容[32],Zhou等[33]發(fā)現引人注目的標題和情緒化的圖像會誤導老年人對失真健康信息的判斷,實驗表明,被試者僅成功判斷了41.38%的失真健康信息。這意味著包含圖像的失真健康信息更容易被理解或獲取,因此,它們更容易在社交媒體平臺上傳播。
本節(jié)主要是從信息接收方的角度探討哪些因素會對社交媒體用戶參與失真健康信息傳播行為產生影響,促進社交媒體失真健康信息的傳播。現有研究可以分為微觀視角和宏觀視角,前者是從個體層面研究個體對失真健康信息甄別和傳播行為的影響因素,后者則是從群體層面分析社交網絡用戶的群體特征,基于心理學理論和網絡理論解釋社交媒體平臺失真健康信息傳播機制。
(1)人口統計學因素。種族、年齡、受教育水平、性別等均與失真健康信息的傳播密切相關,例如,老年人[33]、教育水平低[34]、美國少數種族群體[35-36]、非洲人[37]等均被認為是失真信息的主要受害者,是學者研究的重要對象。國內研究發(fā)現,男性、年齡較高以及受教育水平較低會促進對失真健康信息的信任[1]。已有研究主要在探索什么樣的統計學特征更容易受到失真健康信息影響,但對于特定群體的深入探索還不足。
(2)健康素養(yǎng)。健康素養(yǎng)是指個體獲得、處理與理解基本健康信息與服務的能力[38]。具體而言,包括與健康相關的固有認知和知識技能、對健康信息進行閱讀和理解的能力、整合健康信息做出健康決策的能力等。由于健康信息非常個人化,人們往往會無意識地自動選擇確認符合其先前觀點的信息,因此,人們受到失真健康信息的影響程度取決于個體對主題的了解程度[39]。缺乏知識或技能、對醫(yī)療保健系統不信任、對替代醫(yī)學持積極態(tài)度的個體往往更容易受到健康失真信息的影響[40]。研究表明,個體健康素養(yǎng)的提升可以幫助用戶甄別失真健康信息[1,5,7]。
(3)技術熟練程度。在技術熟練程度特征中,用戶的“信息素養(yǎng)”在評估網站可信度以及評價網站結構、信息特征方面發(fā)揮了重要作用。用戶能夠使用信息工具和資源獲取信息、識別信息、加工信息、傳播信息。McMillan等[41]研究發(fā)現,經常使用在線資源的“健康技術專家”對檢索出的健康信息更信任,而較少使用互聯網的“健康傳統主義者”對網絡健康信息的信任度較低。不同媒體平臺發(fā)布的健康信息會影響用戶的可信度判斷。Ma等[42]研究表明,當健康信息在不同媒體平臺發(fā)布時,可信度有所不同,用戶在網站、博客以及論壇上采用不同策略來判斷信息源,從而找到可信健康信息,用戶越依賴某個信息源,越有可能判斷該信息源提供的信息是可信的。
(4)情感與信任。信息社會將人們的注意力視為優(yōu)先的資源,而情緒化的內容通常起到吸引注意力的作用,從而對外界信息的處理產生負面影響。失真健康信息的大范圍傳播并不是因為其內容低質,而是因為它有極強的心理吸引力。例如,引起威脅、厭惡或社會關系,從而刺激用戶對其做出反應[43]。健康焦慮、錯誤的健康信念均會正向影響用戶對失真健康信息的信任程度[44-45]。基于O-S-O-R(organism-stimuli-organism-response)模型,學者研究發(fā)現對于新冠肺炎疫情的擔憂加劇了社交媒體信息過載,導致社交媒體疲勞,這可能阻礙用戶對健康信息真實性的核查[46]。尤其是對于傾向于相信失真健康信息的用戶而言,不愉快的、消極的信息搜尋體驗會減少用戶認真思考外界信息的真實性[47]。在魚龍混雜的健康信息中,感知來源可信度對感知信息可信度具有顯著的正向影響[48],Wu等[49]探究了數字媒體依賴對失真健康信息信念的影響,結果表明對社交媒體和替代健康媒體的依賴更容易使人相信失真健康信息。
(5)網絡特征。失真健康信息在大規(guī)模擴散過程中呈現一定規(guī)律的網絡特征,現有研究主要是基于網絡理論考察失真信息傳播的群體效應,通過數學建模、社會網絡分析等方式模擬和研究失真信息在社交媒體傳播的社會機制。確認偏誤(confirma‐tion bias)是指用戶對事實問題的看法會受到預先認知的強烈影響,并且尋找可以確認其能夠證明預先認知的證據以驗證自己的預先認知[49-50],群體確認偏誤下導致的選擇性接觸行為會形成同質群體,即具有類似信念、觀點的個體會在社交網絡中聚集在一起,成為一個小社區(qū)。這種現象在互聯網的推薦機制下更為凸顯,暴露出一些潛在危害。例如,基于YouTube推薦算法構建視頻網絡結構,探究是否存在特定的社區(qū)主題在推薦更多的失真健康信息,如反疫苗接種內容[51-52]。同樣的問題也存在于亞馬遜的圖書推薦中,研究人員討論了盲目將商業(yè)化推薦算法應用于復雜的健康信息中的潛在后果[53]。社交媒體上的信息獲取是一種迎合用戶偏好的協同過濾機制,用戶與用戶之間交換不同觀點的可能性會被進一步降低,增加了在封閉網絡中放大失真信息的風險[54]。Safarnejad等[55-56]基于推文的轉發(fā)數據推測失真健康信息的傳播網絡,并提取了9個網絡指標用于預測失真健康信息的傳播。研究發(fā)現,社交網絡中圍繞陰謀和科學主題存在著2個形成良好且高度隔離的社區(qū)[57]。Seymour等[58]發(fā)現Facebook上反對在飲用水中添加氟化物的激進分子間形成的人際網絡高度互聯。Nazar等[59]探究了一個新冠肺炎疫情相關的誤導視頻在推特上進行傳播的社區(qū)結構和交流模式,研究發(fā)現該視頻通過指導低影響力用戶大規(guī)模分享,有效破壞了錯誤信息的封鎖。通過探究接收群體的網絡特征有助于深入了解失真健康信息大規(guī)模傳播現象,并為失真健康信息的治理提供新的思路。
大數據、人工智能時代的到來激化了人們日益增長的信息需求與日趨困難的可信度識別之間的矛盾[60],對失真健康信息識別和判斷的研究更加顯得重要和迫切。為克服用戶評估健康信息可信度的主觀性,研究者將算法技術與醫(yī)學知識相結合以設計健康信息可信度的自動評估算法。在醫(yī)學領域,專家通過循證醫(yī)學(evidence-based medicine,EBM)來確定健康信息的可信度,循證醫(yī)學是一種基于當前最佳證據、臨床專業(yè)知識和患者需求的系統評估健康信息的方法[61]。Samuel等[62]將循證醫(yī)學與自動化計算結合開發(fā)了MedFact算法,該算法從社交媒體文章中提取與健康相關的未知短語,通過查詢可信的醫(yī)學知識數據庫獲得可信短語,然后訓練卷積神經網絡(convolutional neural network,CNN)計算與健康相關的未知短語和可信短語之間的一致性評分,以此評估健康信息的準確性。與此類似的還有Park[63]提出的HealthTrust系統,基于一組已知可信的健康網站自動評估在線健康信息的可信度。但可信的醫(yī)學信息之間可能偶爾包含矛盾的事實,有待進一步優(yōu)化彼此間的協議[62]。
為了在信息傳播的早期階段迅速識別出失真健康信息,許多研究設計了能夠有效自動識別失真健康信息的模型。在失真信息檢測算法中,基于特征的算法依靠不同類型的信息特征來區(qū)分真假信息[64],基于圖的算法通過目標群體的傳播協調來檢測失真信息[65],而基于模型的算法則是在信息傳播模型的基礎上仿真信息傳播模式[66]。其中,被用于失真健康信息識別中最多的是基于特征的算法[67],大多數識別模型依賴于從信息中生成相關特征來幫助區(qū)分真假信息,通過分析數據集提取出信息特征,運用各種分類算法構建失真健康信息識別模型,具體如表3所示。
表3 失真健康信息自動識別模型研究匯總表
在失真健康信息識別模型研究中,研究者通常使用網絡平臺內真實的數據作為數據集,以此來提供一個真實的數據分析場景。通常選用的數據集有微博[72]、微信[72]、貼吧[19]、Twitter[67,69-71]、YouTube[74]、snopes.com[73]等平臺網站上與健康相關的文章、評論、視頻等數據資料。目前能夠用于評估失真健康信息的公開可用數據集不多,考慮到能夠從數據集中提取網頁原始HTML(hyper text markup lan‐guage)格式,有研究使用微軟可信度數據集、醫(yī)療網絡可靠性語料庫、CLEF eHealth 2020 task-2數據集比較評估模型有效性[79]。
失真健康信息的特征是基于特征的識別模型的分析基礎,許多研究者將從網絡上收集的數據信息經過人工標注后進行特征分析。內容分析法被廣泛用于分析社交媒體上健康錯誤信息的內容和傳播特征[73]。張帥[80]按照開放式編碼、主軸編碼和選擇式編碼對失真健康信息進行編碼分析,融合和聚類為表面特征、語義特征和來源特征3個維度。Zhao等[19]通過編碼分析對數據集進行分解、檢查、比較、概念化和分類,完成對文本數據組織和理解以便提取信息特征。Li等[81]對微信中的健康信息進行了真、假健康信息分類,并利用卡方檢驗識別出微信中失真健康信息的顯著特征?,F有研究中提取出的信息特征主要有語言特征[19,68,70,72-77]、用戶特征[67,72]、行為特征[19,67,71,76]以及聲學特征[74]等。其中,語言特征包括LIWC(linguistic inquiry and word count)特征、n-grams特征、情感特征、特定詞頻特征、某些標點或特殊詞的頻率等。在不同的數據集中選用不同特征對識別在線失真健康信息會存在有效性差異[82]。
基于提取出來的信息特征,不同的研究通常選擇使用不同的技術算法構建失真健康識別模型,研究者常采用的算法有隨機森林(RF)[67-68]、支持向量機(SVM)[19,70-72,74-78]、隨機梯度下降(SGD)[75]、邏輯回歸(LR)[19,70,77]、k最近鄰(kNN)[19,72]、卷積神經網絡(CNN)[77]、多層感知器(MLP)[70]、長短期記憶網絡(LSTM)[75,78]等。例如,Sicilia等[67]開發(fā)的檢測系統專注于Twitter上與寨卡病毒有關的失真健康信息,利用隨機森林分類器對實際數據集進行測試的準確率達到71.4%。Hou等[74]的研究自動檢測了YouTube視頻中的失真健康信息,他們采用基于SVM開發(fā)的失真健康檢測模型的準確率高達74.4%。此外,在同一研究中不同的算法模型會有不同的表現,研究者通常進行比較后選擇最優(yōu)的算法。在Zhao等[19]的研究中,RF模型具有比其他模型更高的性能,且時間和空間消耗更低。Deb等[70]認為卷積濾波器能夠提取局部特征和捕捉單詞之間的相似性,基于字符的卷積神經網絡(Char-CNN)的特性適合用于推文場景下的失真健康信息檢測模型。
各類識別算法主要是將互聯網上失真健康信息的特征納入考量,大多數研究都選擇提取信息的語言特征。健康信息可信度評估算法的目的是實現自動化評估,但大多數算法的開發(fā)研究在實際使用場景中的效用還未知,且鮮有對于算法的實際含義以及潛在的倫理問題進行討論。此外,在大數據時代,存在失真健康信息更新速度和傳播模式變化的各種可能性,可信度評估算法中也應考慮到模型更新的問題[83]。
大量未經核實的健康信息易在線獲得,學者們探索了基于網絡的在線健康檢索系統改進和優(yōu)化的可能性,檢測和減緩失真健康信息在網上的快速傳播。相關研究已拓展至社會計算領域,借助算法預測和識別可能發(fā)布或傳播失真健康信息的用戶,并采取干預措施來屏蔽失真信息,積極向用戶推薦可靠的健康信息和受信任的信息平臺。
用戶是構成失真健康信息傳播路徑中的節(jié)點,在失真健康信息傳播網絡中扮演著重要角色,對其是否可能發(fā)布或進一步傳播失真信息進行主動識別,干預被識別為傳播節(jié)點的用戶所傳播的失真健康信息,從而有助于遏制虛假信息的傳播。目前,少部分健康相關的低可信度網頁擁有大量用戶,但在整體上低可信度網頁比其他網頁的用戶更少[84]。在用戶接觸到失真信息之前檢測出潛在的傳播者,以提高用戶自身的警惕性以及避免對其他用戶產生誤導性的傳播影響。Ghenai等[85]以用戶為中心構建識別模型,基于邏輯回歸算法的分類器識別出社交媒體中傾向于傳播此類失真信息的用戶。朱宏淼等[86]計算出失真健康信息傳播者閾值,建議可根據傳播初期的傳播者數量對失真健康信息的擴散度進行預測。失真健康信息的傳播網絡不同于真實信息的傳播網絡,Safarnejad等[55-56]將失真健康信息與各種指標的真實信息進行對比,構建了寨卡病毒流行期間寨卡病毒失真信息在社交媒體上擴散的實際動態(tài)傳播網絡,該擴散模式反映出失真健康信息傳播動態(tài)的時間順序變化,失真健康信息傳播直接在用戶之間或小集群之間傳播,有別于真實信息遵循的分層傳播。在信息的傳播網絡中對失真健康信息傳播者追蹤有益于政府機構監(jiān)測社交媒體上的言論,確定當前健康信息傳播策略的缺陷,在造成嚴重危害之前發(fā)現失真健康信息。
針對用戶發(fā)出的信息檢索需求,對現有數據的準確性、相關性和可靠性進行分析評估后,將滿足用戶需求的可靠健康信息進行推薦和排序,實現健康信息的優(yōu)化推送。研究者提出的MedFact算法[62]能夠自動從在線討論中提取相關關鍵詞,查詢可信的醫(yī)學文獻后將可信的醫(yī)療信息嵌入討論中以實現內容推薦,使在線用戶能夠對在線健康信息的可信度做出明智的決定。Deb等[70]設計的社交機器人Notobot采用Char-CNN算法實現為用戶推薦與反吸煙高度相關的信息,Notobot能夠成功分析出目標推文,并在用戶提到時發(fā)布推文。Shams等[87]提出的搜索引擎擴展程序SEMiNExt能夠從搜索欄中讀取用戶查詢,對查詢到的健康信息進行分類,并實時向用戶通知結果的真實性。該拓展程序集成了自然語言處理和機器學習算法,在訓練中實現高準確度的預測。Pandey等[88]開發(fā)的WashKaro應用程序使用AI(artificial intelligence)將健康信息與WHO(World Health Organization)建議的準確信息進行匹配,并通過聊天機器人系統用可理解的當地語言為用戶提供準確的健康信息,減少失真健康信息的傳播,進而改善健康信息的傳遞。這樣的算法可以有效地減少網上失真信息的傳播,但信息內容的自由流通可能受到威脅,而所提出的算法在現實場景運用中可能不夠準確或無效[52-53]。
互聯網失真健康信息的傳播過程中通常會涉及不同個體,如在社交媒體上主動發(fā)布失真健康信息的用戶以及接收這些信息的用戶。不同用戶之間存在健康信息素養(yǎng)差異,失真健康信息傳播的受害者主要是健康信息素養(yǎng)較低的群體。阮智慧等[89]基于SIRS(susceptible, infected, recovered, susceptible)模型構建了失真健康信息傳播的系統動力學模型,分析表明用戶健康信息素養(yǎng)水平越高,則識別失真健康信息的能力越強,從而減少了失真健康信息的轉發(fā)。目前全球范圍內存在較大比例的人口數字衛(wèi)生知識普及程度低,直接導致了有關COVID-19的失真健康信息的傳播以及破壞性影響的產生[90]。健康素養(yǎng)教育通過增強用戶的健康信息素養(yǎng)以提升其評估在線健康信息可信度的能力[83],主要開展形式為講座[91],在社區(qū)、學校、圖書館等舉辦與公眾進行面對面指導的講座。例如,圖書館可提供各類健康信息服務以促進健康信息素養(yǎng)的提升[92-93],但受限于數據和技術以及服務針對性、即時性的不足,健康信息服務的能力和效果難與政務、企業(yè)信息服務主體相比[94]。此外,在線學習項目[95]幫助用戶獲得在線健康信息的使用、溝通和搜索等技能,也是提高用戶健康信息素養(yǎng)的有效方式之一。提高用戶健康信息素養(yǎng)和健康知識吸收涉及多方主體,亟待多方協同制定向公眾傳播健康知識的有效策略。
健康信息傳播需要由專業(yè)人士創(chuàng)造高質量的健康信息,媒體將其準確地傳達給公眾[5]。社交媒體上傳播的健康信息應該是可讀的、可理解的、相關的、一致的、明確的和可信的[96-97]。醫(yī)生群體、衛(wèi)生機構和科學家等專業(yè)群體利用專業(yè)知識來創(chuàng)建和認證更可靠的、用戶可訪問的在線健康信息[24,98],增加在社交媒體上與公眾進行交流的次數,以及與媒體開展更緊密的合作提高健康信息的準確性和科學性[5]。斯坦福全球健康媒體獎學金項目通過在科學寫作和醫(yī)學新聞藝術方面培訓醫(yī)療保健專業(yè)人員,讓更多的衛(wèi)生保健專業(yè)人員制作和分享準確的健康信息以提高健康素養(yǎng)[99]。有研究通過短期教育課程教授醫(yī)學生健康傳播基礎知識,提升他們通過大眾媒體與非專業(yè)受眾交流的舒適度和感知能力,增加他們公開傳播正確健康信息的可能性[100]。醫(yī)學期刊在征集和發(fā)表關于失真健康信息研究的稿件外,在控制傳播方面可納入尋找失真健康信息提供者的工作[101]。媒體平臺在健康類信息的轉述和審核上要提高語言表達的準確性,謹慎對待新聞標題的微小變化以及在正文中加上明確的因果關系說明,提高后續(xù)新聞標題和報道的準確性[102],減少健康信息在社交媒體中被夸大或歪曲的現象。
健康信息傳播者通過及時發(fā)布糾正性的信息,增加與用戶的溝通,可以讓用戶及時感知到健康信息的失真,重新接收到科學、真實、準確的健康信息。尤其是在公共衛(wèi)生事件危機中,糾正信息能夠滿足公眾對可信信息和有效溝通的迫切需求[103],從而塑造人們對公共衛(wèi)生的正確理解。糾正信息特征方面,糾正性信息的具體證據表述應該簡短且注重事實的傳達[104],過多地強調被糾正的內容反而會增加誤解。為實施糾偏行為而把失真健康信息本身納入糾正性信息,人們很可能只記得信息本身進而產生熟悉效應,在這種效應下的失真信息反而容易獲得人們的信任,強化失真健康信息[105]。糾正信息來源方面,專家來源(包括政府、衛(wèi)生機構)、新聞媒體和社交媒體用戶可以糾正有關公眾衛(wèi)生問題的失真信息[29,106-110],并增加所有健康信息傳播者的糾正頻率[5]。糾正方式方面,醫(yī)療保健專業(yè)人員在糾正社交媒體上的失真健康信息時,大多首選公開性的糾正方式[111],社交媒體用戶在Facebook發(fā)布或評論糾正性健康信息的社交性糾正與算法糾正同樣有效[112]。由于微信朋友圈的用戶之間存在較高的信任感,與在Facebook、推特上的糾正相比,用戶在微信朋友圈糾正更為容易[113]。MacFarlane等[114]的研究將基于衛(wèi)生當局材料的初步糾正與基于最佳實踐建議的強化糾正進行對比,發(fā)現強化糾正的方式在遏制虛假信息宣傳方面更為有效,失真健康信息文章后面跟著一篇糾正文章,非簡單地指出失真健康信息文章缺乏證據,而是讓讀者注意失真健康信息文章中的欺騙性和誤導性并解釋其中的欺騙原理。值得注意的是,用戶瀏覽過失真健康信息會降低個人信息素養(yǎng)及其對社會價值的認知,失真健康信息糾正后仍可能產生負面影響,如出現兩極分化的情況,失真健康信息的糾正效果降低[115],或加劇社會分裂的風險,使持有相反觀點的人更加疏遠真實健康信息[116]。此外,對失真信息進行多次糾正并不一定能產生好的效果,如在疾病預防控制中心已經糾正失真健康信息之后,其他傳播者進行第二次不同的糾正可能會產生適得其反的效果[8]。
通過上述對文獻的梳理和歸納分析,可以較為全面、系統地了解失真健康信息目前的研究進展。隨著互聯網信息傳播技術和傳播環(huán)境的不斷變化,失真健康信息還存在如下的研究空間。
(1)失真健康信息對老年人群體的影響研究。由于老年人健康素養(yǎng)相對較低,對健康類信息又特別關注,更容易頻繁接觸并相信失真健康信息,也更愿意分享失真健康信息,因此,老年人群體中的失真健康信息更值得關注。一方面,已有研究主要是將年齡、性別等人口統計學因素作為失真健康信息可信度的關聯項進行研究,對于特定群體的聚焦程度還不夠,只有少數學者開始以老年人作為研究對象,探討失真健康信息如何獲取他們的信任[33]。另一方面,現有研究中對于失真健康信息危害的影響研究較少,大多停留在論述層面,即可能誤導用戶做出錯誤的健康行為,如相信新冠肺炎疫情陰謀論會導致用戶不采取流感保護行為[117]。也有研究提出相反的意見,認為實際上失真健康信息的危害并沒有想象中嚴重,因為用戶并不傾向于對這些信息進行互動[43]。因此,失真健康信息-認知-行為的影響邏輯缺乏充分的論證。老年人經常會做出錯誤的健康行為,如使用替代性療法、購買無用的保健品、盲目分享失真健康信息、抗拒注射疫苗等,在這些行為背后,失真健康信息及其特征是如何影響的,是否和年輕人群體存在不同,這都需要研究人員采取更多實證研究予以探索。未來可以采取問卷調研、對比實驗等方法,嘗試解決:①老年人群體的哪些健康決策受到互聯網失真健康信息的影響;②什么樣的失真健康信息來源和內容特征導致了這樣的影響;③老年人的失真健康信息分享行為和年輕人有什么區(qū)別,是否存在特殊的傳播機制等問題。
(2)擴展視覺類失真健康信息的傳播研究。研究表明,YouTube上許多誤導性的視頻受到很大的歡迎,如誤導性的支持厭食癥的視頻[118],相反地,來源于官方媒體的科普視頻,如急性心肌梗死的視頻,并不受關注[119]。這些不科學的科普視頻有更多的評論、點贊和分享行為,因此,包含圖像、視頻的視覺類失真健康信息研究是值得重點關注的話題之一?,F有失真健康信息研究中,大多以文本信息作為樣本進行研究,視覺類型的失真健康信息受到的關注較少。視覺類型信息更加復雜,并且包含文本、音頻等附加信息,如何識別并過濾此類失真信息是一個值得關注的難題。首先,針對視覺類失真健康信息的識別,可以通過多模態(tài)技術提取這類視頻的圖像特征,也可以通過提取視頻的文本信息和用戶行為特征,采取機器學習方法進行過濾。其次,需進一步研究視覺失真健康信息的核心觸及人群有哪些,什么樣的特征更容易使其被誘導,需要進一步了解人們如何遇到視覺失真信息,以及是否存在數字鴻溝的問題。另外,個體在接觸到視覺失真健康信息后,如何改變其認知和后續(xù)分享行為,可以借助視覺觀測儀器,如眼動儀,進行深入研究,為解決視覺失真健康信息問題提供行之有效的建議。
(3)失真健康信息特征的識別研究?;谟脩魝€人判斷的失真健康信息識別在一定程度上具有主觀性、片面性,越來越多聚焦算法的評估與識別研究以客觀標準來實現為用戶自動提供信息甄別幫助的功能。目前,基于特征的算法在失真健康信息識別算法中占據主流,其挖掘出的主要特征是針對文本類失真健康信息,如信息的語言特征。未來可以采用更多的方法探索其他特征,并結合不同的分類算法構建更有效自動識別失真健康信息的模型。由于學者們通常針對主流語言文化地區(qū)的失真健康信息展開研究,少有資源支持需要特定方案才能實現準確翻譯和分類的非主流語言地區(qū)失真健康信息的識別研究[78],亟待相關的數據集開發(fā)、信息特征提取和算法構建研究。但無論哪種語言文化,語言表述中常包含與地域文化相關的修辭手法或隨時代發(fā)展而產生的網絡用語等,這也是當前算法還未完全學習訓練、有待改進更新的部分,算法識別的準確性在這方面還有較大提升空間。此外,視覺類信息在網絡上無處不在,視覺內容的覆蓋面和影響力不遜于文本內容,且容易吸引用戶的注意力,越來越多的用戶選擇從視覺類健康信息中獲取所需信息以進行健康決策,而夾雜在視覺信息中的失真健康信息會威脅公眾健康,針對視覺類失真健康信息的特征識別有待深入探究。
(4)失真健康信息協同干預的治理研究。失真健康信息的治理過程所采用的各種干預手段,大多都需要多主體的共同參與。算法模型提供失真健康信息識別、干預的技術支撐,機構加強健康信息的準確傳播、有效監(jiān)管、精準糾偏,公眾提升自身的健康信息素養(yǎng)和對信息真實性的判斷能力,共同應對失真健康信息帶來的負面影響。目前,對失真健康信息的干預主要是依賴專業(yè)人員和權威機構的力量,少量研究基于算法技術實現自動跟蹤的集成,通過社會計算實驗模擬失真健康信息傳播網絡[55-56],但僅基于構建的傳播網絡而未完成強制干預措施,如將失真健康信息的傳播用戶從傳播網絡中剔除、有效打斷或終止傳播路徑,這些干預方式在失真健康信息治理領域值得討論。在失真健康信息傳播事后治理方面,糾偏是公共部門使用頻率最高的干預方式,通常是由專業(yè)人員和權威機構等發(fā)布糾正信息,讓公眾接收到科學、真實、準確的健康信息,但失真健康信息和糾正信息之間的時間間隔以及糾正信息的曝光時間對糾正效果程度的影響還需要進一步明確,未來也需要討論不同群體間文化、態(tài)度、信任的差異,將干預策略的道德約束與法律監(jiān)管考慮在內,協同更多主體參與到失真健康信息治理中。