胡雪嬋,韓雪峰,申晴
(1.東北師范大學(xué)國(guó)際漢學(xué)院,吉林 長(zhǎng)春 130000;2.中國(guó)科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所,吉林長(zhǎng)春 130000;3.長(zhǎng)春師范大學(xué)外國(guó)語(yǔ)學(xué)院,吉林 長(zhǎng)春 130000)
醫(yī)療器械指的是能夠?qū)崿F(xiàn)一項(xiàng)或多項(xiàng)醫(yī)療用途的設(shè)備或軟件。為了加強(qiáng)對(duì)醫(yī)療器械的說明書、標(biāo)簽和包裝標(biāo)識(shí)的進(jìn)一步管理,2014 年10 月1 日起,我國(guó)施行了《醫(yī)療器械說明書和標(biāo)簽管理規(guī)定》(國(guó)家食品藥品監(jiān)督管理總局局令第6 號(hào)),對(duì)醫(yī)療器械說明書等文字材料的使用進(jìn)行了明確的規(guī)范和指導(dǎo)。醫(yī)療器械的說明書是醫(yī)療器械的重要組成部分,這一部分的撰寫是否清晰合格直接影響著該器械能否通過審核并生產(chǎn)上市,更關(guān)乎上市后使用者的使用體驗(yàn),所以建立醫(yī)療器械用語(yǔ)的材料庫(kù)就成為了亟待著手的一大重要課題。
以往,醫(yī)療器械的研發(fā)均由專業(yè)的技術(shù)人員完成,完成研制器械本身之后,再由這部分技術(shù)人員按照操作流程自己撰寫說明書,但完成研發(fā)的技術(shù)人員多為醫(yī)學(xué)背景或工程技術(shù)人員,未經(jīng)過專門的語(yǔ)言訓(xùn)練,文字書寫表達(dá)能力欠佳,所以從前的醫(yī)療器械說明書的撰寫大多不受重視,粗糙潦草,表意不清,用詞不明,為使用者帶來了諸多不便。因此,國(guó)家審核部門近年來加大了醫(yī)療器械說明書和標(biāo)簽等文字材料的審核力度,一大批器械本身合格但說明書簡(jiǎn)陋、表達(dá)不清的醫(yī)療器械未能完成申請(qǐng)上市,其中不乏一些知名生產(chǎn)商的產(chǎn)品,這說明醫(yī)療器械的配套文字材料的地位和重要性在逐步上升,所以如何規(guī)范地選用詞語(yǔ)和句型來撰寫說明書,已經(jīng)成為了擺在生產(chǎn)商面前的重點(diǎn)和難題。于是,建立一個(gè)完備的、標(biāo)準(zhǔn)清晰且收詞科學(xué)的醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)以指導(dǎo)醫(yī)療器械說明書的寫作已經(jīng)迫在眉睫。
從語(yǔ)料庫(kù)的角度來分類,醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)屬于專門用途語(yǔ)料庫(kù),專門收錄用于編寫醫(yī)療器械名稱、醫(yī)療器械使用說明書和醫(yī)療器械標(biāo)簽等文字材料的詞匯和句型句式。其基本的建立和操作,可借鑒的經(jīng)驗(yàn)和技術(shù)頗多:
UMLS 是一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)(Unified Medical Language System)的簡(jiǎn)稱,這個(gè)系統(tǒng)最早由美國(guó)國(guó)立醫(yī)學(xué)圖書館于1986 年開發(fā),主要用于幫助使用者在查找病案記錄、書目數(shù)據(jù)庫(kù)、事實(shí)數(shù)據(jù)庫(kù)以及專家系統(tǒng)的過程中對(duì)其中的電子生物醫(yī)學(xué)情報(bào)作一體化檢索。UMLS 系統(tǒng)由四部分組成:超級(jí)敘詞表、語(yǔ)義網(wǎng)絡(luò)、情報(bào)員圖譜和專家詞典。超級(jí)敘詞表廣泛集成了生物醫(yī)學(xué)概念、術(shù)語(yǔ)、詞匯及其含義、等級(jí)范疇;語(yǔ)義網(wǎng)絡(luò)為超級(jí)敘詞表中的所有概念提供了語(yǔ)義類型及相互關(guān)系結(jié)構(gòu),是聯(lián)接龐大詞匯的“血管”;情報(bào)源圖譜是一個(gè)關(guān)于生物醫(yī)學(xué)機(jī)讀情報(bào)資源的數(shù)據(jù)庫(kù);專家詞典包含了一個(gè)英語(yǔ)詞匯數(shù)據(jù)庫(kù)和一組詞典和詞索引程序。
使用至今,UMLS 系統(tǒng)已經(jīng)比較完備,收詞量大,語(yǔ)義關(guān)系相對(duì)較清晰,檢索效率高,誤差率得到有效控制[1]。
建立醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)可以借鑒的主要集中在超級(jí)敘詞表這一部分。語(yǔ)料庫(kù)的建立,從根本上來看是眾多相關(guān)詞匯信息不斷分類并不斷被提供的過程,所以詞匯的分類標(biāo)準(zhǔn)、標(biāo)注技術(shù)、檢索關(guān)鍵點(diǎn)是醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)建立的幾個(gè)重要指標(biāo)。超級(jí)敘詞表中的《通用醫(yī)學(xué)儀器術(shù)語(yǔ)系統(tǒng)——產(chǎn)品目錄詞表》(1997 年)可以為醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)提供一些有用的范式。
基于UMLS 的幾個(gè)中文醫(yī)學(xué)語(yǔ)言系統(tǒng),已經(jīng)展開了初步研究:中文一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)(中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所研發(fā))和中醫(yī)藥一體化語(yǔ)言系統(tǒng)(中國(guó)中醫(yī)研究院研發(fā))是其中的典型。從本質(zhì)來講,醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)應(yīng)該是中文一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)的子系統(tǒng),側(cè)重點(diǎn)是醫(yī)療器械用語(yǔ)而非醫(yī)藥生物科學(xué)類的詞匯,所以醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)的建立是完全可以參照已建成的幾個(gè)中文醫(yī)藥語(yǔ)料庫(kù)的既往經(jīng)驗(yàn)。
醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)的本質(zhì)是語(yǔ)料庫(kù),一般語(yǔ)料庫(kù)的建立分為三個(gè)基本步驟:1.收集和選擇詞表;2.規(guī)范并整理概念,形成統(tǒng)一的標(biāo)記,建立概念之間的聯(lián)系;3.構(gòu)建語(yǔ)義網(wǎng)絡(luò)。我們可以按照這個(gè)順序,完成建立醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)的初步構(gòu)想。
詞表的收集可以借鑒的內(nèi)容包括市場(chǎng)上流通的醫(yī)療器械產(chǎn)品(主要是產(chǎn)品說明書和標(biāo)簽)、中國(guó)醫(yī)學(xué)語(yǔ)料庫(kù)(中文一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)的子系統(tǒng))、《通用醫(yī)學(xué)儀器術(shù)語(yǔ)系統(tǒng)——產(chǎn)品目錄詞表》(來自UMLS 超級(jí)敘詞表)等。收詞標(biāo)準(zhǔn)可以直接采用《醫(yī)療器械說明書和標(biāo)簽管理規(guī)定》中關(guān)于醫(yī)療器械說明書和醫(yī)療器械標(biāo)簽內(nèi)容的規(guī)范,按照詞語(yǔ)在醫(yī)療器械文字信息中出現(xiàn)的不同位置,分為“名稱類”“功能說明類”“操作說明類”“禁忌類”“維護(hù)修理類”“警示類”等[2]。
語(yǔ)料庫(kù)的實(shí)質(zhì)是語(yǔ)義網(wǎng)絡(luò),而語(yǔ)義網(wǎng)絡(luò)的實(shí)質(zhì)是多種語(yǔ)義類型及相互關(guān)系的概念集合。醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)作為專門用途語(yǔ)料庫(kù),建立初衷就是建立醫(yī)療器械術(shù)語(yǔ)(名稱、說明等詞匯)之間的語(yǔ)義有機(jī)網(wǎng)絡(luò),通過多種語(yǔ)義類型為網(wǎng)絡(luò)中的所有概念繪制目錄組織結(jié)構(gòu)。
UMLS 中包含135 種語(yǔ)義類型和51 種連接關(guān)系。最高層的語(yǔ)義類型分為“物”和“事”兩大類,所有的語(yǔ)義類型通過語(yǔ)義關(guān)系鏈連接在一起,這些鏈條又分為等級(jí)關(guān)系鏈(H)和非等級(jí)關(guān)系鏈[相關(guān)關(guān)系鏈](R):等級(jí)關(guān)系鏈就是常見的“is a 關(guān)系鏈”(即A is a B.),非等級(jí)關(guān)系鏈[相關(guān)關(guān)系鏈]又可以分為“物理相關(guān)”“空間相關(guān)”“功能相關(guān)”“時(shí)間相關(guān)”“概念相關(guān)”等關(guān)系。等級(jí)關(guān)系鏈的從屬關(guān)系大多是可以繼承的,而非等級(jí)關(guān)系鏈一般不具備這個(gè)特征。
醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)又不完全與UMLS 相同,因?yàn)獒t(yī)療器械說明類文字材料語(yǔ)義范圍更專一和集中,各個(gè)詞匯之間的關(guān)系更傾向于平面的,而非如UMLS 一樣立體可繼承的。如上文所說,我們可以將醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)的收詞語(yǔ)義標(biāo)準(zhǔn)按照詞匯出現(xiàn)的位置來制定,如在“操作說明”這一類中,我們可能會(huì)遇到“按”“按下”“摁”“摁住”“輕摁”“踏下”“踩住”“輕踩”等等表示類似動(dòng)作的詞語(yǔ),這就需要我們建立一個(gè)表示“(用手指或腳掌)向下用力”的語(yǔ)義集群,將這些詞語(yǔ)置于同一集群之下。這里不妨參照UMLS 超級(jí)敘詞表的三級(jí)結(jié)構(gòu)模式:CUI(概念唯一標(biāo)識(shí)符)、LUI(術(shù)語(yǔ)唯一標(biāo)識(shí)符)和SUI(詞串唯一標(biāo)識(shí)符,指詞串術(shù)語(yǔ)的變異形式):CUI 為“向下用力”,在它之下有LUI“按”和“踩”,再底層就是多個(gè)SUI,如“按”“按下”“摁”“摁住”“輕摁”“踏下”“踩住”“輕踩”等等。
初步建立了醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)之后,我們可以充分利用語(yǔ)料庫(kù)語(yǔ)義類型及其關(guān)系對(duì)進(jìn)入到語(yǔ)料庫(kù)中的新詞語(yǔ)進(jìn)行控制,主要表現(xiàn)為:
一是詞匯學(xué)控制,主要是詞性、詞義或構(gòu)詞的控制,如表示“用力向下”這一語(yǔ)義類別之下通常為動(dòng)詞性詞語(yǔ),詞義為“用力向下”,構(gòu)詞上多為“動(dòng)補(bǔ)”或“狀中”結(jié)構(gòu);
二是語(yǔ)義控制,如在描述操作效果時(shí),總局規(guī)定在說明書和標(biāo)簽中不得出現(xiàn)含有“療效最佳”、“保證治愈”、“包治”、“根治”、“即刻見效”、“完全無毒副作用”等表示功效的斷言或者保證的詞語(yǔ)和含有“最高技術(shù)”、“最科學(xué)”、“最先進(jìn)”、“最佳”等絕對(duì)化語(yǔ)言和類似表述的詞語(yǔ),所以在標(biāo)注效果類詞語(yǔ)時(shí),應(yīng)局限為諸如“有時(shí)間過程的”“不作保證的”“不涉及排名的”此類的語(yǔ)義范圍,而“快速的”“保證”“最”這類的詞語(yǔ)就很難進(jìn)入語(yǔ)義網(wǎng)絡(luò);
三是語(yǔ)用學(xué)控制,即語(yǔ)義類型之間的相互關(guān)系(如組配關(guān)系、共現(xiàn)關(guān)系、頻率等等)控制,如“時(shí)間”類詞語(yǔ)和“顯現(xiàn)”類詞語(yǔ)就有“+共現(xiàn)”關(guān)系,比如“常出現(xiàn)”“通常表現(xiàn)出”“經(jīng)常顯示”等,再如表示情感類的詞語(yǔ)在醫(yī)療器械語(yǔ)料庫(kù)中的出現(xiàn)頻率幾乎為零,如“憤怒”“傷心”“沮喪”等詞語(yǔ),這不僅因?yàn)獒t(yī)療器械語(yǔ)料庫(kù)是“科技用語(yǔ)語(yǔ)料庫(kù)”,也是因?yàn)獒t(yī)療器械通常是作用于人體的生理方面而非心理方面,所以此類心理詞語(yǔ)在醫(yī)療器械語(yǔ)料庫(kù)中幾乎不會(huì)出現(xiàn)[3]。
隨著醫(yī)療器械市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,很多生產(chǎn)商從過去的由研發(fā)人員自己撰寫產(chǎn)品文字材料向外包給專業(yè)的醫(yī)療技術(shù)傳播公司來完成轉(zhuǎn)型,這說明醫(yī)療器械的文字編排撰寫工作已經(jīng)逐漸形成了一個(gè)專業(yè)方向。建立完善的系統(tǒng)的醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù),不僅有利于國(guó)產(chǎn)醫(yī)療器械的推廣上市,對(duì)外來進(jìn)口醫(yī)療器械產(chǎn)品的本地化進(jìn)程也起到了一定的推動(dòng)作用,如文檔本地化和操作界面本地化等。同時(shí),我國(guó)的藥品醫(yī)學(xué)技術(shù)譯介傳播工作仍在起步階段,藥品漢語(yǔ)語(yǔ)料庫(kù)的建立也迫在眉睫,醫(yī)療器械漢語(yǔ)語(yǔ)料庫(kù)可與之齊頭并進(jìn),共同發(fā)展,使我國(guó)的醫(yī)藥行業(yè)國(guó)際化進(jìn)程更快更順利。