文/談進(jìn)球 譚鈞鴻 郭子山
傳統(tǒng)的實(shí)驗(yàn)室合同評(píng)審資料管理主要是依靠人工管理。例如對(duì)于合同評(píng)審資料的信息錄入和保存工序,需要錄入人員將全部或部分合同評(píng)審資料信息錄入到計(jì)算機(jī)系統(tǒng)中分配檢驗(yàn)任務(wù),非常費(fèi)工費(fèi)時(shí),而且容易產(chǎn)生信息錄入錯(cuò)誤,導(dǎo)致檢驗(yàn)結(jié)果無效的風(fēng)險(xiǎn)。依據(jù)實(shí)驗(yàn)室管理要求,合同評(píng)審資料作為原始記錄的一部分需要保存一定期限,在存儲(chǔ)的過程中需要人工排序、標(biāo)記以便后續(xù)查閱與歸還。此管理過程也需花費(fèi)大量人力與時(shí)間、管理難度大。紙質(zhì)版資料經(jīng)過長(zhǎng)時(shí)間存儲(chǔ)后也會(huì)產(chǎn)生破損,導(dǎo)致資料缺失。
而標(biāo)準(zhǔn)信息化管理模式作為一種新型的技術(shù)機(jī)構(gòu)管理模式,能夠有效解決傳統(tǒng)的紙質(zhì)管理模式當(dāng)中存在的問題,實(shí)現(xiàn)標(biāo)準(zhǔn)化統(tǒng)一管理,從而提高技術(shù)機(jī)構(gòu)的管理質(zhì)量和管理水平,使技術(shù)機(jī)構(gòu)的工作更加科學(xué)、公正、及時(shí)、可靠[1]。通過研制與建立一種新型的基于OCR技術(shù)的實(shí)驗(yàn)室合同評(píng)審資料信息化管理方法,能有效地解決傳統(tǒng)的實(shí)驗(yàn)室合同評(píng)審資料管理所存在的問題。
因此,轉(zhuǎn)換為電子文檔系統(tǒng)存儲(chǔ)是當(dāng)前合同評(píng)審資料儲(chǔ)存的重要方向。目前將紙質(zhì)版文件資料數(shù)字化的普遍技術(shù)有縮微技術(shù)、掃描技術(shù)。合同評(píng)審資料的紙張品種較多,包含復(fù)印紙、印刷紙和不規(guī)則大小附件紙張,部分紙質(zhì)申請(qǐng)表含有布樣和訂書釘?shù)雀郊?。縮微技術(shù)是將文獻(xiàn)、工程圖紙以圖片等信息縮攝到縮微膠片上,并加以保存和利用??s微技術(shù)以膠片為信息載體,采用感光攝影原理,是目前一種比較成熟的文獻(xiàn)資料全文真跡存貯技術(shù)[2]。具有保存時(shí)間長(zhǎng)和法律效力等特點(diǎn),但是成本高、操作復(fù)雜,不適用于實(shí)驗(yàn)室紙質(zhì)合同評(píng)審資料電子存檔。掃描技術(shù)分為普通掃描和高速掃描,普通掃描是通過掃描儀對(duì)紙質(zhì)申請(qǐng)表進(jìn)行掃描,速度較慢并且繁瑣,另外由于紙質(zhì)申請(qǐng)表存在紙張褶皺、紙張大小品種不一以及含有布樣、訂書釘?shù)任锲罚浅H菀卓ㄔ趻呙鑳x的擦紙輪上,導(dǎo)致?lián)p壞設(shè)備。所以掃描技術(shù)也不適合紙質(zhì)申請(qǐng)表電子存檔。高拍儀是近年來研制的新產(chǎn)品,也稱速影儀或速拍儀。具有折疊式的超便捷設(shè)計(jì),體積只有普通掃描儀的1/10,紙質(zhì)版協(xié)議書只需放置在掃描區(qū)域,無需過機(jī)就能在一秒鐘內(nèi)完成高速掃描,并具有OCR文字和條形碼識(shí)別功能。與此同時(shí)還具有拍照、錄像、復(fù)印、網(wǎng)絡(luò)無紙傳真、制作電子書等眾多功能。高拍儀的上述特征能滿足紙質(zhì)申請(qǐng)表電子存檔的需求。
所謂OCR(Optical Character Recognition光學(xué)字符識(shí)別)技術(shù),是指利用電子設(shè)備(例如高拍儀)檢查紙上打印的字符,通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程。采用OCR技術(shù)實(shí)現(xiàn)實(shí)驗(yàn)室合同評(píng)審資料管理與傳統(tǒng)合同評(píng)審資料人工管理相比,優(yōu)勢(shì)首先在于操作簡(jiǎn)便高效、降低差錯(cuò)率、節(jié)約人工成本,同時(shí)也適用于實(shí)驗(yàn)室其他原始記錄資料管理,具備適用范圍廣和推廣性強(qiáng)等特點(diǎn),是當(dāng)前實(shí)驗(yàn)室科學(xué)高效管理的方向。
基于OCR技術(shù)的實(shí)驗(yàn)室合同評(píng)審資料信息化管理的實(shí)現(xiàn)離不開條形碼識(shí)別技術(shù)、光學(xué)字符識(shí)別(OCR)技術(shù)、高拍儀技術(shù)和計(jì)算機(jī)軟件系統(tǒng)的運(yùn)用。其中硬件包括條形碼打印機(jī)、標(biāo)簽紙、高拍儀、計(jì)算機(jī),硬件系統(tǒng)結(jié)構(gòu)如圖1所示:
圖1 硬件裝置圖
資料合同評(píng)審前需預(yù)先使用條形碼打印機(jī)在標(biāo)簽紙上打印出需要使用的條形碼。條形碼上面的信息是由九位數(shù)的流水號(hào)組成、每個(gè)條形碼的信息是唯一的。合同評(píng)審時(shí),需把條形碼粘貼到樣品袋上面,與此同時(shí)為了解決相應(yīng)的合同評(píng)審資料經(jīng)過掃描后、保存時(shí)能自動(dòng)以條形碼信息命名文件的需求,將受理的報(bào)告編號(hào)由單一編號(hào)設(shè)計(jì)成上下兩個(gè)相同的子母樣品編號(hào)條碼[3],如圖2所示。母編號(hào)貼在樣品袋上,子編號(hào)貼在對(duì)應(yīng)申請(qǐng)表上。粘貼在紙質(zhì)申請(qǐng)單上面的子編號(hào)條形碼的使用,為高拍儀自動(dòng)識(shí)別申請(qǐng)表上報(bào)告編號(hào)提供了基礎(chǔ),并作為該份合同評(píng)審資料的唯一識(shí)別碼流轉(zhuǎn)、保存。
圖2 條形碼標(biāo)簽設(shè)計(jì)
具有高速掃描功能、條形碼自動(dòng)識(shí)別與命名功能、光學(xué)字符識(shí)別(OCR)功能的高拍儀對(duì)紙質(zhì)版合同評(píng)審資料進(jìn)行高速掃描、對(duì)條形碼自動(dòng)識(shí)別及命名。計(jì)算機(jī)則負(fù)責(zé)控制高拍儀工作,運(yùn)行相關(guān)操作系統(tǒng)。
軟件系統(tǒng)包括高拍儀合同評(píng)審資料信息自動(dòng)識(shí)別系統(tǒng);高拍儀合同評(píng)審資料掃描、文件名識(shí)別系統(tǒng);計(jì)算機(jī)電子文檔導(dǎo)入和查詢系統(tǒng)。
信息自動(dòng)識(shí)別系統(tǒng)主要是通過高拍儀的OCR文字識(shí)別技術(shù)對(duì)印刷體的合同評(píng)審資料進(jìn)行文字識(shí)別,將其上面的信息轉(zhuǎn)換為電子文本格式,以便將信息導(dǎo)入相應(yīng)的系統(tǒng)中;
掃描、文件名識(shí)別系統(tǒng)則是將紙質(zhì)版資料通過高拍儀轉(zhuǎn)換為電子版圖片格式并能識(shí)別資料上的條形碼以此命名文件名;
電子文檔導(dǎo)入和查詢系統(tǒng)負(fù)責(zé)將已經(jīng)處理好的合同評(píng)審資料電子文檔導(dǎo)入到相應(yīng)的系統(tǒng)當(dāng)中,并能按條件查詢。
本系統(tǒng)主要利用高拍儀光學(xué)字符識(shí)別(OCR)技術(shù)自動(dòng)識(shí)別合同評(píng)審資料上的字體,形成電子文檔,達(dá)到實(shí)際應(yīng)用要求。系統(tǒng)實(shí)施流程如圖3所示;系統(tǒng)操作界面圖如圖4所示。
圖4 高拍儀合同評(píng)審資料信息自動(dòng)識(shí)別系統(tǒng)操作界面及識(shí)別效果圖
具體的操作流程是首先將合同評(píng)審資料放置在高拍儀指定的掃描區(qū)域,通過自動(dòng)識(shí)別系統(tǒng)對(duì)需要識(shí)別部位進(jìn)行框選、不需識(shí)別部位進(jìn)行剔除,然后對(duì)框選部位進(jìn)行OCR文字識(shí)別,若紙質(zhì)版申請(qǐng)表掃描出來的圖片質(zhì)量好、圖片清晰、不需識(shí)別部位剔除完整、識(shí)別率高則可形成電子文檔,否則需重新調(diào)整紙質(zhì)版申請(qǐng)表的位置及高拍儀的參數(shù),重新對(duì)紙質(zhì)版申請(qǐng)表進(jìn)行OCR文字識(shí)別。從而將識(shí)別出來的信息轉(zhuǎn)換到相應(yīng)系統(tǒng)當(dāng)中,替代了傳統(tǒng)的通過人工逐字逐句地錄入到系統(tǒng)當(dāng)中,實(shí)現(xiàn)了實(shí)驗(yàn)室合同評(píng)審資料從人工管理到信息化管理的轉(zhuǎn)化。
掃描、文件名識(shí)別系統(tǒng)主要負(fù)責(zé)將紙質(zhì)版合同評(píng)審資料轉(zhuǎn)換為電子版格式,并與此同時(shí)能自動(dòng)識(shí)別資料上的樣品條形碼,以識(shí)別的條形碼信息來命名文件存儲(chǔ)在指定文件夾中。系統(tǒng)實(shí)施流程如圖5所示;系統(tǒng)操作界面如圖6所示。
圖5 高拍儀合同評(píng)審資料掃描、文件名識(shí)別系統(tǒng)流程圖
圖6 高拍儀合同評(píng)審資料掃描、文件名識(shí)別系統(tǒng)操作界面圖
4.2.1 掃描功能
高拍儀的技術(shù)是近年來研制的新產(chǎn)品,也稱速影儀或速拍儀。具有折疊式的超便捷設(shè)計(jì),體積只有普通掃描儀的1/10,能在一秒鐘完成高速掃描,將紙質(zhì)版資料轉(zhuǎn)換為電子文檔,滿足我們的需求。
4.2.2 條形碼識(shí)別及自動(dòng)命名文件名功能
運(yùn)用高拍儀的條形碼識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)合同評(píng)審資料掃描的同時(shí),對(duì)該份文件上的樣品編碼進(jìn)行識(shí)別。若在掃描的過程中存在無法掃描的情況,系統(tǒng)會(huì)相應(yīng)地提醒,提示該條形碼無法識(shí)別需重新掃描;另外對(duì)于同一份合同評(píng)審資料存在兩個(gè)或者多個(gè)連續(xù)的條形碼的時(shí)候,系統(tǒng)會(huì)以連號(hào)的格式進(jìn)行識(shí)別。將識(shí)別的樣品編號(hào)命名電子文檔文件名,單個(gè)樣品編號(hào)條形碼直接命名,兩個(gè)或多個(gè)連號(hào)樣品編號(hào)條形碼命名中間加間隔號(hào)“-”,從而解決了一份合同評(píng)審資料要拆分成多份報(bào)告書的情況。
4.2.3 自動(dòng)合成功能
掃描到含有附件的紙質(zhì)版申請(qǐng)表,可以自動(dòng)合成到已掃描的電子文檔中,從而解決了合同評(píng)審資料有多頁(yè)資料的情況。
4.2.4 保存及計(jì)數(shù)功能
對(duì)于已掃描的合同評(píng)審資料電子文檔放到指定文件夾中保存,以便電子文檔導(dǎo)入和查詢系統(tǒng)對(duì)電子文檔進(jìn)行上傳操作,并且可以現(xiàn)場(chǎng)對(duì)已掃描的文件進(jìn)行計(jì)數(shù),核對(duì)紙質(zhì)版申請(qǐng)表掃描數(shù)量是否正確。
電子文檔導(dǎo)入和查詢系統(tǒng)主要負(fù)責(zé)將經(jīng)過識(shí)別的電子文檔導(dǎo)入系統(tǒng)數(shù)據(jù)庫(kù)中,并且可以根據(jù)相應(yīng)的信息查詢導(dǎo)入的信息。系統(tǒng)實(shí)施流程如圖7所示;系統(tǒng)操作界面如圖8所示。
4.3.1 導(dǎo)入功能
根據(jù)預(yù)先設(shè)置導(dǎo)入的文件夾路徑,系統(tǒng)從該文件夾中抓取已掃描并命名好的合同評(píng)審資料電子文檔,并批量導(dǎo)入數(shù)據(jù)庫(kù)中,快速便捷。有效地提高了工作效率。
圖7 計(jì)算機(jī)電子文檔導(dǎo)入和查詢系統(tǒng)流程圖
圖8 計(jì)算機(jī)電子文檔導(dǎo)入和查詢系統(tǒng)操作界面圖
4.3.2 自動(dòng)識(shí)別功能
按合同評(píng)審資料電子文檔文件名導(dǎo)入數(shù)據(jù)庫(kù),系統(tǒng)自動(dòng)辨別單個(gè)或者連號(hào)的電子文檔文件名并以此為導(dǎo)入數(shù)據(jù)庫(kù)后該文件的文件名;從而改變了需要人工輸入報(bào)告編號(hào)與掃描后的合同評(píng)審資料建立一一對(duì)應(yīng)的操作方法。此功能的完善有效地解決了合同評(píng)審資料存儲(chǔ)慢且勞動(dòng)強(qiáng)度高的問題,讓合同評(píng)審資料快速準(zhǔn)確地保存。
4.3.3 提醒、人工糾正及保存功能
當(dāng)保存的文件名出現(xiàn)錯(cuò)誤的時(shí)候,系統(tǒng)能做出提醒,并進(jìn)行手動(dòng)更改。對(duì)于沒問題的掃描資料進(jìn)行保存。此功能保證了紙質(zhì)版合同評(píng)審資料在存儲(chǔ)的過程中出現(xiàn)問題時(shí),能及時(shí)有效地發(fā)現(xiàn)并解決問題,從而為合同評(píng)審資料能有效快速地存儲(chǔ)提供保障。
基于OCR技術(shù)的實(shí)驗(yàn)室合同評(píng)審資料信息化管理的應(yīng)用研究,實(shí)現(xiàn)了實(shí)驗(yàn)室合同評(píng)審資料信息化管理的目的,優(yōu)化了整個(gè)工作流程,從而達(dá)到資源共享和節(jié)能環(huán)保的效果,有利于紙質(zhì)實(shí)驗(yàn)室合同評(píng)審資料長(zhǎng)久保存,并對(duì)提高工作效率、減少差錯(cuò),有著非常重要的實(shí)用意義。具體效果如下:
(1)優(yōu)化流程。紙質(zhì)申請(qǐng)表經(jīng)過電子存檔后直接存儲(chǔ)并自動(dòng)形成打包單號(hào)。大大改善了傳統(tǒng)管理辦法的不足,并省去了按紙質(zhì)申請(qǐng)表編號(hào)排序及分類工序,提高工作效率。
(2)資源共享、節(jié)能環(huán)保。查閱者可以通過系統(tǒng)隨時(shí)查閱紙質(zhì)申請(qǐng)表電子文檔,不受時(shí)間、地點(diǎn)和數(shù)量的限制,節(jié)約查詢時(shí)間。
(3)長(zhǎng)久保存。紙質(zhì)申請(qǐng)表比較薄,經(jīng)過排序、查詢等工序,保存時(shí)間過長(zhǎng),往往不堪重負(fù),出現(xiàn)損毀現(xiàn)象,紙質(zhì)申請(qǐng)表形成電子文檔可以實(shí)現(xiàn)長(zhǎng)久保存。
(4)提高工作效率、減少差錯(cuò)。各個(gè)流程中由人工錄入的信息優(yōu)化為系統(tǒng)自動(dòng)識(shí)別,實(shí)現(xiàn)信息化管理。