王世興 潘麗娜
摘? 要:在計算機技術發(fā)展迅速的時代,模式識別技術的應用越來越廣泛,并得到了人們的重視。模式識別技術是信息技術和人工智能結合的產(chǎn)物,具有很大的發(fā)展空間。將模式識別技術應用到數(shù)據(jù)庫管理系統(tǒng)中,是信息技術發(fā)展的一種新的領域。模式識別技術能夠對數(shù)據(jù)庫系統(tǒng)中的各種信息進行識別、組合,并對信息進行處理,滿足人們的需求。模式識別技術的應用,改變了企事業(yè)單位中數(shù)據(jù)信息不集中、不規(guī)范和不安全等情況,有效地實現(xiàn)了系統(tǒng)和數(shù)據(jù)的整合,具有高時效性、高數(shù)據(jù)吞吐量的特點。隨著人們活動范圍的逐漸擴大,模式識別技術的應用領域也不斷擴大。在生產(chǎn)管理、財務管理、倉庫管理方面建立眾多的這種“數(shù)據(jù)庫”,使其可以利用計算機實現(xiàn)財務管理、倉庫管理的自動化,有效地將底層數(shù)據(jù)與上層管理系統(tǒng)結合起來,促進了對信息的管理,提升了應用的技術水平?;诖?,本文分析了模式識別技術的相關內涵,概括了數(shù)據(jù)庫管理系統(tǒng)中模式識別技術的主要方法,并探討了模式識別技術在數(shù)據(jù)庫管理系統(tǒng)中的應用情況。
關鍵詞:模式識別;數(shù)據(jù)庫;管理系統(tǒng);人工智能
中圖分類號:TP391.4;TP311.13? ? ? 文獻標識碼:A 文章編號:2096-4706(2019)21-0078-03
Abstract:In the era of rapid development of computer technology,pattern recognition technology has been applied more and more widely,and people pay attention to it. Pattern recognition technology is the product of the combination of information technology and artificial intelligence,which has great development space. The application of pattern recognition technology in database management system is a new field of information technology development. It can identify,combine and process various information in database system to meet peoples needs. The application of pattern recognition technology has changed the situation of non-centralization,non-standardization and insecurity of data information in enterprises and institutions,effectively realized the integration of system and data,and has the characteristics of high timeliness and high data throughput. With the expansion of peoples activities,the application field of pattern recognition technology is also expanding. In the production management,financial management and warehouse management,many such “databases” can be established,which can be realized by computer,automated management of finance and warehouse management,effectively combine the bottom data with the upper management system,and promote the technical level of information management and application. Based on this,this paper analyzed the connotation of pattern recognition technology,summarized the main methods of pattern recognition technology in database management system,and discussed the application of pattern recognition technology in database management system.
Keywords:pattern recognition;database;management system;artificial intelligence
0? 引? 言
數(shù)據(jù)庫管理系統(tǒng)是數(shù)據(jù)庫技術的一個重要組成部分,目前已經(jīng)是比較成熟的技術。而隨著社會的不斷發(fā)展進步,數(shù)據(jù)庫系統(tǒng)的應用越來越廣泛,不斷應用到社會各領域。人們也不斷對數(shù)據(jù)庫進行創(chuàng)新和發(fā)展,而模式識別技術就是數(shù)據(jù)庫管理系統(tǒng)應用中的一個比較新型的成果。模式識別作為一門新的學科,被應用到數(shù)據(jù)庫系統(tǒng)管理中,是計算機技術發(fā)展的一種新的嘗試。近些年來,數(shù)據(jù)庫應用發(fā)展到了很多新的領域,像數(shù)據(jù)通信、電子銀行、電子商務、交通管理、電力調度等,語音識別、人臉識別、指紋識別都是模式識別技術的應用表現(xiàn)。它們對數(shù)據(jù)庫系統(tǒng)的要求與傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)有著很大的不同,傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)只需要保證數(shù)據(jù)的完整性和一致性,不考慮數(shù)據(jù)的識別和分析功能。而這些新的領域由于行業(yè)比較新穎,與人們的工作和生活息息相關,要大量維護數(shù)據(jù)共享和數(shù)據(jù)控制,又需要人們對數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)信息進行及時的識別和處理分類。數(shù)據(jù)庫的信息具有信息量大的特點,如果只是單純依靠數(shù)據(jù)庫系統(tǒng),這些信息不能被計算機直接感知,沒有辦法滿足需求,而模式識別技術是一種識別性的技術,能夠用數(shù)學技術的方法對其中的數(shù)據(jù)圖像或者數(shù)據(jù)進行識別讀取和分析。因此,需要將模式識別技術和數(shù)據(jù)庫系統(tǒng)管理結合起來,以保證數(shù)據(jù)的實效性。
1? 模式識別技術的相關內涵
1.1? 模式識別
模式識別技術作為人工智能的基礎,在20世紀60年代得到迅速發(fā)展和廣泛應用,并發(fā)展成為一門學科。模式識別對表征事物或者現(xiàn)象的各種形式的信息進行處理和分析,并對其中的信息資料進行描述、辨認、分類和解釋。模式識別技術是信息科學和人工智能的重要組成部分。模式具有抽象和具體兩種形式,抽象的模式是概念范疇識別研究的總稱,是思想意識方面的內容。而我們所指的模式是比較具體的內容,其對具體的內容進行辨識和分類,像文字、圖片、照片、語音波形、心電圖等。對模式識別的研究目前主要有兩個方面,一個是認識科學的范疇,即生物體是怎么感知對象的,是生物學家、心理學家所研究的范疇。另外一個則是計算機科學工作者、信息學專家,以及數(shù)學家索要考慮的事情,是在任務給定后,如何實現(xiàn)模式識別的理論和方法。模式識別是理論和技術結合的學科,其與計算機科學、生物學、心理學、統(tǒng)計學、語言學等有著很大的關系。
1.2? 模式識別技術在數(shù)據(jù)庫管理系統(tǒng)中的應用
所謂模式識別技術在數(shù)據(jù)庫管理系統(tǒng)中的應用就是通過一定的技術,將模式識別技術與數(shù)據(jù)庫管理系統(tǒng)有效結合起來,對數(shù)據(jù)庫進行有效的管理。數(shù)據(jù)庫是長期存儲在計算機中的有組織的、可共享的數(shù)據(jù)的集合,其對企事業(yè)單位、團體和個人進行相關數(shù)據(jù)的存儲,其保存的數(shù)據(jù)之間存在著自然的聯(lián)系,數(shù)據(jù)并不針對某一應用,而是具有整體性。不同的用戶可以根據(jù)自己的需求,運用不同的方法共享數(shù)據(jù)庫的數(shù)據(jù),實現(xiàn)數(shù)據(jù)的共享,以及對數(shù)據(jù)進行集中控制。數(shù)據(jù)庫管理系統(tǒng)是管理數(shù)據(jù)庫的大型軟件,能夠對數(shù)據(jù)庫進行統(tǒng)一的管理和控制,保證數(shù)據(jù)庫的完整性和安全性。數(shù)據(jù)庫管理系統(tǒng)為用戶提供各種功能,像數(shù)據(jù)庫的建立、修改和維護,用戶能夠很方便地對相關數(shù)據(jù)進行一系列的操作。而模式識別技術應用到數(shù)據(jù)庫管理中能夠對其中的表象的事物和現(xiàn)象進行辨別、描述、分類和解釋,能夠對復雜的、冗雜的數(shù)據(jù)進行信息處理。其在代替人工腦力識別方面起到了很大的作用,而且其識別度較高,有效地提高了生產(chǎn)效率。模式識別技術側重于自動化管理,自動識別文字圖片,感知度較高,集合的數(shù)據(jù)量比較大。數(shù)據(jù)庫相當于一個文件柜,即電子文件的“住所”,用戶可以對其進行新增、刪除和更新,而模式識別技術,可以對其進行辨別和處理分析,實現(xiàn)自動化管理。
2? 數(shù)據(jù)庫管理系統(tǒng)中模式識別技術的主要方法
模式識別主要有4種方法,分別是決策理論方法、結構模式識別方法、模糊識別方法,以及人工神經(jīng)網(wǎng)絡模式識別方法,其中決策理論方法和結構模式識別方法目前比較成熟,而且應用比較早,相應的理論和技術都比較成熟。模糊識別方法和人工神經(jīng)網(wǎng)絡模式識別方法相對前兩者來說是比較新的方法,隨著信息技術的進步而不斷被運用到現(xiàn)代化的生產(chǎn)和生活領域中,不斷顯現(xiàn)出其人性化、便利化的優(yōu)點,目前得到了人們的重視。
2.1? 決策理論方法
決策理論方法也稱為統(tǒng)計方法,發(fā)展的比較早,且目前比較成熟,它是以概率學和數(shù)學為基礎的。這種方法首先是將被識別的對象進行數(shù)字化,并對其進行預處理,優(yōu)點是能夠將其中混入的干擾信息排除,減少干擾,減少不必要的變形和失真;然后再進行相應的特征提取,就是在預處理后的輸入模式中抽取一組特征,它對于一般的失真和變形沒有影響,只是會混入少量的冗余信息。從對象空間到特征空間的映射是特征抽取中輸入模式的運行過程,在這個過程中壓縮了信息量,模式可以用特征空間的其中一個點和矢量來表示,比較易于分類,其中會引入鑒別函數(shù),在特征空間里,計算出各類別的鑒別函數(shù)值,通過鑒別函數(shù)值的比較實行分類。目前常用的決策方法是最小風險貝葉斯決策法,根據(jù)貝葉斯決策法可以得出各種錯誤決策造成的損失大小,并計算出已經(jīng)給定的特征矢量的風險大小,進而找出風險最小的決策。
2.2? 結構模式識別方法
結構模式識別方法又稱為語言學方法,以及句法方法。它的基本思想就是將模式分成一些比較簡單的子模式,再進行組合?;悄J阶R別的關鍵單位。它是通過選取基元來進行識別,相當于在決策理論方法中選取特征,所選取的基元對模式的描述需要是緊湊的。基元一般不含有重要的信息?;妥幽J降慕M合關系反映模式,相當于句子和短句的組合關系?;昏b別后,識別過程可以對句法進行分析,并判斷給定的模式語句是不是符合指定的語法,采用這種模式的對象一般不是特別復雜。結構模式識別方法目前主要用在文字識別和圖形、圖像識別中。
2.3? 模糊模式識別方法
模糊識別是近30年來發(fā)展起來的模式識別技術的一種,是人工智能的分支學科。模糊識別行為包含兩種,一種是對具體事物的識別,一種是對抽象事物的識別。具體事物就是指對文字、圖片、語言等的識別,抽象識別是對問題或者論點進行識別。模糊識別是以模糊數(shù)學為理論基礎的,引入了模糊數(shù)學方法,進而完成識別功能。其和普通聚類算法有很多的相似之處,但是兩者也有著很大的不同,最根本的不同表現(xiàn)為概念的不同,模糊識別將待識別的對象看作模糊集元素,對模糊集進行分類。而普通聚類算法是一種利用統(tǒng)計分析的方法,其是以聚類中的相似性、親疏程度為基礎的,對所研究的問題進行分類研究。人們常用模糊識別技術來設計機器識別系統(tǒng)。數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)龐大,一些信息比較復雜,需要一定的識別技術作為支撐,而利用模糊識別系統(tǒng),能夠對一些抽象和具體的內容進行有效的分類和識別。
2.4? 人工神經(jīng)網(wǎng)絡模式識別方法
人工神經(jīng)網(wǎng)絡模式識別是目前比較熱門的研究,是人們對計算機信息分析技術進行人類感知和思維機能的探索,模擬人的神經(jīng)系統(tǒng)的一種信息處理系統(tǒng),由大量的神經(jīng)元按照一定的拓撲結構相互連接而成。人腦是由大量的神經(jīng)元組成的,而人工神經(jīng)網(wǎng)絡正是通過模擬人腦來實現(xiàn)其基本功能,在很大程度上能夠代替人腦進行一些信息系統(tǒng)的操作,目前人工神經(jīng)網(wǎng)絡模式識別技術作為一種嶄新的技術具有優(yōu)良的性能,在很多領域得到了應用和滲透,像信號處理、知識處理、生物醫(yī)學工程等,人工神經(jīng)網(wǎng)絡具有分類識別、智能控制、聯(lián)想記憶的功能。
3? 模式識別技術在數(shù)據(jù)庫管理系統(tǒng)中的應用
3.1? 字符識別
字符識別是模式識別技術在數(shù)據(jù)庫系統(tǒng)中應用的一種,主要是識別數(shù)據(jù)庫中的文字和數(shù)據(jù)信息。字符識別主要是兩種,一種是文字信息,一種是數(shù)據(jù)信息。文字信息是人們使用最多的信息,在計算機數(shù)據(jù)時代,對數(shù)據(jù)庫系統(tǒng)中的文字信息進行識別,是模式識別在數(shù)據(jù)庫系統(tǒng)中應用的突出表現(xiàn),也是實現(xiàn)快速的人機互動的重要表現(xiàn)。文字信息包含的類型比較多,其中文本信息是我們常見的也是數(shù)據(jù)庫中存儲比較多的信息,處理的問題文本信息不僅包含印刷體還包含手寫體。文字信息除了漢字,還包含一些外語,都能夠進行快速有效的識別,進而實現(xiàn)人機互動。數(shù)據(jù)信息是字符識別的另外一種表現(xiàn)形式,主要是對阿拉伯數(shù)字和一些特殊符號進行處理,像財務報表、銀行票據(jù)、郵政編碼等都屬于數(shù)據(jù)信息處理的一種。在數(shù)據(jù)庫中包含了大量的數(shù)字和特殊符號,將其應用到數(shù)據(jù)庫是信息技術的一大進步。數(shù)據(jù)庫中的文字和數(shù)據(jù)具有字量大、符號多、結構復雜的特點,有一些文字和符號也比較相似。字符識別作為一種信息處理的手段,在大數(shù)據(jù)時代,具有廣闊的市場空間和應用前景。以下是文字圖像的識別原理圖,如圖1所示。
文字圖像識別是文字識別的一種,對文字圖像中的文字進行識別和分離,以便后續(xù)進行識別,并對區(qū)分分割中的文字圖像信息,去除一些無用的信號和信息,簡化判斷過程,進行特征提取。
3.2? 聲紋識別
數(shù)據(jù)庫管理系統(tǒng)中含有大量的語音信息,由于人類的音色在音調和音色上都存在差異。指紋又是唯一的,兩者的可復制率都比較低。目前企事業(yè)單位為了方便對人員進行管理,通過將指紋信息錄入系統(tǒng),并利用相應識別技術,實現(xiàn)人工智能操作一些辦公流程。由于聲紋識別的準確度比較高,且造價具備經(jīng)濟性的特點,目前已經(jīng)得到了普遍應用。隱馬爾柯夫模型(HMM)方法是目前語音識別的主流技術,識別率比較高。由于人們皮膚的紋路、交叉點都是不一樣的,可以是說唯一的,利用這種唯一性,對其指紋進行識別以及保存,再次錄入指紋時就可以進行比對分析,這成為驗證身份的主要手段。目前在醫(yī)學、生物,以及公安刑偵方便得到了廣泛應用。
4? 結? 論
總而言之,在大數(shù)據(jù)時代,很多企業(yè)都引入了智能化技術。模式識別技術是人工智能和信息技術結合的重要技術形式,在數(shù)據(jù)庫中引入智能化,可以有效地搜集數(shù)據(jù)資源,組成信息數(shù)據(jù)庫,以促進信息的規(guī)范性和準確性。在數(shù)據(jù)庫的搭建中,企業(yè)要積極引進智能化的計算技術軟件,并利用不同的模式識別技術,更科學地處理數(shù)據(jù)信息,確保信息分析結果的專業(yè)性和準確性。在獲得信息結論后,還要看信息結論的實用性如何,只有將信息結論與實際的生產(chǎn)和管理相結合,才能促進相關行業(yè)的發(fā)展,并實現(xiàn)對相關數(shù)據(jù)業(yè)務的整合。
參考文獻:
[1] 陳銀萍.基于人工智能中的圖像識別技術的分析 [J].信息與電腦(理論版),2019(1):165-166.
[2] 張聰.智慧城市安防領域中模式識別技術的應用研究 [J].計算機產(chǎn)品與流通,2019(2):97.
[3] 江波,史鳳波.文字識別領域中模式識別技術的應用 [J].科技資訊,2015,13(27):6-7.
作者簡介:王世興(1981.01-),男,漢族,山東濰坊人,講師,碩士,研究方向:云計算、大數(shù)據(jù)分析;潘麗娜(1982.04-),女,漢族,山東濰坊人,講師,碩士,研究方向:商務英語、計算機專業(yè)英語應用。