譚普陽+周雅翠
摘要:大學(xué)幫APP是一款幫助大學(xué)生進(jìn)行自主學(xué)習(xí)、幫助教師進(jìn)行學(xué)習(xí)情況管理的專門為大學(xué)學(xué)習(xí)打造的手機(jī)應(yīng)用軟件,它的主要功能包括拍照搜題、在線答疑、教學(xué)輔助等,其中拍照搜題功能需要借助OCR技術(shù)實(shí)現(xiàn)。OCR光學(xué)字符識別技術(shù),主要包含數(shù)字圖像處理、計(jì)算機(jī)圖形和人工智能等方面的知識,是當(dāng)前模擬識別領(lǐng)域最活躍的研究內(nèi)容。
關(guān)鍵詞:互聯(lián)網(wǎng)+;APP;OCR技術(shù);大學(xué)生人群
前言:
大學(xué)生創(chuàng)業(yè)主要由在校大學(xué)生或者大學(xué)畢業(yè)生組成,目前大學(xué)生就業(yè)形勢嚴(yán)峻,很多大學(xué)生都有創(chuàng)新創(chuàng)業(yè)的想法,希望積累經(jīng)驗(yàn)為今后走入社會、適應(yīng)市場需求打下基礎(chǔ)。
在“互聯(lián)網(wǎng)+”的時代,隨著手機(jī),平板電腦等移動智能終端的普及,越來越多的學(xué)生成為眾多使用者的一員。因而,基于移動智能終端的各種搜題APP也應(yīng)運(yùn)而生,這些APP的出現(xiàn)對教育產(chǎn)業(yè)產(chǎn)生了巨大的影響,教學(xué)輔助軟件作為其中的代表越來越受人關(guān)注,我們創(chuàng)建大學(xué)幫APP軟件目的是讓學(xué)生獲得一條自主學(xué)習(xí)的捷徑,方便學(xué)生探討問題,同時方便師生進(jìn)行互動,提高教學(xué)質(zhì)量,調(diào)動學(xué)生的積極性。
OCR技術(shù)最早由Tausheck在1929年獲得專利,由于其容易接受、把握,它同語音識別、行為識別等技術(shù)一同成為人們研究的焦點(diǎn)。經(jīng)過一個世紀(jì)的發(fā)展,OCR技術(shù)已經(jīng)已經(jīng)在各種領(lǐng)域得到廣泛的應(yīng)用。通常OCR識別方法可分為如下三類:統(tǒng)計(jì)特征字符識別技術(shù)、結(jié)構(gòu)字符識別技術(shù)以及基于人工神經(jīng)網(wǎng)絡(luò)的識別技術(shù)。
軟件共設(shè)有功能板塊五個。一、拍照搜題功能:經(jīng)過OCR技術(shù)進(jìn)行圖文識別,并匹配軟件圖庫,選出正確答案解析反饋給用戶。同時,設(shè)有歷史搜題,關(guān)鍵字搜題等輔助功能,方便用戶使用。二、在線答疑功能:可實(shí)現(xiàn)老師在線答疑功能,方便同學(xué)解決題庫無法解決的問題,并設(shè)有線上溝通板塊,方便老師和學(xué)生的溝通交流。三、教輔功能:實(shí)現(xiàn)課堂點(diǎn)名、課堂錄像、作業(yè)提交、課表查詢、課堂管理等功能。四、學(xué)習(xí)輔助功能:可實(shí)現(xiàn)課下自主練習(xí),課后復(fù)習(xí),模擬考試等功能。五、個人中心:實(shí)現(xiàn)個人資料完善,個人錢包充值等功能。
本軟件實(shí)現(xiàn)拍照搜題功能主要依靠技術(shù)是OCR(光學(xué)字符識別技術(shù))。既首先進(jìn)行文字區(qū)域的定位和獲取,因?yàn)槲淖謭D像的對比度較高,為了提高算法的處理速度,首先將彩色圖像變換為二值圖像。把邊緣像素的灰度置為 255(白)其他為 0(黑)來建立高灰度對比邊緣圖像[1]定位出文本區(qū)域后再進(jìn)行文本中行、字分割(1)行切分:文字的行與行之間都有一定的空白間隙,文本中就可以利用這個空白間隙進(jìn)行行切分。(2)字切分:當(dāng)行切分結(jié)束后,需要把文本行切分為單個字。在字切分中,從左向右搜索每行文字單字的左右界,切分出單字或標(biāo)點(diǎn)符號。對漢字文本行來說,由于存在左右分離字,寬窄字,加上行中常?;煊杏⑽?、數(shù)字、符號和字間污點(diǎn)干擾,使得字切分就比行切分艱難得多。所以字切分大抵分為兩個過程,首先是求出文字、符號或部件的左右界;其次是合并部件為完整的文本漢字。[2]等運(yùn)算后,將其和題庫里的數(shù)據(jù)匹配,然后將正確答案反饋給用戶。
市場上,已經(jīng)有了很多類似的軟件,而面臨的問題可以理解為兩個問題:有價值的信息在哪?和 有價值的信息是什么?面對這兩個問題,我們需要用到版面剖析、糾偏、去噪、文字定位、切分、加強(qiáng)現(xiàn)實(shí)等技術(shù);OCR識別除了采用傳統(tǒng)的OCR技術(shù)之外,更多的用到目前如日中天的Deep Learning識別技術(shù)。
軟件的發(fā)展前景
互聯(lián)網(wǎng)的出現(xiàn),給傳統(tǒng)行業(yè)帶來很大的沖擊,但同時,也帶來了新機(jī)遇。教育行業(yè)圖樣不例外,我們可以發(fā)現(xiàn)身邊使用互聯(lián)網(wǎng)獲取知識,運(yùn)用互聯(lián)網(wǎng)聽課的人越來越多。2015年,中國的互聯(lián)網(wǎng)教育市場規(guī)模達(dá)到1111億元人民幣,2010-2015五年間平均復(fù)合增長率高達(dá)32.9%,Analysys易觀預(yù)計(jì)2018年該市場規(guī)模將達(dá)到2680億元人民幣,將來的幾年,中國互聯(lián)網(wǎng)教育市場將保持這個增長率持續(xù)穩(wěn)步發(fā)展。
本產(chǎn)品是面向各個高校的教輔系統(tǒng),對各個高校進(jìn)行教學(xué)輔助和面向大學(xué)生的移動學(xué)習(xí)平臺。也是難題搜索,高效復(fù)習(xí)和師生溝通的綜合學(xué)習(xí)APP。
本軟件具有以下兩個特點(diǎn):
(1)效率。搜索技術(shù)極大的提高了我們獲取信息的效率,而本軟件應(yīng)用的OCR技術(shù)則極大的提高我們大學(xué)生獲取答案或者解決思路的效率。節(jié)省了我們通過搜索引擎搜索答案時篩選信息的時間,提高了我們大學(xué)生學(xué)習(xí)的效率。這種效率的提升不受限制,只要智能手機(jī)可以訪問網(wǎng)絡(luò),就算沒有老師的指導(dǎo),你都可以高效的獲取答案或者解題思路。
(2)針對性。針對性教學(xué)是我們國家教育面對的一個難題。人人都在說針對性教學(xué),但是我們國家人口基數(shù)大,學(xué)生和老師的比例達(dá)嚴(yán)重失衡,很難讓老師做到針對性教學(xué)。而搜題APP則很好的處理了這一點(diǎn),我只搜索我不懂的,懂的則可以不必因重復(fù)學(xué)習(xí)而浪費(fèi)我的時間。
總結(jié):
國內(nèi)有關(guān)的此方面的研究目前較少,我們將立足現(xiàn)象更進(jìn)一步的研究開發(fā)力爭在大學(xué)校園內(nèi)廣泛推廣,使學(xué)校教育事業(yè)進(jìn)入蓬勃發(fā)展的鼎盛期
參考文獻(xiàn):
[1]陳義,李言俊,孫小煒.利用 OCR 識別技術(shù)實(shí)現(xiàn)視頻中文字的提取.西安:西北工業(yè)大學(xué),2010.
[2]朱懷中.基于 Android 的手機(jī) OCR 識別技術(shù)設(shè)計(jì)與實(shí)現(xiàn).上海,上海天華學(xué)院.2012
項(xiàng)目號:2017X11025
項(xiàng)目名稱:高校教學(xué)輔助系統(tǒng)的設(shè)計(jì)和開發(fā)endprint