李曉明兵團(tuán)第十二師網(wǎng)絡(luò)信息中心
基于大數(shù)據(jù)的兵團(tuán)科技創(chuàng)新服務(wù)云平臺的研發(fā)
李曉明
兵團(tuán)第十二師網(wǎng)絡(luò)信息中心
本文擬以科技主管部門、企業(yè)、科研人員需求為研究方案,以定制服務(wù)為研究重點,為研究對象的精細(xì)化管理提供幫助,使各部門的領(lǐng)導(dǎo)在需要科技數(shù)據(jù)時,不是到處查證,而是根據(jù)權(quán)限自動提供,使一切科研相關(guān)的資料都有據(jù)可查,有據(jù)可依,并且通過自動感知,定制服務(wù)等個性服務(wù),讓使用者,快速找到自己需要的科技信息。
1.1科技管理中的智能感知模型的創(chuàng)建
隨著云計算和互聯(lián)網(wǎng)技術(shù)的發(fā)展與廣泛應(yīng)用,以大規(guī)模服務(wù)器集群作為存儲介質(zhì),以高速互聯(lián)設(shè)備作為傳輸載體,以服務(wù)計算和社交元素為基礎(chǔ)的開放式的因特網(wǎng)分布式資源已經(jīng)成為世界上數(shù)量最多、種類最為豐富的信息資源[1。因此,如何在分布式信息源中針對特定科技信息資源,采用開放式的系統(tǒng)以自動或半自動的方式感知、采集、跟蹤,以提供具有高科技價值的信息和服務(wù),比如科技主管部門,不同部門、不同級別需要對科技項目的了解層次和情況是不一樣的,關(guān)心的點也是不同的,這就需要通過智能感知,主動給使用者推送不同的需求信息。這里我們通過對感知模型的構(gòu)建,對根據(jù)具體的科技任務(wù)進(jìn)行智能獲取,以提取感知信息,進(jìn)行智能推送。
1.2基于云平臺的科技服務(wù)模塊的構(gòu)建
結(jié)合兵團(tuán)服務(wù)業(yè)發(fā)展現(xiàn)狀,綜合考慮系統(tǒng)建設(shè)奠定開放性的技術(shù)架構(gòu),滿足應(yīng)用的整合和持續(xù)擴展性,提高響應(yīng)科技創(chuàng)新辦公業(yè)務(wù)需求不斷變化的能力[2],需要應(yīng)用支撐平臺提供標(biāo)準(zhǔn)的接口、完整的集成機制和豐富的構(gòu)建集,為全兵團(tuán)內(nèi)其他各類應(yīng)用系統(tǒng)的開發(fā)和運行提供基礎(chǔ)性的共性服務(wù),為各部門之間實現(xiàn)業(yè)務(wù)資源、數(shù)據(jù)資源共享和協(xié)同作提供支撐,使各類科技創(chuàng)新辦公應(yīng)用能夠有機結(jié)合。其中查詢模塊如:圖1所示。
圖1 工作流程模塊
2.1模型算法創(chuàng)新
自動向科技主管部門、企業(yè)、科研人員進(jìn)行推送科技資源信息時,采用的智能感知模型,無論是經(jīng)典的還是計算的,有關(guān)文獻(xiàn)還不多見。相關(guān)應(yīng)用在科技資源領(lǐng)域更是少有研究。
本文方法目的是為了求得一組過完備的基Φ來對每一個科技信息xi進(jìn)行線性表示。首先目標(biāo)函數(shù)第一項是重構(gòu)輸入數(shù)據(jù)X的代價函數(shù);第二項是對系數(shù)稀疏性的懲罰項,過完備是指n的個數(shù)遠(yuǎn)大于樣本xi的維數(shù),其分解系數(shù)a不能唯一確定,一般的做法是對系數(shù)a作一個稀疏性約束。除此之外,傳統(tǒng)的稀疏編碼不能保證得到的字典是非負(fù)的,而負(fù)值在圖像里面是沒有意義的,因此這里我們加入非負(fù)的約束即Αij≥0,Φij≥0。設(shè)αi,αj為xi,xj在新的基底Φ下的稀疏表示?;诹餍袑W(xué)習(xí)與降維相關(guān)理論,我們認(rèn)為如果數(shù)據(jù)xi,xj在原空間距離相近,在新的基底下αi,αj的距離也會相近,反之亦然。因此我們加入平滑的約束項R,來防止由噪聲引起的數(shù)據(jù)表示的不一致性,R計算公式如下:
(3)求解稀疏系數(shù)
該步驟為標(biāo)準(zhǔn)的LASSO問題,采用Feature-sign search 算法求解。
(4)對結(jié)果進(jìn)行評價,評價指標(biāo)為
在上一步中的編碼J被稱為編碼的代價函數(shù),J值越大說明樣本X在字典Φ的表示之下誤差越大[3],即:該科技信息的隸屬度越低。很明顯該指標(biāo)取值范圍0-1,取值越大越可能屬于某個科技類型。
2.2技術(shù)創(chuàng)新
率先將科技決策模型應(yīng)用到科技資源分析的研究領(lǐng)域,以實現(xiàn)對科技項目、政策的輔助支持;并將基于科技大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)應(yīng)到科技主管部門及企業(yè)科技精細(xì)化管理方面。
2.3應(yīng)用創(chuàng)新
本文以兵團(tuán)為研究對象,以科技主管部門、企業(yè)、科研人員為調(diào)研對象,系統(tǒng)的成功研發(fā),可以彌補目前兵團(tuán)科技領(lǐng)域信息化應(yīng)用方面的不足、整合兵團(tuán)現(xiàn)有的科技資源,進(jìn)行決策分析,提供決策支持。使科技主管部門、企業(yè)進(jìn)入科技信息化定制服務(wù)時代。自動向科技主管部門、企業(yè)、科研人員進(jìn)行推送科技資源信息時,采用的智能感知模型,無論是經(jīng)典的還是計算的,有關(guān)文獻(xiàn)還不多見。相關(guān)應(yīng)用在科技資源領(lǐng)域更是少有研究。
隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,以及我國信息化建設(shè)的日益普及,為了更好的實現(xiàn)“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”,迫切需要一個基于定制服務(wù)的兵團(tuán)科技創(chuàng)新云平臺。由于基于定制服務(wù),對科技主管部門、企業(yè)、科研人員在科技管理方面進(jìn)行決策支持,使更加符合兵團(tuán)發(fā)展的科技項目,為兵團(tuán)技主管部門、企業(yè)鍛煉培養(yǎng)創(chuàng)新人才等它的建設(shè)和發(fā)展有利于提高行業(yè)、區(qū)域甚至整個兵團(tuán)的科技創(chuàng)新水平,增強科技競爭力。
[1]陳欣,李曉菲 ; 基于領(lǐng)域本體的專業(yè)文獻(xiàn)信息檢索研究.[N]D 現(xiàn)代圖書情報技術(shù),2009(7-8):6-63
[2]陳 越,郭力;隱含語義檢索及其應(yīng)用 [N]D 現(xiàn)代圖書情報技術(shù),2001(17):27-29
[3] NAVIGLI R,VELARDI P.An analysis of ontologybasedquery expansion strategies[A].2003.42-49.