高霞
(鄭州航空工業(yè)管理學(xué)院,河南 鄭州 45500001155)
?
基于大數(shù)據(jù)的科技評(píng)價(jià)方法研究
高霞
(鄭州航空工業(yè)管理學(xué)院,河南鄭州45500001155)
[摘要]科技評(píng)價(jià)對(duì)象所涉及的數(shù)值、圖像、聲音具有全媒體、多維度、跨時(shí)間的特性,挖掘和運(yùn)用這些海量數(shù)據(jù),轉(zhuǎn)化為直觀的、隨時(shí)間和空間變化的、以圖形圖像呈現(xiàn)在同行評(píng)議專(zhuān)家面前,可以有效提高評(píng)價(jià)的效率和效果。通過(guò)建立眾包模式、數(shù)據(jù)整合和提取規(guī)則知識(shí)、將科技評(píng)價(jià)結(jié)果應(yīng)用于實(shí)踐、建立評(píng)價(jià)過(guò)程交互式可視化的流程以構(gòu)建基于大數(shù)據(jù)的科技評(píng)價(jià)模式,這種模式存在著觀念陳舊過(guò)時(shí)、數(shù)據(jù)挖掘能力、大數(shù)據(jù)處理速度、科技評(píng)價(jià)數(shù)據(jù)安全等方面的挑戰(zhàn)。
[關(guān)鍵詞]大數(shù)據(jù);科技評(píng)價(jià);數(shù)據(jù)密集型方法
科技評(píng)價(jià)是判斷科技活動(dòng)及其價(jià)值的認(rèn)識(shí)活動(dòng),是基本的學(xué)術(shù)評(píng)價(jià)機(jī)制,是科學(xué)共同體和科學(xué)技術(shù)發(fā)展內(nèi)在的要求,如對(duì)重大科學(xué)發(fā)現(xiàn)的優(yōu)先權(quán)的識(shí)別,或者科學(xué)共同體內(nèi)部的學(xué)術(shù)評(píng)價(jià),目的在于促進(jìn)學(xué)術(shù)交流、建立科學(xué)規(guī)范、引導(dǎo)研究方向。科技評(píng)價(jià)還是對(duì)科技活動(dòng)進(jìn)行預(yù)測(cè)、決策、管理的手段,是政府制定科技政策的依據(jù),以及配置科技資源和進(jìn)行有效管理的重要手段。就科技評(píng)價(jià)的形式看,無(wú)論事前評(píng)價(jià)、事中評(píng)價(jià)、事后評(píng)價(jià),無(wú)論立項(xiàng)評(píng)審、中期評(píng)估、結(jié)題驗(yàn)收、績(jī)效評(píng)價(jià),無(wú)論政策評(píng)價(jià)、項(xiàng)目評(píng)價(jià)、機(jī)構(gòu)評(píng)價(jià)、人才評(píng)價(jià)、成果評(píng)價(jià),無(wú)論內(nèi)部評(píng)價(jià)、外部評(píng)價(jià),都需要借助于一定的數(shù)據(jù)支撐,數(shù)據(jù)越豐富,結(jié)果越可靠??萍荚u(píng)價(jià)中的同行評(píng)議法、文獻(xiàn)計(jì)量法、經(jīng)濟(jì)計(jì)量法、多指標(biāo)科技評(píng)價(jià)法同樣也需要數(shù)據(jù)的支撐[2]。而目前以云計(jì)算為代表的技術(shù)創(chuàng)新大幕襯托下的大數(shù)據(jù),將原本很難收集和使用的文本、圖像、聲音等充分利用起來(lái),挖掘和運(yùn)用這些海量數(shù)據(jù),預(yù)示著新型科技評(píng)價(jià)方法的產(chǎn)生與應(yīng)用。
同行評(píng)議是科技評(píng)價(jià)的一種基本方法,由相同或相近領(lǐng)域的專(zhuān)家學(xué)者以提問(wèn)的方式進(jìn)行科技評(píng)價(jià),包括被評(píng)議對(duì)象、評(píng)議專(zhuān)家、評(píng)議標(biāo)準(zhǔn)三個(gè)要素。17世紀(jì),英國(guó)皇家學(xué)會(huì)采取了與類(lèi)似同行評(píng)議的做法評(píng)議學(xué)者的入會(huì)申請(qǐng)和會(huì)員的學(xué)術(shù)論文。1930年代,美國(guó)評(píng)價(jià)科研項(xiàng)目經(jīng)費(fèi)申請(qǐng)時(shí)率先引進(jìn)了同行評(píng)議制度,此后歐美多數(shù)國(guó)家也采用這種措施,此后成為國(guó)際學(xué)術(shù)界通行的學(xué)術(shù)水準(zhǔn)評(píng)價(jià)手段。同行評(píng)議過(guò)程中的公正性問(wèn)題實(shí)際上是怎么樣客觀和無(wú)偏見(jiàn)進(jìn)行科技評(píng)價(jià),涉及專(zhuān)家熟悉程度的不同、評(píng)價(jià)標(biāo)準(zhǔn)的高低、評(píng)價(jià)結(jié)果偏離度的差異進(jìn)行量化,學(xué)者們從不同的角度歸納了同行評(píng)議機(jī)構(gòu)利益沖突的治理對(duì)策、學(xué)術(shù)不端行為的抑制、學(xué)術(shù)純潔的保證等具有方法論和實(shí)踐操作意義的結(jié)論,實(shí)際上,同行評(píng)議就是同行專(zhuān)家利用其較高的決策能力對(duì)科技評(píng)價(jià)對(duì)象所呈現(xiàn)出的不完全數(shù)據(jù)進(jìn)行評(píng)判,同行評(píng)議不可能離開(kāi)數(shù)據(jù)的支撐作用[3]。文獻(xiàn)計(jì)量方法、經(jīng)濟(jì)計(jì)量方法、多指標(biāo)科技評(píng)價(jià)方法就是利用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、文獻(xiàn)學(xué)為一體,借助于多維數(shù)據(jù),注重量化的知識(shí)體系進(jìn)行科技評(píng)價(jià)。
科技評(píng)價(jià)方法需要數(shù)據(jù)的支撐,突破常規(guī)數(shù)量級(jí)的大數(shù)據(jù)時(shí)代為科技評(píng)價(jià)提供了有效的工具,其可以高效處理和有效利用科技的經(jīng)濟(jì)價(jià)值、地理空間和涉及領(lǐng)域,保證科技評(píng)價(jià)過(guò)程公正、科學(xué)、可行。2008年,Nature推出了“Big data”專(zhuān)刊專(zhuān)門(mén)探討大數(shù)據(jù)的研究,范圍涉及互聯(lián)網(wǎng)技術(shù)、超級(jí)運(yùn)算、生物醫(yī)學(xué)等方面。大數(shù)據(jù)報(bào)告“Big data,big impact:New possibilities for international development”在2012年達(dá)沃斯世界經(jīng)濟(jì)論壇上發(fā)布后,如何利用大數(shù)據(jù)創(chuàng)造良好社會(huì)效益的研究日益受到重視。2013年聯(lián)合國(guó)“Global Pulse”報(bào)告闡述了大數(shù)據(jù)時(shí)代各國(guó)的機(jī)遇和挑戰(zhàn),美國(guó)政府的“Big data research and development initiative”計(jì)劃就是為了研究如何從大型復(fù)雜數(shù)據(jù)集中提取知識(shí)。大數(shù)據(jù)的研究還處于起步階段,主要集中于數(shù)據(jù)挖掘相關(guān)算法、應(yīng)用、理論方面的研究,集中在部分高等院校、研究所和公司開(kāi)展研究,在金融業(yè)、電信業(yè)、網(wǎng)絡(luò)相關(guān)行業(yè)應(yīng)用廣泛,此外零售業(yè)、制造業(yè)、醫(yī)療保健、制藥業(yè)及科學(xué)領(lǐng)域大量使用了大數(shù)據(jù)技術(shù)[4]。大數(shù)據(jù)的出現(xiàn)伴隨著新的處理工具和新技術(shù)的出現(xiàn),大數(shù)據(jù)的分析處理工具和技術(shù)是推動(dòng)大數(shù)據(jù)發(fā)展的核心力量之一。憑借適合非結(jié)構(gòu)處理和大規(guī)模并行處理等優(yōu)勢(shì),以MapReduce和Hadoop為代表的非關(guān)系數(shù)據(jù)分析技術(shù)成為主流技術(shù)。2012年5月,以“大數(shù)據(jù)科學(xué)與工程—一新興的交叉學(xué)科”為主題,香山科學(xué)會(huì)議組織討論了大數(shù)據(jù)的理論與工程數(shù)據(jù)研究、應(yīng)用方向,重點(diǎn)是大數(shù)據(jù)分析算法和大數(shù)據(jù)系統(tǒng)效率。華為公司提出了提供的基于x86服務(wù)器的Smart Vision大數(shù)據(jù)處理技術(shù),引發(fā)數(shù)據(jù)基礎(chǔ)架構(gòu)的創(chuàng)新。如何高效地處理大數(shù)據(jù)、合理地利用大數(shù)據(jù),如何融合關(guān)系數(shù)據(jù)庫(kù)和非關(guān)系數(shù)據(jù)庫(kù),如何處理數(shù)據(jù)的不確定性和數(shù)據(jù)質(zhì)量的關(guān)系,跨領(lǐng)域的數(shù)據(jù)處理方法如何移植等仍需要不斷地探索發(fā)現(xiàn)[5]。但毫無(wú)質(zhì)疑的是大數(shù)據(jù)的預(yù)測(cè)性作用日益凸顯,大數(shù)據(jù)決策模擬可以最大限度地降低科技決策風(fēng)險(xiǎn)和成本,彌補(bǔ)科技決策方案中存在的漏洞,利用大數(shù)據(jù)協(xié)調(diào)科技決策相關(guān)的部門(mén)、事務(wù)和政策,避免決策對(duì)象邊界模糊而引起的決策效能抵消,預(yù)知未來(lái)的事態(tài)變化做出警告,都將發(fā)揮重大作用。
由于大數(shù)據(jù)所表現(xiàn)的4V(volume、variety、velocity、value)特征,科技評(píng)價(jià)要求的高質(zhì)量數(shù)據(jù)應(yīng)當(dāng)從多源、多模態(tài)、實(shí)時(shí)動(dòng)態(tài)的數(shù)據(jù)中提取,需要運(yùn)用數(shù)據(jù)密集型科學(xué)(Data Intensive Science)的計(jì)算方法區(qū)分哪些數(shù)據(jù)應(yīng)該舍棄、哪些數(shù)據(jù)應(yīng)該保留,確定哪些數(shù)據(jù)是結(jié)構(gòu)化還是非結(jié)構(gòu)化,確定數(shù)據(jù)資源與評(píng)價(jià)目的之間的最佳結(jié)合方式是什么。數(shù)據(jù)密集型計(jì)算的數(shù)據(jù)量級(jí)為T(mén)B或PB級(jí),利用多種來(lái)源的海量時(shí)空數(shù)據(jù),采用數(shù)據(jù)并行方法實(shí)現(xiàn)大數(shù)量并行計(jì)算的應(yīng)用,實(shí)驗(yàn)、分析、模擬與發(fā)現(xiàn)科技評(píng)價(jià)的目的。數(shù)據(jù)密集型計(jì)算與云計(jì)算密切相關(guān),云計(jì)算(Cloud computing)的基礎(chǔ)是互聯(lián)網(wǎng)絡(luò)共享資源的算模式,以數(shù)據(jù)密集型計(jì)算技術(shù)支撐的服務(wù)端的商業(yè)模式,按用戶(hù)的動(dòng)態(tài)需要計(jì)算、儲(chǔ)存、網(wǎng)絡(luò)、軟件等資源,提供任何人、任何時(shí)間、任何地點(diǎn)、任何信息的需求服務(wù),將改變整個(gè)信息產(chǎn)業(yè)鏈,CPU、存儲(chǔ)、服務(wù)、終端、操作系統(tǒng)及應(yīng)用軟件都將隨之改變[6]。在數(shù)據(jù)密集型科學(xué)之上的科技評(píng)價(jià)不僅關(guān)心科技數(shù)據(jù)建模、科技事件描述、科技組織、科技文檔保存、科技活動(dòng)分析、建立科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施,而且關(guān)心基于數(shù)據(jù)的、開(kāi)放協(xié)同的研究與創(chuàng)新模式構(gòu)建,關(guān)系如何利用泛在網(wǎng)絡(luò)及其內(nèi)在的交互性和開(kāi)放性進(jìn)行科技評(píng)價(jià)可計(jì)算化,利用海量科研數(shù)據(jù)進(jìn)行知識(shí)對(duì)象化。數(shù)據(jù)密集型科學(xué)正在從計(jì)算科學(xué)中分離出來(lái),用海量數(shù)據(jù)進(jìn)行科技評(píng)價(jià),必將影響到社會(huì)科學(xué)的研究模式,這就是Jim Gray所謂的“第四范式(the fourth paradigm)”。
科技評(píng)價(jià)的數(shù)據(jù)密集型方法首先建立一種“眾包(crowd sourcing)”模式。眾包與外包相對(duì),外包強(qiáng)調(diào)的是高度專(zhuān)業(yè)化,眾包強(qiáng)調(diào)的是自由自愿外包給非特定的大眾網(wǎng)絡(luò)。眾包模式融合來(lái)自不同領(lǐng)域的眾多科技評(píng)價(jià)專(zhuān)家的共享信息,融合群體智慧,利用新工具去分析、呈現(xiàn)、挖掘科技數(shù)據(jù),進(jìn)行深度加工與提煉,從評(píng)價(jià)數(shù)據(jù)中提煉出更多精細(xì)的知識(shí)。這種評(píng)價(jià)方式圍繞數(shù)據(jù)密型計(jì)算方法的應(yīng)用,以開(kāi)放、專(zhuān)業(yè)、低成本的建立數(shù)據(jù)驅(qū)動(dòng)型的科技評(píng)價(jià)協(xié)同組織,開(kāi)發(fā)相應(yīng)的具有可擴(kuò)展性的評(píng)價(jià)數(shù)據(jù)分析算法,以提供科技戰(zhàn)略決策。
科技評(píng)價(jià)的數(shù)據(jù)密集型方法第二步是進(jìn)行數(shù)據(jù)整合和提取規(guī)則知識(shí)。通常情況下,從不同的層次、不同的角度看,數(shù)據(jù)整合與系統(tǒng)整合、存儲(chǔ)整合、數(shù)據(jù)庫(kù)整合、數(shù)據(jù)集中的意思比較接近,是共享或者合并來(lái)自于不同應(yīng)用領(lǐng)域的數(shù)據(jù),以創(chuàng)建具有更多功能的數(shù)據(jù)應(yīng)用,包括物理整合、邏輯整合和應(yīng)用整合三種方式,即為實(shí)現(xiàn)統(tǒng)一管理和快速反應(yīng)而把多設(shè)備整合為較少幾部更大型的設(shè)備[7];通過(guò)系統(tǒng)管理軟件等手段虛擬化集中管理物理上分散的數(shù)據(jù)資源;通過(guò)整合服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫(kù)而實(shí)現(xiàn)數(shù)據(jù)整合;通過(guò)匯聚、整合、共享和深度挖掘數(shù)據(jù),對(duì)評(píng)價(jià)數(shù)據(jù)深度分析,創(chuàng)造性地進(jìn)行多數(shù)據(jù)源管理,形成規(guī)則知識(shí)挖掘機(jī)制,以便從評(píng)價(jià)數(shù)據(jù)中提取規(guī)則知識(shí),獲得評(píng)價(jià)對(duì)象系統(tǒng)、全面、最新的知識(shí),實(shí)現(xiàn)由數(shù)據(jù)到信息、由信息到知識(shí)的轉(zhuǎn)化和升華,并利用提取的知識(shí)對(duì)科技決策能實(shí)時(shí)、動(dòng)態(tài)地發(fā)揮輔助和支撐功能。通過(guò)數(shù)據(jù)密集型方法,不斷積累和動(dòng)態(tài)獲取評(píng)價(jià)數(shù)據(jù),能更加精細(xì)和動(dòng)態(tài)的輔助科技決策,更迅速、靈活、準(zhǔn)確的理解和解決科技評(píng)價(jià)問(wèn)題,
科技評(píng)價(jià)的數(shù)據(jù)密集型方法第三步是將科技評(píng)價(jià)結(jié)果應(yīng)用于實(shí)踐。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于科技評(píng)價(jià)后,還要?jiǎng)?chuàng)新性地結(jié)合科技領(lǐng)域的特點(diǎn)和特定問(wèn)題,創(chuàng)新同行評(píng)議小組成員結(jié)構(gòu),專(zhuān)家彼此之間多維度地協(xié)作,自由、精確、及時(shí)地貢獻(xiàn)和獲取信息,持續(xù)、高效、靈活地實(shí)時(shí)交互,針對(duì)同一個(gè)評(píng)價(jià)對(duì)象,整合分析跨地域、跨行業(yè)、跨部門(mén)的海量數(shù)據(jù),個(gè)體決策與群體決策相結(jié)合,增強(qiáng)綜合功效,形成系統(tǒng)智慧[8];在實(shí)際的科技評(píng)價(jià)過(guò)程中,先構(gòu)建數(shù)據(jù)驅(qū)動(dòng)型的科技評(píng)價(jià)戰(zhàn)略,保證數(shù)據(jù)相關(guān)者之間的利益均衡,注意知識(shí)產(chǎn)權(quán)和數(shù)據(jù)隱私保護(hù),解決好數(shù)據(jù)安全性問(wèn)題,促進(jìn)數(shù)據(jù)有效共享,實(shí)現(xiàn)科技評(píng)價(jià)的主旨和目標(biāo)。
科技評(píng)價(jià)的數(shù)據(jù)密集型方法第四步是評(píng)價(jià)過(guò)程交互式可視化。交互式可視化是借助于圖形化手段,將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來(lái),有效地傳達(dá)思想觀念,清晰有效地交互處理、傳達(dá)與溝通信息。評(píng)價(jià)過(guò)程交互式可視化就是在科技評(píng)價(jià)過(guò)程中,把科技評(píng)價(jià)數(shù)據(jù)包括數(shù)值、圖像、聲音轉(zhuǎn)化為直觀的、隨時(shí)間和空間變化的、以圖形圖像表示的物理現(xiàn)象呈現(xiàn)在同行評(píng)議專(zhuān)家面前。通過(guò)科技評(píng)價(jià)數(shù)據(jù)深度挖掘過(guò)程的可視化方法進(jìn)行人機(jī)交互,尋求規(guī)則知識(shí)的發(fā)現(xiàn),通過(guò)人機(jī)交互式評(píng)價(jià),讓同行評(píng)議專(zhuān)家的知識(shí)融入到規(guī)則知識(shí)挖掘建模過(guò)程中,形成交互式挖掘算法和模型可視化。在大數(shù)據(jù)環(huán)境下的科技評(píng)價(jià)過(guò)程中,基礎(chǔ)設(shè)施應(yīng)當(dāng)包括互聯(lián)網(wǎng)服務(wù)體系和評(píng)價(jià)數(shù)據(jù)處理中心,關(guān)鍵技術(shù)是可視化交互分析和評(píng)價(jià)數(shù)據(jù)的深度挖掘,通過(guò)智能終端和互聯(lián)網(wǎng)提供科技評(píng)價(jià)數(shù)據(jù)管理及分析。設(shè)計(jì)啟發(fā)式的科技評(píng)價(jià)可視化交互分析引擎,需要建立計(jì)算平臺(tái)和相應(yīng)的算法庫(kù)以便能處理大規(guī)模海量評(píng)價(jià)數(shù)據(jù),并能與其他系統(tǒng)有效對(duì)接。
在大數(shù)據(jù)環(huán)境下的科技評(píng)價(jià)能夠面向需求提供可行的解決方案還有很長(zhǎng)一段路程,首要的是面臨著思維方式轉(zhuǎn)型的挑戰(zhàn),評(píng)價(jià)數(shù)據(jù)更加復(fù)雜,評(píng)價(jià)數(shù)據(jù)價(jià)值挖掘技術(shù)不成熟,不能有效的指導(dǎo)實(shí)踐,基于大數(shù)據(jù)的科技評(píng)價(jià)并不是將大數(shù)據(jù)技術(shù)簡(jiǎn)單移植過(guò)來(lái)就可以的,獲取、處理、共享科技評(píng)價(jià)數(shù)據(jù)的方法需要?jiǎng)?chuàng)新,深度挖掘數(shù)據(jù)價(jià)值的方法需要?jiǎng)?chuàng)新,科技評(píng)價(jià)理念和科技評(píng)價(jià)機(jī)制有待實(shí)質(zhì)性突破等等都阻礙科技評(píng)價(jià)的大數(shù)據(jù)技術(shù)方法的應(yīng)用,
3.1傳統(tǒng)的科技評(píng)價(jià)觀念陳舊過(guò)時(shí)
傳統(tǒng)的科技評(píng)價(jià)一般是按照事先設(shè)定的程序獲取數(shù)據(jù),基于大數(shù)據(jù)的科技評(píng)價(jià)則是從規(guī)模巨大的、彼此可能毫無(wú)關(guān)聯(lián)的數(shù)據(jù)流/集中進(jìn)行數(shù)據(jù)抽取;傳統(tǒng)科技評(píng)價(jià)的對(duì)象大多是靜態(tài)、個(gè)態(tài)、相對(duì)封閉,基于大數(shù)據(jù)的科技評(píng)價(jià)對(duì)象則是動(dòng)態(tài)、系統(tǒng)、開(kāi)放、整合;傳統(tǒng)的科技評(píng)價(jià)人員具有統(tǒng)計(jì)學(xué)、數(shù)學(xué)、信息科學(xué)等專(zhuān)業(yè)知識(shí),基于大數(shù)據(jù)的科技評(píng)價(jià)則要求評(píng)價(jià)人員具有創(chuàng)新性的思維、多學(xué)科背景、敏銳的洞察力[9]。運(yùn)用大數(shù)據(jù)進(jìn)行科技評(píng)價(jià),目前缺少評(píng)價(jià)數(shù)據(jù)整合技術(shù)及方法,缺少有效的數(shù)據(jù)過(guò)濾技術(shù)與方法,缺少新興技術(shù)如Hadoop的支撐,這些技術(shù)上的障礙可能很快突破,最重要的是科技評(píng)價(jià)思維上的轉(zhuǎn)變,要以觀念創(chuàng)新為先導(dǎo),人才是最積極、最活躍的因素,樹(shù)立培養(yǎng)評(píng)價(jià)人才和數(shù)據(jù)深度挖掘技術(shù)人才優(yōu)先的思想,正確認(rèn)識(shí)評(píng)價(jià)數(shù)據(jù)的潛在價(jià)值,探索新的評(píng)價(jià)模式下的具體應(yīng)對(duì)手段,管理決策部門(mén)要把創(chuàng)新驅(qū)動(dòng)的理念貫穿在科技評(píng)價(jià)的每一個(gè)環(huán)節(jié)中,要樹(shù)立創(chuàng)新理念,搭建創(chuàng)新平臺(tái),拓展創(chuàng)新渠道,延伸創(chuàng)新觸角,提高創(chuàng)新水平,最大限度地調(diào)動(dòng)各方面同行評(píng)議專(zhuān)家和相關(guān)科技人才的積極性和創(chuàng)造性。
3.2多樣性數(shù)據(jù)類(lèi)型挑戰(zhàn)數(shù)據(jù)挖掘能力
基于大數(shù)據(jù)的科技評(píng)價(jià)指標(biāo)數(shù)據(jù)來(lái)源多樣,如來(lái)自物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、復(fù)雜物理信息系統(tǒng);基于大數(shù)據(jù)的科技評(píng)價(jià)指標(biāo)數(shù)據(jù)模態(tài)差異大,如圖數(shù)據(jù)、關(guān)系數(shù)據(jù)、XML數(shù)據(jù)、矢量數(shù)據(jù)、標(biāo)量數(shù)據(jù)、流數(shù)據(jù)等;基于大數(shù)據(jù)的科技評(píng)價(jià)指標(biāo)數(shù)據(jù)價(jià)值密度低,實(shí)時(shí)性可能也很低,大量信息不具有相關(guān)性,對(duì)知識(shí)進(jìn)行提純的難度高,需要生成、存儲(chǔ)、處理和分析大量數(shù)據(jù)。因此,基于大數(shù)據(jù)的科技評(píng)價(jià)過(guò)程更加復(fù)雜,需要掌握挖掘算法的有效性和可伸縮性,需要對(duì)現(xiàn)有架構(gòu)、組織體系、資源配置進(jìn)行重組,需要更強(qiáng)大的科技評(píng)價(jià)數(shù)據(jù)處理能力和手段,需要能對(duì)多模態(tài)數(shù)據(jù)進(jìn)行融合計(jì)算,需要從多源、多模態(tài)、實(shí)時(shí)動(dòng)態(tài)的數(shù)據(jù)中提取高質(zhì)量數(shù)據(jù)的評(píng)價(jià)數(shù)據(jù)過(guò)濾方法,放棄常駐內(nèi)存的小數(shù)據(jù)集,打破評(píng)價(jià)數(shù)據(jù)分析流程的算法效率瓶頸,解決大型數(shù)據(jù)庫(kù)中的數(shù)據(jù)同時(shí)導(dǎo)入問(wèn)題,隨著數(shù)據(jù)規(guī)模的不斷增大,實(shí)現(xiàn)精確整合和發(fā)現(xiàn)數(shù)據(jù)規(guī)律的指標(biāo)融合計(jì)算技術(shù)解決途徑[10]。
3.3處理大數(shù)據(jù)的速度挑戰(zhàn)其時(shí)效性
基于大數(shù)據(jù)的科技評(píng)價(jià)指標(biāo)數(shù)據(jù)規(guī)模會(huì)變得越來(lái)越大,分析處理的時(shí)間相應(yīng)地越來(lái)越長(zhǎng),這與信息處理要求越來(lái)越高的時(shí)效性非常矛盾;當(dāng)評(píng)價(jià)數(shù)據(jù)規(guī)模達(dá)到一定閾值時(shí),數(shù)據(jù)維度和規(guī)模呈PB級(jí)增長(zhǎng),線(xiàn)性復(fù)雜度的算法都難以接受,小數(shù)據(jù)條件下無(wú)從顯現(xiàn)的特征不斷涌現(xiàn),需要有效的人工智能算法和求解方法。傳統(tǒng)的科技評(píng)價(jià)往往忽視或漏掉博客、碎片化交流、搜索痕跡、移動(dòng)工具數(shù)據(jù)、傳感設(shè)備數(shù)據(jù)等網(wǎng)絡(luò)數(shù)據(jù),這些數(shù)據(jù)可能恰恰是科技評(píng)價(jià)的關(guān)鍵數(shù)據(jù),基于大數(shù)據(jù)的科技評(píng)價(jià)就是充分利用這些數(shù)據(jù),深度發(fā)掘其關(guān)聯(lián)規(guī)則和現(xiàn)實(shí)價(jià)值,從復(fù)雜的關(guān)系或網(wǎng)絡(luò)中直接獲取數(shù)據(jù)和規(guī)則知識(shí),通過(guò)對(duì)多源、多模態(tài)和異構(gòu)數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,有助于我們深刻了解科技評(píng)價(jià)對(duì)象,得出其中隱含的模式、未知的關(guān)聯(lián)及其他知識(shí),較之傳統(tǒng)的因果關(guān)系更具有實(shí)用性和精準(zhǔn)性。
3.4科技評(píng)價(jià)數(shù)據(jù)安全挑戰(zhàn)實(shí)踐指導(dǎo)
科技評(píng)價(jià)信息隨著技術(shù)的發(fā)展發(fā)生跨邊界傳播,安全保密、知識(shí)產(chǎn)權(quán)、個(gè)人信息、隱私數(shù)據(jù)等問(wèn)題相伴而生,需要建立相應(yīng)的強(qiáng)大安全防御體系保障數(shù)據(jù)存儲(chǔ)的物理安全性以及數(shù)據(jù)的多副本與容災(zāi)機(jī)制,發(fā)現(xiàn)和識(shí)別安全漏洞,這就需要新的算法與新的分析工具,缺乏新的數(shù)據(jù)類(lèi)型與新的數(shù)據(jù)分析技術(shù)是阻礙科技評(píng)價(jià)結(jié)果具有實(shí)踐指導(dǎo)作用的重要方面。相對(duì)于傳統(tǒng)憑借經(jīng)驗(yàn)和直覺(jué)的科技評(píng)價(jià),基于大數(shù)據(jù)的科技評(píng)價(jià)如果能夠發(fā)現(xiàn)創(chuàng)新管理模式和決策方案,將會(huì)強(qiáng)化評(píng)價(jià)結(jié)果的實(shí)踐指導(dǎo)作用,實(shí)現(xiàn)智能決策和持續(xù)學(xué)習(xí),需要進(jìn)一步創(chuàng)新評(píng)價(jià)方法的應(yīng)用。
總之,基于大數(shù)據(jù)的科技評(píng)價(jià)需要融合知識(shí)工程與計(jì)算機(jī)系統(tǒng),利用人的知識(shí)經(jīng)驗(yàn)和知識(shí)工程等方法來(lái)處理難于或不適宜用常規(guī)評(píng)價(jià)的復(fù)雜系統(tǒng)問(wèn)題,由知識(shí)模型轉(zhuǎn)化為計(jì)算機(jī)模型,實(shí)現(xiàn)對(duì)科技評(píng)價(jià)的可視化,對(duì)多種評(píng)價(jià)方面進(jìn)行比較和遴選,提供人機(jī)交互式評(píng)價(jià)。
在大數(shù)據(jù)環(huán)境下,傳統(tǒng)的科技評(píng)價(jià)方法需要應(yīng)用新的數(shù)據(jù)分析技術(shù),通過(guò)快速采集、發(fā)現(xiàn)和分析數(shù)據(jù),從中提取有價(jià)值的信息,形成一種有效的可做決策依據(jù)的“洞察力”?;诖髷?shù)據(jù)的科技評(píng)價(jià)以全面、集成的視角開(kāi)展深入挖掘海量、多源、動(dòng)態(tài)的數(shù)據(jù),通過(guò)對(duì)大數(shù)據(jù)的交換、整合和分析,從定性到定量有機(jī)集成人的知識(shí)、經(jīng)驗(yàn)和智慧與各種客觀數(shù)據(jù),設(shè)計(jì)可視化的交互式界面,為科技評(píng)價(jià)對(duì)象的遴選和實(shí)施提供理論和方法支持,為尋求大數(shù)據(jù)環(huán)境下科技評(píng)價(jià)規(guī)則提取新思路和新方法,形成大數(shù)據(jù)環(huán)境下的科技評(píng)價(jià)模式,揭示科技評(píng)價(jià)的運(yùn)行規(guī)律,將知識(shí)更廣泛而深刻地傳播,為科學(xué)的決策發(fā)揮作用,帶來(lái)大知識(shí)、大科技、大利潤(rùn)和大發(fā)展,具有較強(qiáng)的適用性和可拓展性。構(gòu)建大數(shù)據(jù)環(huán)境下的科技評(píng)價(jià)規(guī)則,充分利用大數(shù)據(jù),發(fā)現(xiàn)新知識(shí),創(chuàng)造新價(jià)值,需要具有前瞻性思維的實(shí)干型領(lǐng)導(dǎo)者制定相應(yīng)策略并貫徹執(zhí)行,需要大數(shù)據(jù)資深分析型人才、管理人才、技術(shù)人才的支持。
參考文獻(xiàn):
[1]Cloud computing,the free encyclopedia. http://beagood boy.iteye.com/blog/
[2]Anal S,Walker D. Creating Social Contagion Through Viral Product Design: A Randomized Trial of Peer Influence in Networks[J]. Management Science,2011(9): 248-256.
[3]鄒賀檢.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是,2013(2): 31-32.
[4]郭亞軍.科技評(píng)價(jià)理論、方法及應(yīng)用[M].北京:科學(xué)出版社,2007.
[5]邱均平,文庭孝.評(píng)價(jià)學(xué)理論、方法、實(shí)踐[M].北京:科學(xué)出版社,2011.
[6]陳衍秦.科技評(píng)價(jià)方法分類(lèi)及研究進(jìn)展[J].管理科學(xué)學(xué)報(bào),2004(2):73-75.
[7]李建中.大數(shù)據(jù)的一個(gè)重要方面:數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013(6):22-23.
[8]馮芷艷等.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報(bào),2013(1):105-107.
[9]林志剛,彭波.大數(shù)據(jù)管理的現(xiàn)實(shí)匹配、多重挑戰(zhàn)及趨勢(shì)判斷[J].改革,2013(8):8-10.
[10]繆其浩.大數(shù)據(jù)時(shí)代:趨勢(shì)和對(duì)策[J].科學(xué),2013(4): 56-57.
Research on S&T Evaluation Method Based on Big Data
Gao Xia
(Zhengzhou Institute of Aeronautical Industry Management,Zhengzhou Henan 450015)
Abstract:S&T evaluation involved numerical,image,sound have the characteristics of all media,multi-di?mension and time-cross. Mining and using these huge amount of data and transforming to intuitive ones which change with time and spaceand are presented in front of the peer review expertsin graphical images,can effec?tively improve the efficiency and effectiveness of the evaluation. Through the establishment of crowd-sourcing model,data integration and knowledge on extraction rules,we applyscience and technology evaluation results in?topractice,and construct evaluation process with interactive visualization in order to promote the construction of science and technology evaluation pattern based on big data. This pattern has challenges such as obsoleteidea,data mining capacity,speed of big data processing,security of S&T evaluation data and other aspects.
Keywords:Big Data;S&T evaluation;Data Intensive Method
作者簡(jiǎn)介:高霞(1980.10-),女,副教授,研究方向:創(chuàng)新管理與公共管理的教學(xué)與研究。
基金項(xiàng)目:國(guó)家社科基金(14BJL004);河南省社科規(guī)劃課題(2013CZZ011);河南省政府招標(biāo)課題(2015B049);河南省教育廳人文社科研究項(xiàng)目(2015-QN-023)。
收稿日期:2015-10-19
[中圖分類(lèi)號(hào)]G311
[文獻(xiàn)標(biāo)識(shí)碼]A
文章編號(hào):1671-0037(2015)11-27-4