陳星宇,黃俊文,周 展,曲行達
1)深圳大學管理學院,廣東深圳 518060;2)深圳大學人因工程研究所,廣東深圳 518060
【電子與信息科學 / Electronics and Information Science】
基于本體論的大數(shù)據(jù)下用戶需求表征
陳星宇1,黃俊文1,周 展1,曲行達2
1)深圳大學管理學院,廣東深圳 518060;2)深圳大學人因工程研究所,廣東深圳 518060
針對目前用戶需求提取與表征研究中無法清晰表征大規(guī)模模糊需求的局限性,提出一種基于本體論的用戶需求表征方法,通過自然語義處理、智能機器學習等人工智能算法,將初始數(shù)據(jù)生成、需求本體生成以及需求表征庫生成整合成一套完整用戶需求表征的科學指導方法.這一表征方法將本體論與大數(shù)據(jù)處理相結合,能在海量網(wǎng)絡數(shù)據(jù)中,準確提取用戶需求中的概念、分類及非分類關系,清晰地表征用戶需求,特別是用戶的模糊需求.這些需求可具象為產(chǎn)品特征,用以建立相應的表征庫,為新產(chǎn)品開發(fā)與創(chuàng)新提供有效支持.
自然語言處理; 大數(shù)據(jù);本體論; 用戶需求表征; 新產(chǎn)品開發(fā); 模糊需求
隨著信息技術與應用模式的不斷涌現(xiàn),中國已跨入“大數(shù)據(jù)”時代.大數(shù)據(jù)已遠遠超出了傳統(tǒng)的數(shù)據(jù)形態(tài),也超出了傳統(tǒng)技術手段的處理能力[1].與此同時,越來越多的用戶樂于在互聯(lián)網(wǎng)上分享自己對產(chǎn)品的觀點或體驗,由此形成的網(wǎng)絡口碑蘊含著豐富的產(chǎn)品使用反饋信息[2-3].在此背景下,用戶需求表征成了當前研究的熱點.
目前已有不少學者在用戶需求表征方面做了相關研究.Fung等[4]指出產(chǎn)品特征生成是一個從用戶的聲音到產(chǎn)品各個屬性的映射過程.過去對用戶需求分析和實現(xiàn)的方法包括公理化設計[5]、設計結構矩陣[6]、質量功能展開(quality function deployment,QFD)[7]和感性工學[8]等.其中,QFD[9-12]和感性工學[13-15]最具代表性.但QFD及相關方法最大的局限性在于過分依賴領域專家的知識結構和用戶需求提取的結果,同時映射到產(chǎn)品屬性和功能時也存在很大的不準確性;而感性工學方法的缺陷在于其本身的主觀性以及數(shù)據(jù)獲取的難度和成本.
此外,統(tǒng)計方法也運用到用戶需求分析和表征中.例如,Sener等[16]提出一個線性模型反映設計要素與用戶需求之間的關系.Liu等[17]運用多線性回歸方法建立了可用性需求與設計元素之間的關聯(lián).但是,以往的研究方法中對于模糊需求的表征存在很大不足,如用戶的心理需求通常不具有線性特征,所以用戶的模糊需求無法通過基于正態(tài)分布的線性方法來表征.
目前已有學者對表征用戶需求的方法進行了研究,然而這些研究仍存在兩大挑戰(zhàn):① 從用戶獲取的需求通常是對用戶語言描述的翻譯和解析,此過程不可避免地涉及到語言本身的不精確和模糊描述[18];② 用戶很多模糊需求,如“希望要一臺運動汽車”或“一架可愛的相機”,很難通過一些具象的產(chǎn)品特征去實現(xiàn).目前通常的做法是,設計師自己定義具體的產(chǎn)品特征來滿足用戶這部分需求.但此方法非常主觀,不同背景的設計師,其實現(xiàn)方法各異,很難客觀地通過一系列產(chǎn)品特征如顏色、材料和形狀等去匹配這些模糊需求[19-20].這使得用戶的一些模糊需求很難得到真正滿足,且實現(xiàn)起來風險很大.
本體論方法作為人工智能方法的一種,對解決上述問題有潛在優(yōu)勢.本體論方法利用概念和關系來表征語義關系.作為一種正式且嚴格的知識表征方法,本體論能表征精確和模糊兩種語義關系[21].因此,近年來,本體論方法被廣泛用于知識表征體系中.仲茜等[22]提出了一種基于數(shù)據(jù)場的大規(guī)模本體映射方法來提高本體映射質量與效率.李文清等[23]針對語義相似度提出一種本體概念的語義相似度計算方法.同時,也有文獻開始使用本體論去輔助需求管理[21, 24-25].Dermeval等[21]最早利用本體論提供統(tǒng)一的概念術語,為工程師和設計師之間共享用戶需求文檔提供幫助.Baida等[24]將本體論的需求層次運用到E-service,用戶需求層次被一些定義好的分解概念通過一定的邏輯關系(如與、非、或)相關聯(lián),使機器能夠讀懂并且解析成某產(chǎn)品的本體.Bock等[25]將本體論方法與建模方法相結合,利用本體論嚴謹?shù)恼Z義關系解析出靈活且準確的產(chǎn)品屬性及組合以滿足用戶需求,避免了因人為因素造成的用戶需求被解析成不同的需求說明.
本研究結合本體論方法[26],基于文獻[11-15],構建一個能更準確表征用戶需求,特別是模糊需求的本體學習系統(tǒng).相比其他方法,此系統(tǒng)不過分依賴領域專家的知識結構和用戶需求提取的結果,利用本體論建立用戶需求與產(chǎn)品屬性之間復雜抽象的語義關系,避免了人為因素造成的用戶需求被解析成不同的需求說明,能有效指導互聯(lián)網(wǎng)環(huán)境下的新產(chǎn)品開發(fā).
本研究結合人工智能方法,包括智能機器學習機制,設計了優(yōu)化算法,分析和改進自然語言處理算法的語義部分,包括語義的模式分析和詞頻分析等,并在此基礎上,構建一個基于本體論的用戶需求表征系統(tǒng)(圖1),建立用戶需求的本體.
圖1 基于本體論的用戶需求表征系統(tǒng)Fig.1 Ontology-based user needs representation framework
1.1 數(shù)據(jù)收集與預處理
由于網(wǎng)絡論壇中用戶的集中程度較高,同時通常參加產(chǎn)品開發(fā)論壇的用戶在相關產(chǎn)品或技術上都較為精通,所以本研究通過網(wǎng)絡產(chǎn)品論壇,如中關村在線(http://www.zol.com.cn)和CNET(https://www.cnet.com)等收集用戶需求數(shù)據(jù).
由于原始數(shù)據(jù)具有粗糙、低效和無序的特點,特別是用戶需求數(shù)據(jù)和用戶資料數(shù)據(jù)都是一些偏主觀描述,所以在數(shù)據(jù)收集后需對原始數(shù)據(jù)進行預處理.處理過程中,通過自然語義處理算法將原始數(shù)據(jù)分成一個個語法字節(jié)(如“相機”、 “圖片”等).
1.2 構建需求本體
數(shù)據(jù)收集與預處理完成后,才能構建需求本體.這一步可細分為概念提取、分類關系提取和非分類關系提取.
1.2.1 概念提取
在本體構建方面,本研究運用POS(part-of-speech)語義分析方法,結合領域相關性進行概念提取,步驟包括:
1)在經(jīng)過預處理的語法字節(jié)中提取標注為名詞和名詞短語的語法標簽.
2)剔除形容詞和定冠詞.
3)將剩下的詞集通過語義的模式分析進行歸類,選出候選詞集.
4)通過領域相關性判斷每個術語的相關性.一般來說,高詞頻的詞匯被視為本領域的重要術語,例如“門板”和“遮板”這兩個詞有類似含義,但根據(jù)詞頻,“門板”在產(chǎn)品領域的相關性較高,而“遮板”在反恐領域相關性較高,所以剔除概念“遮板”,留下概念“門板”.
5)提取出重要的概念.例如,用戶需求“數(shù)碼相機需要有高分辨率”, 通過整個過程能提取出“數(shù)碼相機”和“分辨率”兩個概念.
1.2.2 分類關系提取
對于分類關系的提取,本研究采用字符串匹配算法進行初步的關系獲?。诖嘶A上輔以產(chǎn)品設計領域的屬性詞典WordNet來優(yōu)化關系.由于很多分類關系并非簡單的字符串匹配,因此本研究采用語法模式識別算法提取字符串匹配無法識別的分類關系.具體步驟包括:
1)假設詞匯1[head]和詞匯2[word, head]包含相同詞頭,則詞匯1與詞匯2存在分類關系.如詞匯1[價格]和詞匯2[低,價格],均包含詞頭“價格”,因此它們之間存在分類關系.
2)通過步驟1)初步獲取一些分類關系后,再通過屬性詞典WordNet進一步尋找分類關系.若WordNet里面有這兩個詞匯的分類關系,則詞匯1與詞匯2存在分類關系.如詞匯1[顏色]和詞匯2[白色],它們在WordNet里存在分類關系,所以也被提取出來.
3)假設詞匯1(word11, word12, …, word1n, head1)的詞頭“head1”和詞匯2(word21, word22, …, word2n, head2)的詞頭“head2”在WordNet同屬一個子集,且詞匯1與詞匯3存在分類關系,則詞匯2與詞匯3也存在分類關系.比如,詞匯1(黑色,…,綠色,深色),詞匯2(深藍,…,紅色,深色),詞匯3(黑色,…,綠色,顏色),此處詞匯1和詞匯2的詞頭在WordNet的同一子集里,而又因詞匯1和詞匯3又存在分類關系,所以詞匯2和詞匯3存在分類關系.
4)對于復雜的字符串匹配無法識別的分類關系,本研究用語法模式識別發(fā)現(xiàn)詞匯之間的語法規(guī)則,確定分類關系.比如,通過關于種類的語法規(guī)則(“圓形是一種形狀”),來提取“圓形”和“形狀”之間的分類關系.
1.2.3 非分類關系提取
對于非分類關系,可用自適應規(guī)則語義分析進行初步提?。c普通的規(guī)則語義分析方法不同,自適應的語義分析法能通過對語義情境的識別及詞義解析、判斷出復雜語法句式下相對精準的關聯(lián)關系.此外,由于規(guī)則語義分析法則只能分解語法樹,而有一些重要的非分類關系法則因為不遵循語法結構而被忽略.因此,本研究提出一種基于詞頻的改進算法來調整語義分析結果,力爭獲得更多的非分類關系.具體步驟包括:
1)通過規(guī)則語義分析提取普通的非分類關系.如(N, V, N)規(guī)則,就是指通過提取出語句中的(名詞-動詞-名詞)固定語義格式來提取非分類關系.例如,“相機有閃光”就符合典型的(N,V,N)規(guī)則,所以能提取出(“相機”、“有”和“閃光”)這條本體非分類關系.
2)通過上下文的情景識別對規(guī)則語義進行分析,提取普通規(guī)則語義分析無法正確識別的非分類關系.例如,在一些場景中,對“相機在夜晚有清晰的圖像”這個句子,如果通過普通規(guī)則語義分析,提取出的非分類關系是(“夜晚”,“有”,“清晰圖像”),而通過對規(guī)則語義分析并加入上下文的情景識別,能提取出(“相機”、“有”和“清晰圖像”)這一正確的非分類關系.
3)通過分析詞頻,提取出基于模糊需求的非分類關系.除了語義與規(guī)則,還有一些重要的非語義關系.如“我想要一個帶卡通圖盤和手動調焦功能的相機”,若通過語義分析,則無法提取出“相機”與“卡通圖案”及“手動調焦”之間的非分類關系.因此本研究提出一種改進算法,通過借用數(shù)據(jù)挖掘工具(如Weka3.7,http://www.cs.waikato.ac.nz/ml/weka/)對提取的概念進行詞頻分析,并計算數(shù)據(jù)的支持度(support)和置信度(confidence),提取重要的非分類關系.借鑒文獻[26]的結果,本研究將最小支持度設為0.1,最小置信度設為0.2.
1.3 表征庫生成
產(chǎn)品需求表征庫的生成,首先通過對本體的解析,將分類及非分類關系對應為用戶需求;再將用戶需求進一步映射到產(chǎn)品特征,生成產(chǎn)品需求,并輸出一個需求表征庫.具體步驟為:
1)需求本體解析.通過解析創(chuàng)新用戶需求本體的分類及非分類關系,輸出創(chuàng)新用戶需求.將分類關系對應為用戶的精準需求,將非分類關系對應為用戶的模糊需求.對表征庫的需求與產(chǎn)品特征的實現(xiàn),進行整體輸出評估,即評估用戶需求輸出的效度.評估方法可由本領域專家根據(jù)在生成本體中隨機抽取的用戶需求進行打分,分值為1~5分,1分表示精準度很低且噪音(錯誤信息)很高,5分表示精準度很高且噪音很低.通過對專家所打分數(shù)的分析,得到對生成本體的評估結果.
2)產(chǎn)品特征實現(xiàn).根據(jù)本體解析的結果建立用戶需求與產(chǎn)品特征之間的關聯(lián)關系,輸出具體的產(chǎn)品特征,并加入到需求表征庫.表征庫中的每一條記錄對應與某一產(chǎn)品特征對用戶需求的實現(xiàn).企業(yè)的新產(chǎn)品可借鑒于此需求庫中的產(chǎn)品需求來進行具體功能與產(chǎn)品特征的開發(fā).
以下通過分析一類具體產(chǎn)品的需求本體生成過程,說明本研究所提出的基于本體論的用戶需求表征方法.在該過程中,通過在線用戶的評論來識別和分析,并表征用戶的需求.
2.1 用戶評論數(shù)據(jù)獲取
實驗對象為數(shù)碼相機這一類產(chǎn)品.將產(chǎn)品評論網(wǎng)站CNET上關于數(shù)碼相機的用戶評論數(shù)據(jù)作為原始分析數(shù)據(jù).在這些關于數(shù)碼相機的評論中,既有正面的,也有負面的,通過對這些評論中字節(jié)的提取和過濾,找到數(shù)碼相機的用戶需求.
從評論網(wǎng)站上隨機獲取2 000條關于數(shù)碼相機的在線評論作為原始數(shù)據(jù).這些評論涉及500種型號,且相機的價位、目標用戶群體、體積和質量等參數(shù)均不同.分析整理所獲取的數(shù)據(jù)后,得到如表1的數(shù)據(jù)集.
2.2 數(shù)據(jù)預處理
通過分析網(wǎng)絡論壇中用戶的發(fā)帖、評論和留言的內(nèi)容,根據(jù)領域相關性從中提取有效的用戶需求.對網(wǎng)絡原始數(shù)據(jù)采用網(wǎng)上數(shù)據(jù)挖掘方法進行數(shù)據(jù)的提取和分析.設計從CNET收集的用戶對數(shù)碼相機的標準評論數(shù)據(jù)格式為:(型號; 優(yōu)點; 缺點), 以尼康S4000數(shù)碼相機的用戶數(shù)據(jù)為例,其用戶需求數(shù)據(jù)為: “尼康 S4000”;“這架相機是我見到的圖片成像效果最好的,自動對焦非??欤诎倒庀屡某鲆曨l的效果不錯”;“我不喜歡觸摸屏,按鍵太小,切換拍照模式步驟繁瑣”等.進行預處理分析后,得到一系列關鍵詞,如“相機”、“圖片”等.
2.3 用戶需求本體生成
將收集到的數(shù)據(jù)通過預處理生成數(shù)據(jù)集后,放入所提出的需求本體生成系統(tǒng)中,通過概念以及概念間的分類關系與非分類關系的提取,生成數(shù)碼相機的需求本體庫.
表1 關于數(shù)碼相機的評論例子
在具體操作中,可利用POS詞性語義分析法以及領域相關性方法從處理后的用戶評論中提取相關概念.這些概念包括名詞及名詞短語.表2是部分提取出來的數(shù)碼相機的概念.
表2 部分提取出來的相機概念
概念被提取后,通過字符串匹配、WordNet和語法模式識別等操作,進一步分析和提取出概念之間的分類關系.這些分類關系至少能夠連接兩個概念.部分分類關系見表3.
通過運用自適應語義分析、智能機器學習以及詞頻分析法等方法,提取出基于語義與規(guī)則的非分類關系.部分結果如表4.
表3 部分分類關系
對于基于語義分析無法提取的情況,采用數(shù)據(jù)挖掘工具Weka 3.7對提取的概念進行詞頻分析,通過計算數(shù)據(jù)的支持度和置信度,提取重要的非分類關系.部分結果如表5.
通過一系列概念的提取、分類關系的提取,以及非分類關系的提取,生成關于數(shù)碼相機的用戶需求本體,部分結果見圖2.
表4 部分“名詞-動詞-名詞”型非分類關系
表5 部分抽象概念與具體概念間的非分類關系
圖2 關于數(shù)碼相機的產(chǎn)品本體Fig.2 Product ontology of digital camera
2.4 產(chǎn)品需求表征庫生成與評估
運用本研究方法提取抽象概念與具體產(chǎn)品特征的非分類關系,體現(xiàn)了高層級的用戶需求與低層級產(chǎn)品特征之間的映射.
2.4.1 產(chǎn)品需求表征庫生成
通過對生成的產(chǎn)品本體進行解析,將關系轉變?yōu)橐粭l條需求實現(xiàn),并加入到產(chǎn)品表征庫中.例如,“運動型相機→銀色”的非分類關系,可實現(xiàn)為用戶對此數(shù)碼相機的一條重要模糊需求,即通過“銀色的相機”實現(xiàn)用戶對“運動型相機”的需求,生成相應的產(chǎn)品需求,再將“銀色的相機是運動型的”添加至產(chǎn)品需求表征庫中.表征庫的部分產(chǎn)品需求見表6.
2.4.2 需求本體評估
在解析出如表6的需求本體表征庫后,還需進一步評估該本體表征庫能否準確表征用戶需求與產(chǎn)品特征的關系.
評估過程為:
1) 分別選擇1位數(shù)碼相機的資深用戶、1位數(shù)碼相機的產(chǎn)品經(jīng)理以及1位數(shù)碼相機的設計師作為領域專家;
2) 在生成的需求表征庫中隨機抽取100條需求本體,讓領域專家對這100條需求本體從精確度與噪聲(錯誤信息)兩方面打分,分值為1~5分,其中1分表示精確度很低且噪音很高,5分則表示精確度很高且噪音很低;
3) 對收集到的需求本體的得分數(shù)據(jù)進行統(tǒng)計分析.
對評估結果分析可知,這100條需求本體的得分均值為3.78,方差為0.86.結果表明,本研究方法得出的需求本體整體精確度較高,噪聲較低,該方法對需求本體的表征,特別是模糊需求的表征較準確.
表6 產(chǎn)品表征庫中的部分產(chǎn)品需求
結合知識工程領域關于本體論的研究,提出一個基于本體論的用戶需求表征方法.與本體論定義相似,用戶需求表征需先提取需求概念集,通過其所處上下文來刻畫概念的內(nèi)涵.由于本體論方法對解決用戶需求,特別是模糊需求表征有天然優(yōu)勢,因此通過本體的關聯(lián)關系表征用戶需求,特別是通過本體的非分類關系表征用戶的模糊需求,可有效解決用戶需求表征問題.在算法方面,本研究基于規(guī)則的語義分析方法,結合詞頻關聯(lián)規(guī)則,找到目前分類語法樹無法提取的非分類關系,提取出更準確的模糊需求.在應用方面,通過有效的解析需求本體與產(chǎn)品屬性之間的映射,建立了一個通用的基于創(chuàng)新用戶需求的產(chǎn)品表征庫,企業(yè)能夠通過這個整合的表征庫找到從用戶處獲取的對同類產(chǎn)品或有借鑒意義的產(chǎn)品屬性,從而幫助企業(yè)有效識別潛在用戶的需求及定位新產(chǎn)品功能,提升企業(yè)創(chuàng)新競爭力.
/ References:
[1] 馮芷艷,郭迅華,曾大軍,等.大數(shù)據(jù)背景下商務管理研究若干前沿課題[J].管理科學學報,2013,16(1):1-9. Feng Zhiyan, Guo Xunhua, Zeng Dajun, et al. On the research frontiers of business management in the context of big data[J]. Journal of Management Sciences in China, 2013, 16(1): 1-9.(in Chinese)
[2] 伊 裴,王洪偉.面向產(chǎn)品特征的中文在線評論情感分類:以本體建模為方法[J].系統(tǒng)管理學報,2016,25(1):103-114. Yi Pei, Wang Hongwei. Sentiment classification for Chinese online reviews at product feature level through domain ontology method[J]. Journal of Systems & Management, 2016, 25(1): 103-114.(in Chinese)
[3] 涂海麗,唐曉波,謝 力.基于在線評論的用戶需求挖掘模型研究[J].情報學報,2015,34(10):1088-1097. Tu Haili, Tang Xiaobo, Xie Li. Research on user needs mining model based on online based on online reviews[J]. Journal of the China Society for Scientific and Technical Information, 2015, 34(10): 1088-1097.(in Chinese)
[4] Fung K Y, Kwong C K, Siu K W M, et al. A multi-objective genetic algorithm approach to rule mining for affective product design[J]. Expert Systems with Applications, 2012, 39(8): 7411-7419.
[5] Kulak O, Cebi S, Kahraman C. Applications of axiomatic design principles: a literature review[J]. Expert Systems with Applications, 2010, 37(9): 6705-6717.
[6] Huang Yuexiang, Chen C H, Khoo L P. Kansei clustering for emotional design using a combined design structure matrix[J]. International Journal of Industrial Ergonomics, 2012, 42(5): 416-427.
[7] Sivasamy K, Arumugam C, Devadasan S R. Advanced models of quality function deployment: a literature review[J]. Quality & Quantity, 2016, 50(3): 1399-1414.
[8] Mitsuo N. Perspectives and the new trend of Kansei/affective engineering[J]. The TQM Journal, 2008, 20(4): 290-298.
[9] Bhatia S M, Sharma A K. Fuzzy quality function deployment and software engineering: a literature review[J]. Software Engineering and Technology, 2014, 6(6):159-168.
[10] Ho W, He Ting, Lee C K M, et al. Strategic logistics outsourcing: an integrated QFD and fuzzy AHP approach[J]. Expert Systems with Applications, 2012, 39(12): 10841-10850.
[11] Lee Changyong, Song Bomi, Park Y. Design of convergent product concepts based on functionality: an association rule mining and decision tree approach[J]. Expert Systems with Applications, 2012, 39(10): 9534-9542.
[12] Lima-Junior F R, Carpinetti L C R. A multicriteria approach based on fuzzy QFD for choosing criteria for supplier selection[J]. Computers & Industrial Engineering, 2016, 101: 269-285.
[13] 劉征宏,謝慶生,李少波,等.基于潛在語義分析和感性工學的用戶需求匹配[J].浙江大學學報工學版,2016,50(2):224-233. Liu Zhenghong, Xie Qingsheng, Li Shaobo, et al. Sentiment classification for Chinese online reviews at product feature level through domain ontology method[J]. Journal of Zhejiang University Engineering Science, 2016, 50(2): 224-233.(in Chinese)
[14] Khalid H M. Embracing diversity in user needs for affective design[J]. Applied Ergonomics, 2006, 37(4): 409-418.
[15] Lu Weihua, Petiot J F. Affective design of products using an audio-based protocol: application to eyeglass frame[J]. International Journal of Industrial Ergonomics, 2014, 44(3): 383-394.
[16] Sener Z, Karsak E E. A combined fuzzy linear regression and fuzzy multiple objective programming approach for setting target levels in quality function deployment[J]. Expert Systems with Applications, 2011, 38(4): 3015-3022.
[17] Liu Yuanyuan, Zhou Jian, Chen Yizeng. Using fuzzy non-linear regression to identify the degree of compensation among customer requirements in QFD [J]. Neurocomputing, 2014, 142: 115-124.
[18] Lai H H, Lin Y C, Yeh C H, et al. User-oriented design for the optimal combination on product design[J]. International Journal of Production Economics, 2006, 100(2): 253-267.
[19] Zhai Lianyin, Khoo L P, Zhong Zhaowei. A rough set based QFD approach to the management of imprecise design information in product development[J]. Advanced Engineering Informatics, 2009, 23(2): 222-228.
[20] Nepal B, Yadav O P, Murat A. A fuzzy-AHP approach to prioritization of CS attributes in target planning for automotive product development[J]. Expert Systems with Applications, 2010, 37(10): 6775-6786.
[21] Dermeval V, Vilela J, Bittencourt I, et al. Applications of ontologies in requirements engineering: a systematic review of the literature[J]. Requirements Engineering, 2016, 21(4): 405-437.
[22] 仲 茜,李涓子,唐 杰,等.基于數(shù)據(jù)場的大規(guī)模本體映射[J].計算機學報,2010,33(6):955-965. Zhong Qian, Li Juanzi, Tang Jie, et al. Data field based large scale ontology mapping[J]. Chinese Journal of Computers, 2010, 33(6): 955-965.(in Chinese)
[23] 李文清,孫 新,張常有,等.一種本體概念的語義相似度計算方法[J].自動化學報,2012,38(2):229-235. Li Wenqing, Sun Xin, Zhang Changyou, et al. A semantic similarity Measure between ontologicalconcepts[J]. Acta Automatica Sinica, 2012, 38(2): 229-235.(in Chinese)
[24] Baida Z, Gordijn J, Sle H, et al. An ontological approach for eliciting and understanding needs in e-services[J]. Advanced Information Systems Engineering, 2005, 3520: 400-414.
[25] Bock C, Zha Xuanfang, Suh H W, et al. Ontological product modeling for collaborative design[J]. Advanced Engineering Informatics, 2010, 24(4): 510-524.
[26] 楊德仁.一種改進的形式化本體模型研究[J].深圳大學學報理工版,2007,24(4):393-398. Yang Deren. Research on an optimized model forformal ontology[J]. Journal of Shenzhen University Science and Engineering, 2007, 24(4):393-398.(in Chinese)
【中文責編:英 子;英文責編:子 蘭】
Ontology-based user requirements representation in the context of big data
Chen Xingyu1, Huang Junwen1, Zhou Zhan1, and Qu Xingda2?
1) College of Management, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China 2) Institute of Human Factors and Ergonomics, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China
Representation of user requirements is essential for product innovation. However, traditional market survey methods seem to fail to represent user requirements effectively in current big data context. We propose a novel ontology-based method to overcome limitations of existing research on the extraction and representation of users’ requirements.This method integrates initial data generation, requirement ontology generation and demand characterization into a complete set of scientific guidance for user demand characterization using natural semantic processing, intelligent machine learning and other artificial intelligence algorithms. It uses ontology and big data processing techniques to extract concepts, taxonomic and non-taxonomic relations from huge raw internet data, and further helps identify user’s requirements, especially fuzzy requirements. The identified user requirements can be embodied as product features, which helps build product feature representation library to provide support for new product development and innovation.
natural language processing; big data; ontology; user requirement representation; new product development; fuzzy requirements
:Chen Xingyu, Huang Junwen, Zhou Zhan, et al. Ontology-based user requirements representation in the context of big data[J]. Journal of Shenzhen University Science and Engineering, 2017, 34(2): 173-180.(in Chinese)
F 237.2;C 93-03
A
10.3724/SP.J.1249.2017.02173
國家自然科學基金資助項目(71502111,31570944);深圳大學校基礎研究啟動基金資助項目(2015041)
陳星宇 (1983—),女,深圳大學講師、博士.研究方向:新產(chǎn)品體驗及客戶需求管理.E-mail:celine@szu.edu.cn
Received:2016-11-24;Accepted:2017-01-10
Foundation:National Natural Science Foundation of China (71502111, 31570944); Start-up Grant of Shenzhen University (2015041)
? Corresponding author:Professor Qu Xingda. E-mail: quxd@szu.edu.cn
引 文:陳星宇,黃俊文,周 展,等.基于本體論的大數(shù)據(jù)下用戶需求表征[J]. 深圳大學學報理工版,2017,34(2):173-180.