劉保旗,林麗,郭主恩
基于語(yǔ)義量化匹配的汽車外觀顯著性意象挖掘
劉保旗,林麗*,郭主恩
(貴州大學(xué) 機(jī)械工程學(xué)院,貴陽(yáng) 550025)
為解決傳統(tǒng)感性設(shè)計(jì)研究中意象實(shí)驗(yàn)耗時(shí)大以及小樣本偶然性等問(wèn)題,依托現(xiàn)有網(wǎng)絡(luò)評(píng)價(jià)文本信息提取了用戶意象認(rèn)知。首先,爬取大規(guī)模汽車外觀評(píng)論文本,構(gòu)建語(yǔ)義分析詞匯庫(kù),構(gòu)建word2vec詞向量模型;然后,基于模型獲取詞庫(kù)內(nèi)部的語(yǔ)義聯(lián)系,計(jì)算高頻關(guān)鍵形容詞之間的語(yǔ)義離散性,以構(gòu)建代表性意象詞空間;最后,通過(guò)語(yǔ)義量化匹配將評(píng)論映射到意象詞空間,得到大規(guī)模用戶對(duì)各車型的顯著性意象表征,明確了指定意象詞匯下的汽車外觀匹配結(jié)果。運(yùn)用該方法挖掘汽車外觀顯著性意象與基于人工評(píng)價(jià)的實(shí)驗(yàn)結(jié)果無(wú)顯著性差異且具有高度相關(guān)性,證明了該方法的有效性。以該方法挖掘用戶意象認(rèn)知,運(yùn)用了現(xiàn)有的大批量用戶反饋知識(shí),提高了意象分析效率,有助于決策者快速理解消費(fèi)者對(duì)汽車外觀的感性知識(shí),在設(shè)計(jì)迭代中可使產(chǎn)品更符合市場(chǎng)期望;對(duì)比相關(guān)研究,基于語(yǔ)義量化匹配的方式無(wú)需對(duì)超高維向量進(jìn)行降維和聚類,避免了以往研究因特征降維而可能導(dǎo)致的詞向量語(yǔ)義聯(lián)系的損失,以得到更為準(zhǔn)確的意象挖掘結(jié)果。
語(yǔ)義量化匹配;汽車外觀;感性意象;網(wǎng)絡(luò)評(píng)論;文本挖掘
近年來(lái),隨著汽車工業(yè)的快速發(fā)展和消費(fèi)者對(duì)汽車外觀設(shè)計(jì)的不斷關(guān)注,對(duì)汽車外觀感性意象評(píng)價(jià)的研究已成為汽車設(shè)計(jì)和制造領(lǐng)域的熱門研究方向。對(duì)于汽車外觀設(shè)計(jì),消費(fèi)者的情感反應(yīng)是非常重要的,而消費(fèi)者的情感反應(yīng)主要是通過(guò)感性意象來(lái)表達(dá)的[1]。因此,如何準(zhǔn)確地獲取消費(fèi)者的感性意象評(píng)價(jià),進(jìn)一步優(yōu)化汽車設(shè)計(jì)和制造,已成為汽車制造商和研究人員面臨的重要問(wèn)題[2]。
傳統(tǒng)感性意象認(rèn)知研究主要通過(guò)問(wèn)卷調(diào)查、訪談等手段,從被試者的主觀反應(yīng)中提取有關(guān)產(chǎn)品感性屬性的信息,以幫助設(shè)計(jì)師理解用戶的感性需求和期望。例如,Hassenzahl等[3]采用心理學(xué)實(shí)驗(yàn)法探究了汽車外觀的感性評(píng)價(jià)。隨著研究的不斷深入,獲取用戶感性認(rèn)知的方法層出不窮,主要有心理測(cè)量法[4-7]、生理測(cè)量法[8-11]、文本挖掘法[12-16]、深度學(xué)習(xí)法[17-20]等。然而,傳統(tǒng)感性工學(xué)認(rèn)知研究方法具有一定的局限性,例如,傳統(tǒng)方法實(shí)驗(yàn)過(guò)程煩瑣,需要高成本的時(shí)間和資金;一般采用小樣本,結(jié)果偶然性較大,不一定具有普適性,且一般需要設(shè)計(jì)師和專業(yè)人員進(jìn)行實(shí)驗(yàn),其認(rèn)知和理解能力可能受個(gè)人經(jīng)驗(yàn)、教育背景等的影響,限制了研究的普適性和可靠性。因此,充分運(yùn)用大規(guī)模評(píng)論文本信息展開(kāi)產(chǎn)品感性意象研究將是未來(lái)的重要趨勢(shì)[21]。
目前,越來(lái)越多的研究者開(kāi)始采用自然語(yǔ)言處理技術(shù)和機(jī)器學(xué)習(xí)技術(shù)來(lái)研究消費(fèi)者的感性意象評(píng)價(jià)。使用自然語(yǔ)言處理技術(shù)進(jìn)行大規(guī)模數(shù)據(jù)感性意象認(rèn)知研究,能夠有效克服傳統(tǒng)方法的局限性,實(shí)現(xiàn)對(duì)消費(fèi)者感性需求的全面分析?;诖笠?guī)模評(píng)論文本的產(chǎn)品感性研究中,林麗等[14]通過(guò)提取用戶評(píng)論中的TextRank關(guān)鍵詞并構(gòu)建word2vec詞向量模型,對(duì)意象詞向量進(jìn)行共同降維,得到了與感性意象空間關(guān)系較強(qiáng)的詞匯映射關(guān)系;李少波等[16]基于在線評(píng)論數(shù)據(jù)對(duì)詞向量進(jìn)行聚類,并通過(guò)程度副詞計(jì)算情感強(qiáng)度從而實(shí)現(xiàn)感性評(píng)價(jià)獲??;汪天雄[22]通過(guò)TF-IDF方法提取在線評(píng)論的感性意象關(guān)鍵詞,經(jīng)分析后形成語(yǔ)意網(wǎng)絡(luò),以篩選出感性意象需求。以上研究均基于詞向量降維、聚類得以實(shí)現(xiàn)文本中核心意象的挖掘,降維的本質(zhì)在于將高維數(shù)據(jù)轉(zhuǎn)到低維空間中以尋求數(shù)據(jù)緊湊表示[23],從而消除數(shù)據(jù)中的無(wú)關(guān)信息和冗余信息[24],但詞向量一般具有維度較高的特點(diǎn),文獻(xiàn)[25]指出,目前降維方法對(duì)于普通高維數(shù)據(jù)(5<維度<50)已經(jīng)非常有效,但在超高維數(shù)據(jù)(維度>50)的情況下,降維效果還有待進(jìn)一步提高,即超高維詞向量經(jīng)過(guò)特征降維往往會(huì)折損原有詞向量間的語(yǔ)義聯(lián)系,并且不能得到最佳的聚類效果。
基于語(yǔ)義量化匹配的方式進(jìn)行用戶顯著性意象認(rèn)知挖掘,可在語(yǔ)義層面和統(tǒng)計(jì)層面挖掘用戶對(duì)汽車外觀評(píng)價(jià)的感性意象認(rèn)知,在無(wú)須特征降維和聚類的情況下,更大限度地保留詞向量模型內(nèi)部的語(yǔ)義關(guān)聯(lián),以語(yǔ)義匹配的方式實(shí)現(xiàn)顯著性意象認(rèn)知的詞匯表征,以此建立以大規(guī)模網(wǎng)絡(luò)評(píng)論為基點(diǎn)的顯著性意象挖掘模型,從而為感性優(yōu)化設(shè)計(jì)提供顯著性用戶知識(shí)參考,為感性意象的大規(guī)模評(píng)論文本挖掘提供新思路,為智能化感性優(yōu)化設(shè)計(jì)奠定前期基礎(chǔ)。
首先,詞庫(kù)與詞向量模型構(gòu)建,獲取汽車外觀大規(guī)模評(píng)論數(shù)據(jù)構(gòu)建語(yǔ)義分析詞匯庫(kù),通過(guò)構(gòu)建詞向量模型將評(píng)論文本轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別語(yǔ)義的分布式詞向量;其次,建立代表性意象詞空間,構(gòu)建語(yǔ)料關(guān)鍵形容詞庫(kù)并計(jì)算其語(yǔ)義離散度,具備語(yǔ)義代表性的高頻關(guān)鍵形容詞用于構(gòu)建意象詞空間;再次,語(yǔ)義量化匹配的顯著性意象表征,基于關(guān)鍵形容詞與詞空間的語(yǔ)義相似度確定評(píng)論語(yǔ)料的代表性意象表征詞匯,明確各車型的顯著性意象以及各車型對(duì)詞空間指定意象的表征程度;最后,進(jìn)行驗(yàn)證實(shí)驗(yàn),通過(guò)人工評(píng)價(jià)進(jìn)行感性意象認(rèn)知實(shí)驗(yàn),分析語(yǔ)義量化匹配結(jié)果的相關(guān)性,以驗(yàn)證方法的可行性。具體的研究流程如圖1。
圖1 研究流程
首先,基于requests庫(kù)編寫爬蟲腳本,獲取“懂車帝”“太平洋汽車”等汽車資訊平臺(tái)所有車型在“外觀”下的用戶評(píng)論,經(jīng)過(guò)去重得到248 963條評(píng)論。
然后,對(duì)大規(guī)模評(píng)論文本進(jìn)行文本預(yù)處理。添加清華大學(xué)開(kāi)放中文詞庫(kù)的汽車專業(yè)詞匯詞典并手動(dòng)補(bǔ)充高頻詞匯,使評(píng)論中的某些汽車專業(yè)詞匯及汽車品牌詞匯有效切分出來(lái),采用全模式分詞以避免由于精確分詞模式可能導(dǎo)致的詞語(yǔ)遺漏問(wèn)題,以增加分詞的準(zhǔn)確性;再運(yùn)用哈工大停用詞表對(duì)分詞結(jié)果去停用詞處理、篩選掉詞匯長(zhǎng)度為1的單字,得到分詞語(yǔ)料,以構(gòu)建語(yǔ)義分析詞匯庫(kù)。
詞向量分為獨(dú)熱表示(one-hot representation)和分布式表示(distribution representation)兩種方式,獨(dú)熱表示割裂了詞與詞之間的聯(lián)系,并且易出現(xiàn)維度災(zāi)難等問(wèn)題[26],分布式表示期望將語(yǔ)義信息融入向量編碼,2013年谷歌提出基于上下文的word2vec分布式表示方法[27],word2vec是一種流行的將詞匯表示成定長(zhǎng)連續(xù)的稠密向量的無(wú)監(jiān)督訓(xùn)練方法,該過(guò)程通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,將網(wǎng)絡(luò)參數(shù)作為詞匯的向量表示。
詞向量訓(xùn)練采用gensim工具包的word2vec模塊,經(jīng)過(guò)多次超參數(shù)調(diào)整的模型訓(xùn)練對(duì)比,最終word2vec詞嵌入訓(xùn)練模型采用CBOW網(wǎng)絡(luò)結(jié)構(gòu),詞向量維度設(shè)置為100維,滑動(dòng)窗口設(shè)置為5,忽略總頻率小于3的詞匯,得到word2vec模型。由于該模型屬無(wú)監(jiān)督訓(xùn)練,為驗(yàn)證模型訓(xùn)練效果,隨機(jī)選取了6個(gè)形容詞匯,輸入到模型中,根據(jù)式(1)計(jì)算模型中與該6個(gè)詞向量余弦相似度較大的詞匯,如表1所示。
表1 word2vec詞向量模型訓(xùn)練效果
Tab.1 word2vec word vector model training effect
在建立意象詞空間的過(guò)程中,將詞性標(biāo)注和無(wú)監(jiān)督關(guān)鍵詞提取技術(shù)相結(jié)合,將評(píng)論文本中的關(guān)鍵形容詞提取出來(lái),構(gòu)建關(guān)鍵形容詞庫(kù),選取詞庫(kù)中頻率較高的關(guān)鍵形容詞,并運(yùn)用上文所構(gòu)建的詞向量模型進(jìn)行語(yǔ)義離散性的計(jì)算,具備語(yǔ)義代表性的詞匯將作為代表性意象詞空間。
TF-IDF是典型的無(wú)監(jiān)督關(guān)鍵詞提取方法,其作用是衡量一個(gè)詞對(duì)該文本的重要程度。其中,詞頻(Term Frequency,TF)是某一詞語(yǔ)在該文檔中出現(xiàn)的頻率,逆向文檔頻率(Inverse Document Frequency,IDF)是一個(gè)詞語(yǔ)普遍重要性的度量,TF-IDF則是將TF和IDF相乘得到的[30]。TF-IDF公式如下,其中,W,y表示詞語(yǔ)在文檔中的TF-IDF權(quán)重值,tf表示詞語(yǔ)在文檔中的頻率,df表示包含詞語(yǔ)的總文檔數(shù)目,表示總文檔數(shù)目。
為保證構(gòu)建感性意象詞空間的詞匯具有語(yǔ)義離散性,即各自具備一定的代表性,基于語(yǔ)義層面對(duì)高頻關(guān)鍵形容詞進(jìn)行篩選,計(jì)算上述9個(gè)高頻詞匯之間的語(yǔ)義關(guān)聯(lián)。運(yùn)用2.2節(jié)訓(xùn)練好的word2vec模型進(jìn)行詞匯間余弦相似度的計(jì)算,不同詞匯間余弦相似度的范圍在–0.113 9~0.450 702,如圖3所示,說(shuō)明該9個(gè)詞匯各自具備一定的代表性,可將其作為代表性意象詞空間。
圖2 關(guān)鍵形容詞庫(kù)高頻詞
圖3 代表性詞匯間的余弦相似度
語(yǔ)義量化匹配是基于語(yǔ)義層面的關(guān)聯(lián)性從非結(jié)構(gòu)性評(píng)論文本到代表性詞匯的映射過(guò)程,將匹配的代表性詞匯作為大規(guī)模用戶對(duì)各車型的顯著性感性意象,從而將多樣化的用戶意象表達(dá)收斂到意象詞空間內(nèi),使樣本意象表征更加清晰,以指導(dǎo)感性意象設(shè)計(jì)決策。此外,基于語(yǔ)義相似度的量化匹配還可得到指定意象詞匯對(duì)各車型的表征程度,為研究指定意象優(yōu)化設(shè)計(jì)提供有力參考。
由于各車型具有關(guān)注度的差異,部分車型評(píng)論較少。據(jù)統(tǒng)計(jì),各車型的評(píng)論數(shù)量分布在1~6 417條范圍內(nèi)不等。為使意象挖掘具有一定的統(tǒng)計(jì)意義,刪除評(píng)論數(shù)量小于1 000條的車型,最終得到74個(gè)車型和149 434條評(píng)論,篩選后的評(píng)論數(shù)量分布如圖4所示。
首先,基于構(gòu)建好的word2vec詞向量模型確定單評(píng)論對(duì)意象詞空間各詞匯的情感傾向及量化匹配值,形成單評(píng)論語(yǔ)料對(duì)代表性詞匯的量化映射關(guān)系。
以“奧迪A4L”車型為例,選取其中兩條真實(shí)評(píng)論“外觀當(dāng)然是最漂亮,尤其從正面看!”“線條獨(dú)特,整臺(tái)車貫穿著優(yōu)美感覺(jué)?!边M(jìn)行關(guān)鍵形容詞的獲取,基于式(2)和詞性標(biāo)注技術(shù)分別得到“漂亮”“優(yōu)美”的關(guān)鍵形容詞,再利用word2vec基于式(1)計(jì)算該詞匯與意象詞空間各詞匯的余弦相似度,得到單評(píng)論對(duì)意象詞空間的情感傾向及量化參數(shù),如圖5所示。
圖4 樣本評(píng)論數(shù)量分布
圖5 單評(píng)論與意象詞空間的余弦相似度
利用word2vec詞向量模型基于大規(guī)模評(píng)論文本對(duì)詞空間各詞匯的情感傾向及量化參數(shù)進(jìn)行歸納,以獲取各車型的代表性意象詞匯表征及量化匹配值。利用word2vec模型基于式(1)將同車型各條評(píng)論的關(guān)鍵形容詞分別與代表性意象詞空間進(jìn)行余弦相似度計(jì)算,得到余弦相似度矩陣,再對(duì)每個(gè)代表性意象詞匯下的余弦相似度進(jìn)行累加和平均等操作,其結(jié)果作為該車型所有評(píng)論對(duì)9個(gè)代表性詞匯各自的量化匹配值,匹配度最高的作為該車型在意象詞空間中的最大量化表征,從而實(shí)現(xiàn)大規(guī)模非結(jié)構(gòu)化評(píng)論文本信息到意象詞空間的量化匹配映射。
同樣,以“奧迪A4L”車型為例,對(duì)該車型3 563條評(píng)論的關(guān)鍵形容詞與意象詞空間基于式(1)進(jìn)行余弦相似度計(jì)算并匯總,得到余弦相似度矩陣如表2所示,由表2可知,“奧迪A4L”的語(yǔ)義量化最大匹配意象詞為“漂亮的”,其次為“緊湊的”,最小匹配意象詞為“硬朗的”。
表2 “奧迪A4L”大規(guī)模關(guān)鍵形容詞與意象詞空間余弦相似度矩陣
Tab.2 Cosine similarity matrix of "Audi A4L" large-scale key adjectives and image word space
以車型庫(kù)任意四款車型為例,意象量化匹配最大最小值結(jié)果示例如表3所示,對(duì)應(yīng)車型樣本如圖6所示。
表3 意象匹配最大最小值結(jié)果示例
Tab.3 Example of max-min image matching results
圖6 車型樣本示例
同理,樣本庫(kù)74個(gè)車型的意象量化匹配結(jié)果分布如圖7所示,最大匹配意象多聚集在“漂亮的”,最小匹配意象多聚集在“緊湊的”,該結(jié)果與意象詞空間的詞頻分布相一致,同時(shí)也表明了“緊湊的”不是用戶期待的汽車外觀感性意象。
圖7 意象量化匹配結(jié)果分布
此外,在代表性意象量化匹配過(guò)程中,意象詞空間各詞匯與每個(gè)車型均具有一定的匹配關(guān)系,可獲取詞空間中各代表性意象詞匯表征程度的最大最小值車型,以便于后續(xù)為指定意象目標(biāo)的優(yōu)化設(shè)計(jì)提供分析參考。以“緊湊”“硬朗”“流暢”三個(gè)代表性詞匯為例,在74個(gè)車型中的意象量化程度分布示例如圖8所示。
其中,“緊湊”程度最高和最低的車型分別為15號(hào)樣本“奧迪A4L”和69號(hào)樣本“雷凌”,“硬朗”程度最高和最低的車型分別為65號(hào)樣本“長(zhǎng)安CS75”和35號(hào)樣本“本田CR-V”,“流暢”程度最高和最低的車型分別為12號(hào)樣本“天籟”和30號(hào)樣本“明銳”。
圖8 意象程度的分布示例
詞空間各個(gè)代表性詞匯的最高和最低匹配程度的車型如表4所示。
表4 詞空間的最大最小值車型
Tab.4 Automobile models of max-min word space
為驗(yàn)證方法的有效性,對(duì)語(yǔ)義量化匹配的意象結(jié)果進(jìn)行實(shí)驗(yàn)驗(yàn)證。上文獲取到74個(gè)車型的顯著性意象,從中隨機(jī)抽取12個(gè)樣本進(jìn)行基于人工評(píng)價(jià)的感性意象實(shí)驗(yàn),被試者通過(guò)觀察樣本圖片對(duì)意象詞空間的9個(gè)代表性詞匯分別按照五點(diǎn)Likert量表進(jìn)行程度評(píng)價(jià),共108道題。該實(shí)驗(yàn)通過(guò)在線網(wǎng)絡(luò)問(wèn)卷形式進(jìn)行調(diào)研,被試者的招募面向普通消費(fèi)者,不區(qū)分與設(shè)計(jì)相關(guān)的專業(yè)與非專業(yè)人士,共回收有效問(wèn)卷103份問(wèn)卷,克隆巴赫信度系數(shù)為0.992,表示該實(shí)驗(yàn)的信度非常好。意象量化匹配與感性意象實(shí)驗(yàn)結(jié)果擬合對(duì)比如圖9所示。
圖9 結(jié)果擬合對(duì)比
為驗(yàn)證感性意象實(shí)驗(yàn)和量化匹配意象挖掘結(jié)果的一致性,采用配對(duì)樣本檢驗(yàn)的方式驗(yàn)證兩組數(shù)據(jù)的相關(guān)性和差異性。首先,對(duì)兩組數(shù)據(jù)進(jìn)行歸一化處理,統(tǒng)一將其映射到[0,1]區(qū)間內(nèi),共108個(gè)意象詞的評(píng)分對(duì)比結(jié)果如圖7所示;其次,將數(shù)據(jù)導(dǎo)入SPSS進(jìn)行配對(duì)樣本檢驗(yàn),結(jié)果顯示,從配對(duì)樣本相關(guān)性來(lái)看,二者的皮爾遜相關(guān)系數(shù)是0.725,顯著性= 0.000<0.05,說(shuō)明兩組數(shù)據(jù)變化情況一致,其相關(guān)性有統(tǒng)計(jì)學(xué)意義,證明兩者數(shù)據(jù)具有高度相關(guān)性;從配對(duì)樣本檢驗(yàn)表來(lái)看,兩者顯著性=0.150>0.05,證明二者無(wú)顯著性差異。綜上表明該方法是可行的。
本文以汽車外觀作為研究載體,以網(wǎng)絡(luò)評(píng)論作為感性意象文本挖掘素材來(lái)源,運(yùn)用語(yǔ)義量化匹配方法將產(chǎn)品顯著性意象認(rèn)知表征出來(lái),利用現(xiàn)有信息實(shí)現(xiàn)了用戶對(duì)汽車外觀感性意象內(nèi)隱知識(shí)的快速獲取,為研究意象激發(fā)特征以及感性設(shè)計(jì)決策提供了有力參考;明確了產(chǎn)品對(duì)指定意象詞匯的表征程度,得到了指定意象詞最顯著的車型,以此為指定意象的感性設(shè)計(jì)提供優(yōu)化參考,從而指導(dǎo)汽車外觀感性設(shè)計(jì),為其智能化感性設(shè)計(jì)研究奠定了前期基礎(chǔ)。
對(duì)比現(xiàn)有傳統(tǒng)及文本挖掘方法的感性意象認(rèn)知研究,該方法具備以下優(yōu)勢(shì):首先,充分利用了大規(guī)模網(wǎng)絡(luò)評(píng)價(jià)數(shù)據(jù),無(wú)需進(jìn)行基于人工的感性意象實(shí)驗(yàn),消除了因小批次被試者認(rèn)知差異而可能導(dǎo)致的意象提取誤差問(wèn)題;其次,利用現(xiàn)有網(wǎng)絡(luò)評(píng)價(jià)數(shù)據(jù)可節(jié)省大量人力和時(shí)間成本,并且該方法具有自動(dòng)化的特點(diǎn),從而為感性意象設(shè)計(jì)的智能化設(shè)計(jì)奠定前期基礎(chǔ)。最后,基于語(yǔ)義量化匹配的方法無(wú)需對(duì)超高維向量進(jìn)行降維和聚類,避免了因特征降維而可能導(dǎo)致的詞向量語(yǔ)義聯(lián)系的損失。
本研究仍存在下列不足之處。首先,由于大多數(shù)汽車網(wǎng)站平臺(tái)的評(píng)論限制,用戶對(duì)某一車型的評(píng)價(jià)是基于用戶已經(jīng)購(gòu)買該汽車的前提下所表達(dá)的,與傳統(tǒng)感性意象實(shí)驗(yàn)的問(wèn)卷調(diào)查或深度訪談相比,用戶不便做出不同車型間的感性意象橫向?qū)Ρ龋寡芯肯M(fèi)者對(duì)汽車外觀意象認(rèn)知的精確度受限;其次,基于大數(shù)據(jù)的感性意象認(rèn)知挖掘需要較多的用戶參與評(píng)論,對(duì)于一些相對(duì)冷門的車型用戶評(píng)論較少,不具備足夠的統(tǒng)計(jì)意義,從而其顯著性意象挖掘結(jié)果往往具有較大的不確定性。
[1] MUGGE R, SCHOORMANS J P L, SCHIFFERSTEIN H N J. Product Attachment: Design Strategies to Stimu-late the Emotional Bonding to Products[M]// Elsevier, 2008: 425-440.
[2] BOUDET H, CLARKE C, BUGDEN D, et al. "Fracking" Controversy and Communication: Using National Survey Data to Understand Public Perceptions of Hy-draulic Fracturing[J]. Energy Policy, 2014, 65: 57-67.
[3] HASSENZAHL M, PLATZ A, BURMESTER M, et al. Hedonic and Ergonomic Quality Aspects Determine a Software's Appeal[J]. Conference on Human Factors in Computing Systems - Proceedings, 2000: 201-208.
[4] KWONG C K, JIANG H M, LUO X G. AI-Based Methodology of Integrating Affective Design, Engi-neering, and Marketing for Defining Design Specifica-tions of New Products[J]. Engineering Applications of Artificial Intelligence, 2016, 47: 49-60.
[5] GUO F, LIU W L, CAO Y Q, et al. Optimization Design of a Webpage Based on Kansei Engineering[J]. Human Factors in Ergonomics & Manufacturing, 2016, 26(1): 110-126.
[6] 蘇建寧, 張秦瑋, 吳江華, 等. 產(chǎn)品多意象造型進(jìn)化設(shè)計(jì)[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2014, 20(11): 2675- 2682. SU J N, ZHANG Q W, WU J H, et al. Evolutionary De-sign of Product Multi-Image Styling[J]. Computer Inte-grated Manufacturing Systems, 2014, 20(11): 2675-2682.
[7] 傅業(yè)燾, 羅仕鑒. 面向風(fēng)格意象的產(chǎn)品族外形基因設(shè)計(jì)[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2012, 18(3): 449-457. FU Y T, LUO S J. Style Perception-Oriented Product Family Shape Gene Design[J]. Computer Integrated Manufacturing Systems, 2012, 18(3): 449-457.
[8] GUO F, WANG X S, LIU W L, et al. Affective Preference Measurement of Product Appearance Based on Event-Related Potentials[J]. Cognition, Technology & Work, 2018, 20(2): 299-308.
[9] SHI F Q, DEY N, ASHOUR A S, et al. Meta-KANSEI Modeling with Valence-Arousal fMRI Dataset of Brain[J]. Cognitive Computation, 2019, 11(2): 227-240.
[10] HSU C C, FANN S C, CHUANG M C. Relationship between Eye Fixation Patterns and Kansei Evaluation of 3D Chair Forms[J]. Displays, 2017, 50: 21-34.
[11] CHEN Y, LIN L, CHEN Z A. Research on Product Preference Image Measurement Based on the Visual Neurocognitive Mechanism[M]// Singa-pore: Springer Singapore, 2019: 873-882.
[12] LAI X J, ZHANG S, MAO N, et al. Kansei Engineering for New Energy Vehicle Exterior Design: An Internet Big Data Mining Approach[J]. Computers & Industrial Engineering, 2022, 165: 107913.
[13] 劉寶順, 陳越. 基于評(píng)論文本的產(chǎn)品意象參數(shù)化評(píng)價(jià)方法[J]. 包裝工程, 2022, 43(12): 142-148. LIU B S, CHEN Y. Parametric Evaluation Method of Product Image Based on Review Text[J]. Packaging Engineering, 2022, 43(12): 142-148.
[14] 林麗, 張?jiān)汽d, 牛亞峰, 等. 基于網(wǎng)絡(luò)評(píng)價(jià)數(shù)據(jù)的產(chǎn)品感性意象無(wú)偏差設(shè)計(jì)方法[J]. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 50(1): 26-32. LIN L, ZHANG Y K, NIU Y F, et al. Unbiased Design Method for Product Kansei Image Design Based on Network Evaluation Data[J]. Journal of Southeast Uni-versity (Natural Science Edition), 2020, 50(1): 26-32.
[15] 蒲驕子, 李延來(lái), 劉宗鑫. 基于文本挖掘與神經(jīng)網(wǎng)絡(luò)的高速列車意象造型設(shè)計(jì)[J]. 機(jī)械設(shè)計(jì), 2017, 34(9): 101-105. PU J Z, LI Y L, LIU Z X. Image Modeling Design of High-Speed Train Based on Text Mining and Neural Network[J]. Journal of Machine Design, 2017, 34(9): 101-105.
[16] 李少波, 全華鳳, 胡建軍, 等. 基于在線評(píng)論數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品感性評(píng)價(jià)方法[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2018, 24(3): 752-762. LI S B, QUAN H F, HU J J, et al. Perceptual Evaluation Method of Products Based on Online Reviews Data Driven[J]. Computer Integrated Manufacturing Systems, 2018, 24(3): 752-762.
[17] 初建杰, 王鵬超, 陳晨, 等. 基于分類器鏈的產(chǎn)品多標(biāo)簽意象識(shí)別方法[J]. 包裝工程, 2021, 42(14): 40-46. CHU J J, WANG P C, CHEN C, et al. Product Multi- Label Image Recognition Method Based on Classifier Chain[J]. Packaging Engineering, 2021, 42(14): 40-46.
[18] 朱斌. 基于深度學(xué)習(xí)的產(chǎn)品情感化智能設(shè)計(jì)[D]. 杭州: 浙江大學(xué), 2018. ZHU B. Product Emotional Intelligent Design Based on Deep Learning[D].Hangzhou: Zhejiang University, 2018.
[19] 竇金花, 覃京燕. 基于深度學(xué)習(xí)的產(chǎn)品外觀意象情感計(jì)算服務(wù)平臺(tái)研究[J]. 包裝工程, 2020, 41(6): 20-25, 31. DOU J H, QIN J Y. Affective Computing Service Platform of Product Appearance Image Based on Deep Learning[J]. Packaging Engineering, 2020, 41(6): 20-25, 31.
[20] 朱斌, 楊程, 俞春陽(yáng), 等. 基于深度學(xué)習(xí)的產(chǎn)品意象識(shí)別[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2018, 30(9): 1778-1784. ZHU B, YANG C, YU C Y, et al. Product Image Recognition Based on Deep Learning[J]. Journal of Computer-Aided Design & Computer Graphics, 2018, 30(9): 1778-1784.
[21] 林麗, 郭主恩, 陽(yáng)明慶. 面向產(chǎn)品感性意象的造型優(yōu)化設(shè)計(jì)研究現(xiàn)狀及趨勢(shì)[J]. 包裝工程, 2020, 41(2): 65-79. LIN L, GUO Z E, YANG M Q. Current Research Situation and Trend of Product Image-Based Modeling Optimization[J]. Packaging Engineering, 2020, 41(2): 65-79.
[22] 汪天雄. 在線用戶評(píng)價(jià)驅(qū)動(dòng)的產(chǎn)品形態(tài)進(jìn)化設(shè)計(jì)方法研究[D]. 上海: 華東理工大學(xué), 2021. WANG T X. Research on Product Form Evolution Design Driven by Online User Evaluation[D]. Shanghai: East China University of Science and Technology, 2021.
[23] 賀玲, 蔡益朝, 楊征. 高維數(shù)據(jù)聚類方法綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2010, 27(1): 23-26, 31. HE L, CAI Y C, YANG Z. Survey of Clustering Algorithms for High-Dimensional Data[J]. Application Research of Computers, 2010, 27(1): 23-26, 31.
[24] 胡潔. 高維數(shù)據(jù)特征降維研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2008, 25(9): 2601-2606. HU J. Survey on Feature Dimension Reduction for High-Dimensional Data[J]. Application Research of Computers, 2008, 25(9): 2601-2606.
[25] 畢達(dá)天, 邱長(zhǎng)波, 張晗. 數(shù)據(jù)降維技術(shù)研究現(xiàn)狀及其進(jìn)展[J]. 情報(bào)理論與實(shí)踐, 2013, 36(2): 125-128. BI D T, QIU C B, ZHANG H. Current Situation and Latest Development of Research on Data Dimension Reduction Technology[J]. Information Studies: Theory & Application, 2013, 36(2): 125-128.
[26] BENGIO Y, DUCHARME R, VINCENT P. A Neural Probabilistic Language Model[J]. Advances in Neural Information Processing Systems. 2000, 13(3): 1137-1155.
[27] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient Estimation of Word Representations in Vector Space [EB/OL]. 2013: arXiv: 1301.3781. https://arxiv.org/abs/ 1301.3781.pdf
[28] 奚雪峰, 周國(guó)棟. 面向自然語(yǔ)言處理的深度學(xué)習(xí)研究[J]. 自動(dòng)化學(xué)報(bào), 2016, 42(10): 1445-1465. XI X F, ZHOU G D. A Survey on Deep Learning for Natural Language Processing[J]. Acta Automatica Sinica, 2016, 42(10): 1445-1465.
[29] SALTON G. Automatic Processing of Foreign Language Documents[J]. Journal of the American Society for Information Science, 1970, 21(3): 187-194.
[30] SALTON G, YU C T. On the Construction of Effective Vocabularies for Information Retrieval[J]. ACM SIGPLAN Notices, 1975, 10(1): 48-60.
Mining of Salient Image of Automobile Appearance Based on Semantic Quantification Matching
LIU Baoqi, LIN Li*, GUO Zhuen
(College of Mechanical Engineering, Guizhou University, Guiyang 550025, China)
The work aims to solve the problems of time-consuming image experiments and accidental small samples in traditional perceptual design research by extracting user image cognition based on existing network evaluation text information. Firstly, a large number of automobile appearance comment texts were crawled to construct a semantic analysis vocabulary library and a word2vec word vector model. Then, based on the model, the semantic connections within the word library were obtained to calculate the semantic discreteness between high-frequency key adjectives to construct a representative image word space. Finally, through semantic quantification matching, the comments were mapped to the image word space to obtain significant image representations of various automobile models from a large number of users, and the matching results of automobile appearance under specified image words were clarified. The application of this method to mine significant automobile appearance images showed no significant difference compared with experimental results based on manual evaluation, and had high correlation, demonstrating the effectiveness of this method. This method is used to explore user image cognition through a large number of user feedback knowledge, which improves the efficiency of image analysis, helps decision makers quickly understand consumers' perceptual knowledge of automobile appearance, and can make products more in line with market expectations during the design iteration. Compared with related research, the method based on semantic quantification matching does not need to reduce the dimensionality and clustering of high-dimensional vectors, which eliminates the loss of semantic connections between word vectors that may be caused by feature reduction in previous studies, so as to obtain more accurate results of image mining.
semantic quantification matching; automobile appearance; affective image; online reviews; text mining
TB472
A
1001-3563(2024)02-0110-08
10.19554/j.cnki.1001-3563.2024.02.011
2023-08-13
國(guó)家自然科學(xué)基金項(xiàng)目(51865003);貴州省科技廳項(xiàng)目(黔科合平臺(tái)人才[2018]5781);貴州省科技計(jì)劃項(xiàng)目(黔科合基礎(chǔ)-ZK[2021]重點(diǎn)055);貴州大學(xué)培育項(xiàng)目(貴大培育[2019]06)