劉征宏,潘偉杰,呂 健,林 麗
(貴州大學 a.現(xiàn)代制造技術教育部重點實驗室;b.機械工程學院,貴陽 550025)
?
基于因子分析和聚類分析的情感維度提取*
劉征宏a,潘偉杰a,呂健a,林麗b
(貴州大學 a.現(xiàn)代制造技術教育部重點實驗室;b.機械工程學院,貴陽550025)
摘要:為從大量用戶情感維度(感性詞對)中提取少量具有代表性情感維度(感性詞對),文章提出結合因子分析(factor analysis, FA)和聚類分析(cluster analysis, CA)的情感維度提取方法。首先通過語義差分(semantic differential, SD)實驗獲取用戶對少量具有代表性樣品的情感認知;然后使用FA對SD結果進行分析,獲得初始情感維度的潛在因子及因子載荷矩陣;最后根據(jù)FA結果進行聚類分析,對初始情感維度到每個聚類幾何中心的距離進行排序,距離最近的感性詞對即為所提取的情感維度。以數(shù)控機床造型設計為研究案例,對該方法進行描述,結果表明,該方法能有效提取情感維度,并保留了初始情感維度的整體結構。
關鍵詞:因子分析;聚類分析;情感維度;感性詞對
0引言
產(chǎn)品造型是決定消費者購買的最重要因素之一,因此對消費者主觀認知也就是用戶感性需求的研究是產(chǎn)品設計領域研究的熱點與重點。只有獲取用戶真實的情感意象,設計師才能將其賦予在產(chǎn)品的結構、形態(tài)、材質、色彩上,從而滿足用戶的感性需求。
感性工學(kansei engineering, KE)將用戶感性需求進行定量化描述,通過構建用戶感性需求和產(chǎn)品造型的關系指導設計師進行產(chǎn)品設計,日本著名學者Nagamachi[1]將感性工學分為以下幾個主要步驟:①選擇樣品;②收集初始情感維度;③提取代表性情感維度;④對產(chǎn)品進行形態(tài)分析;⑤用戶感性評估;⑥利用智能計算技術(如神經(jīng)網(wǎng)絡、遺傳算法、模糊邏輯等)探索用戶偏好與設計元素之間的關系;⑦構建感性工學推論模型或專家系統(tǒng),進行新產(chǎn)品設計或開發(fā)。無論是國外還是國內的研究都是集中在步驟⑥、⑦[2-5],而在步驟③提取代表性情感維度的研究非常少,其中具有代表性的有:Huang等人[6]結合設計結構矩陣對感性詞進行聚類分析,首先將初始情感維度分成少量子集,然后計算子集之間的相關系數(shù),再合并完全相關的子集,最終得到聚類結果;Wang等人[7]結合模糊層次分析法和模糊kano模型對用戶感性需求進行了分析;Shi等人[8]運用粗糙集、關聯(lián)規(guī)則對感性需求知識進行了挖掘。這些方法雖然都具有創(chuàng)新性,但沒有對用戶情感維度進行篩選,因此在處理用戶情感維度時會造型信息冗余,從而導致計算量過大且結果不準確。
KE中的每一步都至關重要,而前期用戶感性需求的獲取更是整個KE模型構建成功的關鍵。FA作為特征提取工具是最常用的分析SD數(shù)據(jù)的方法,然而,F(xiàn)A并沒有提供選擇代表性感性維度的直接標準。因此本文通過FA結合CA對用戶初始情感維度進行定量化處理,首先通過SD實驗獲得SD數(shù)據(jù),然后對SD數(shù)據(jù)進行因子分析獲得因子載荷矩陣,最后通過聚類分析獲得代表性情感維度。實驗結果表明該方法能很好地保留初始情感維度的完整性,即本方法所提取的情感維度包含了初始情感維度的所有信息。
1SD數(shù)據(jù)獲取
1.1具有代表性的設計樣品提取
從市場上選擇不同款式的產(chǎn)品或者三維模型作為樣品,然后排除那些特定用途或造型奇特的產(chǎn)品。為了減少受測者的心理負荷和簡化實驗過程,邀請設計專家組對剩下的樣品使用KJ方法[9]進行分組。為了方便,使用樣品照片進行操作,照片須表現(xiàn)產(chǎn)品的三維造型特征,每個測試者須具有從照片識別產(chǎn)品三維造型特征的能力。使用KJ法使所有的樣品被分成合適的聚類群組。然后根據(jù)獲得的分組結果構建相似度矩陣,再進行多維尺度分析(multidimensional scaling, MDS),通過應力系數(shù)確定維數(shù),應力系數(shù)越小,擬合越好(一般小于0.05)。然后對MDS結果進行聚類分析,獲得聚類樹圖。最后使用k-均值聚類法從分別從每個群組中選擇一個代表性樣品,本方法計算每個樣品到其所屬組幾何中心的距離,距離最小的樣品為這組的代表樣品。
1.2準備最初的情感維度
在KE中,通常使用SD進行情感評估實驗從而得到用戶對產(chǎn)品的心理情感[10]。在人體工程學和心理學評估中通常使用意象或感性詞匯對來描述用戶對產(chǎn)品的情感[11]。因此,為了描述用戶對產(chǎn)品的情感,需要收集大量的感性詞,其步驟如下:
Step1:從雜志、產(chǎn)品目錄、報紙等收集大量的感性詞對,首先收集了超過100個感性詞對來描述該產(chǎn)品。
Step2:通過專家組兩輪的討論,合并相近的感性詞對選擇其中更合適的,然后得到30組左右的感性詞對。
1.3SD評估實驗
為了獲得關于產(chǎn)品造型設計的SD數(shù)據(jù),讓受測者對所提取的樣品在5分量表下使用初始感性詞進行評估。然后計算所有人對每個樣品的感性評價平均值獲得最終評價值。為了更有效收集評估數(shù)據(jù),設計了一個友好的評估交互界面,如圖1所示,使調查者的評估數(shù)據(jù)直接記錄下來,簡化了后續(xù)的處理過程。
圖1 感性評估界面
2對初始情感維度進行因子分析
在傳統(tǒng)SD研究中,根據(jù)個人、概念、尺度三種模式對用戶響應進行分類。相似地,在KE研究中,SD實驗結果可表示為三維數(shù)據(jù)矩陣m×n×r,其中m表示消費者數(shù)量(個人),n表示評估的產(chǎn)品樣品數(shù)量(概念),r表示形容詞數(shù)量(規(guī)模)。因為每個消費者評估相同的產(chǎn)品樣品,所以本文只考慮n×r的二維數(shù)據(jù)矩陣,這個二維數(shù)據(jù)矩陣表示m個消費者的n×r矩陣的平均值。Coxhead等[12]指出為了對SD數(shù)據(jù)進行因子分析,概念和尺度必須盡可能數(shù)量多且種類多,因此,產(chǎn)品樣品和最初情感維度的選擇應該遵循這個原則。FA在SD數(shù)據(jù)中的應用是為了獲取輸入情感維度的潛在因子和因子載荷。因子載荷用于確定情感維度對潛在因子的影響程度。為了構建新的意象認知系統(tǒng),須對提取的因子進行命名,并指定合適的意義。比如,Osgood[10]提出了三個著名的內涵維度,即評價(Evaluation)、潛在(Potency)、活動(Activity)(EPA),能解釋廣泛的尺度和概念,并且被頻繁使用。Hsiao等[13]根據(jù)三個不同的目錄從SD實驗中提取了四個基本的情感維度,即趨勢、情感、復雜、效能。
每一個情感維度可用少數(shù)潛在因子的線性組合加上每個情感維度的特殊因子表示。因子分析模型描述如下:
y1=λ11X1+…+λ1nXn+θ1
y2=λ21X1+…+λ2nXn+θ2
……………
ym=λm1X1+…+λmnXn+θm
(1)
在公式(1)中,n為潛在因子數(shù)量,通常小于m。X1,…,Xp為潛在因子。λij為Xj的相關系數(shù),也就是第i個潛在因子的載荷,因子載荷用于解釋情感維度對潛在因子的依賴程度。θ1,…,θp為每個相關情感維度的特殊因子。因子載荷結果λij構成因子載荷矩陣L如下:
(2)
在SPSS中使用FA對實驗獲得的SD數(shù)據(jù)進行分析。FA使用的一個關鍵問題是必須確定因子數(shù)量。載荷因子數(shù)量不同對所選擇的情感維度影響也不同。選擇主成分分析(principal components analysis, PCA)中的最大方差正交旋轉法來測試因子數(shù)量從3到7的變化。通常根據(jù)所提因子的特征值和方差百分比確定因子數(shù)量,首先保留特征值大于1的提取因子,然后,根據(jù)所有因子的累積方差百分比選擇合適的因子數(shù)。一般來說,所選因子數(shù)應該包括總方差的60%以上[14]。
在同一個因子下正載荷因子和負因子載荷的混合可能會造成主成分分析的解釋問題并影響潛在因子的命名。為了簡化感性詞選擇過程,必須對FA結果進行調整,因此,如果感性詞主成分中具有負載荷因子,那么將其方向改變,不改變其因子載荷值。感性詞主成分是指所有因子中載荷絕對值最高的。這種調整既保證了感性詞方向的一致性,使它更符合人們的認知,又減少了感性詞在因子空間分布的復雜性。
3對因子載荷進行聚類分析
通過FA獲得了因子載荷矩陣,但FA并沒有提供選擇代表性感性維度的直接標準,一個簡單直觀的提取具有代表性感性詞的方法是選擇每個因子中因子載荷絕對值較高的,然而這個方法既忽略了感性詞的全局結構,又忽略了其局部關系,因為被選中的感性詞都是位于每個因子軸的極端。因此,為了提取代表性感性詞對并盡可能保證其結構完整,須對FA結果進行聚類分析。
使用結合層次和非層次聚類方法的兩階段聚類分析FA結果。盡管聚類分析可使用很多算法如k-均值聚類、自組織地圖、模糊聚類等,但都沒有提供直接確定聚類數(shù)量的方法。為了確定合適的聚類數(shù)量,使用層次聚類和離差平方和法(ward法)。然后根據(jù)情感維度的因子載荷,使用標準k-均值聚類法構建同質群組。選擇每個聚類中最接近中心位置的感性詞對作為具有代表性的情感維度,因此,具有代表性的感性詞對數(shù)量等于聚類數(shù)量,且由層次聚類決定。
4實例研究
以某企業(yè)某類型數(shù)控機床造型設計為研究實例,對本文所提方法進行驗證。
4.1選擇代表性樣品
首先收集100多個數(shù)控機床樣品,通過初步評估刪除相似的和不適合的樣本,然后邀請5個具有5年以上設計經(jīng)驗的專業(yè)設計師進行KJ方法實驗,最終剩下40個設計樣品被分成6組。為了確定最合適的維數(shù),使用MDS將維數(shù)設置2-10,分別求其應力系數(shù),當維數(shù)=6時,應力系數(shù)=0.03572為最小,故確定維數(shù)為6?;贛DS結果的40個數(shù)控機床產(chǎn)品Ward聚類樹圖如圖2所示。為了選擇每個聚類中最具代表性樣品,進行K-means聚類,結果如表1所示。表1顯示樣品26 、23、38、27、5、6分別為每群組中最具代表性樣品(加粗行)。
圖2 40個數(shù)控機床產(chǎn)品的聚類樹圖
聚類樣品距離聚類樣品距離1260.9454270.943361.136251.032291.155301.109311.533331.150371.572550.844402.04180.9912231.015131.059161.03131.313171.054101.330351.62041.6063380.885111.690280.88991.794191.047660.793341.15020.795……71.449
4.2準備初始情感維度
經(jīng)過初步篩選獲得如表2所示的初始情感維度。
表2 初始情感維度
4.3因子分析結果
首先通過圖1所示界面進行SD實驗,然后根據(jù)前文所描述方法對SD結果進行因子分析,使用三個因子的因子載荷結果如表4所示。結果顯示,提取的三個因子解釋方差分別為72.4%、13.42%、7.6%,因子1的方差百分比超過了50%,總的累計方差百分比為93.76%,表明使用三個因子的FA結果是非??尚诺?。
使用Osgood提出的EPA三因子結構[14],根據(jù)感性詞的解釋能力對FA結果進行檢驗。日本學者在相關研究中,確定了一系列色彩意象詞匯如色彩的美/丑、雅/俗等屬于色彩的評價因子;色彩的動/靜、明/暗、引人注目/不引人注目等屬于色彩的活動因子;而色的強/弱、輕/重、男性化/女性化等則是色彩的潛在因子。借助此方法獲得如表3所示的結果,因子1中有7個評價因子、2個潛在因子,其中感性詞1既屬于評價因子又屬于潛在因子;因子2中2個評價因子、2個潛在因子、3個活動因子;因子3中有2個潛在因子。因此,總的來說,本文提取的三個因子具有典型的EPA三因子結構,使用這三個因子的因子載荷提取具有代表性感性詞是可靠的。
表3 22組感性詞對的因子分析結果
4.4聚類分析結果
對初始情感維度因子載荷進行聚類分析,首先使用層次聚類的Ward連接方法確定聚類數(shù)量為4,然后使用K-means聚類把感性詞分成4個聚類,使用平方歐式距離計算每個聚類的幾何中心,并獲得感性詞與聚類中心的距離,結果如表4所示,結果顯示,與每個聚類幾何中心距離最小的分別是感性詞22、19、17、4。圖3更加直觀地顯示聚類分析結果,圖3a為因子1-因子2空間的感性詞聚類,圖3b為因子2-因子3空間的感性詞聚類,其中,○代表感性詞,實心○為離聚類幾何中心最近感性詞,+代表每個聚類的幾何中心。最終提取的四個情感維度分別為獨特-大眾(A)、簡潔-復雜(E)、人性-機械(N/A)、硬朗-柔軟(P),包含了EPA三因子的完整結構,為感性工學的下一步操作提供了可靠的基礎。
表4 感性詞對到每個聚類幾何中心的距離
圖3 Factor1-Factor2空間及Factor2-Factor3空間的
5結論
實驗表明此方法能有效提取代表性情感維度,并保證了初始情感維度的完整性,為感性工學的下一步處理提供了可靠的基礎。然而,如果聚類結果中同時存在兩個或兩個以上感性詞到聚類中心距離相同或相近時,就很難確定此聚類的代表性感性詞,因此,如何解決此問題是下一步研究的方向之一。另外,擴展本方法的應用對象也是下一步研究的重要方向。
[參考文獻]
[1] Nagamachi M. Kansei engineering as a powerful consumer-oriented technology for product development[J]. Applied Ergonomics, 2002, 33 (3): 289-294.
[2] 石夫乾, 孫守遷, 徐江. 產(chǎn)品感性評價系統(tǒng)的模糊D-S推理建模方法與應用[J]. 計算機輔助設計與圖形學學報, 2008, 20(3): 361-365.
[3] 傅業(yè)燾, 羅仕鑒. 面向風格意象的產(chǎn)品族外形基因設計[J]. 計算機集成制造系統(tǒng), 2012, 18(3): 449-457.
[4] 蘇建寧, 范躍飛, 張書濤,等. 基于感性工學和神經(jīng)網(wǎng)絡的產(chǎn)品造型設計[J]. 蘭州理工大學學報, 2011, 37(4): 47-50.
[5] 蘇建寧,王瑞紅,趙慧娟,等. 基于感性意象的產(chǎn)品造型優(yōu)化設計[J]. 工程設計學報,2015,22(1):35-41.
[6] Huang Y, C Chen,L P Khoo. Kansei clustering for emotional design using a combined design structure matrix[J]. International Journal of Industrial Ergonomics, 2012, 42(5): 416-427.
[7] Wang C,J Wang. Combining fuzzy AHP and fuzzy Kano to optimize product varieties for smart cameras: A zero-one integer programming perspective[J]. Applied Soft Computing, 2014, 22: 410-416.
[8] Shi F, S Sun,J Xu. Employing rough sets and association rule mining in KANSEI knowledge extraction[J]. Information Sciences, 2012,196: 118-128.
[9] Kawakita J. KJ Method[M]. Tokyo:Chuokoron-Sha, 1986.
[10] Osgood C E,SuciCJ. The measurement of meaning[M]. Urbana: University of Illinois Press, 1957.
[11] Nagamachi M. Kansei Engineering: a new ergonomics consumeroriented technology for product development[J].International Journal of Industrial Ergonomics, 1995, 15: 3-10.
[12] Coxhead P, Bynner J M. Factor analysis of semantic differential data[J]. Quality & Quantity, 1981,15: 553-567.
[13] Hsiao K A, Chen L L .Fundamental dimensions of affective responses to product shapes[J]. International Journal of Industrial Ergonomics, 2006, 36: 553-564.
[14] Kim J O, Mueller C W . Factor Analysis: Statistical Methods and Practical Issues[M]. Sage Publication, Newbury Park, 1978.
(編輯李秀敏)
Affective Dimensions Selection Based on Factor Analysis and Cluster Analysis
LIU Zheng-honga, PAN Wei-jiea, LV Jiana, LIN Lib
(a. Key Laboratory of Advanced Manufacturing Technology, Ministry of Education; b.School of Mechanical Engineering, Guizhou University, Guiyang 550025, China)
Abstract:To extract the representative affective dimensions from a wide range of affective dimensions, an approach for selecting the representative image word pairs based on factor analysis (FA) and cluster analysis (CA) was proposed. Firstly, consumer’s perceptions toward a small number of representative product samples were obtained using semantic differential (SD) method. Secondly, the latent factors and the factor loading matrix of the initial affective dimensions were extracted using FA according the SD results. At last, ranking the distance of the initial affective dimensions to the center of gravity of each cluster group based on the results of CA. The image word pair with the shortest distance to the centroid was selected as the representative of the cluster. Application process and procedure of the proposed method were described by a case of CNC machine tools design. The case study results revealed that the representative affective dimensions were selected effectively and the overall structure was preserved using the proposed approach.
Key words:factor analysis; cluster analysis; affective dimensions; image word pair
中圖分類號:TH166 ;TG506
文獻標識碼:A
作者簡介:劉征宏(1987—),男,湖南邵陽人,貴州大學博士研究生,研究方向為先進制造模式及制造信息系統(tǒng)、數(shù)字化設計與制造,(E-mail) zehoo_liu@163.com。
*基金項目:國家自然科學基金(51475097);國家自然科學基金(51465007);國家科技支撐計劃(2014BAH05F01);貴州省科技計劃(黔科合Z字[2013]4005,黔科合J字[2013]2108,黔科合LH字[2014]7644);黔發(fā)改投資([2012]2484);貴州大學基金項目(貴大人基合字[2012]009)
收稿日期:2015-12-03;修回日期:2015-12-08
文章編號:1001-2265(2016)03-0004-05
DOI:10.13462/j.cnki.mmtamt.2016.03.002