陳睿,劉靜偉
(西安工程大學(xué)服裝與藝術(shù)設(shè)計學(xué)院,陜西 西安 710000)
網(wǎng)絡(luò)游戲又稱為電子游戲,游戲服裝直觀地展示了游戲角色的性格特征、游戲世界的設(shè)定以及游戲文化的傳達(dá)[1],也是游戲玩家構(gòu)建自我形象,實現(xiàn)身份認(rèn)同的重要道具[2],同時給游戲帶來了可觀的經(jīng)濟價值[3]。
數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中提取有價值的信息和知識,通過數(shù)據(jù)挖掘技術(shù),可以發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系和規(guī)律[4]。通過語料庫及自然語言處理工具進(jìn)行數(shù)據(jù)挖掘的相關(guān)研究,已基于語料庫數(shù)據(jù),分析了服裝色彩情感核心語義特征[5]、“潮”文化的文化特征[6]、絲綢文化情感特征與構(gòu)成[7]、服裝品牌知識集群等[8]。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于對網(wǎng)絡(luò)游戲服裝的研究現(xiàn)狀及研究熱點的挖掘,可以進(jìn)一步分析網(wǎng)絡(luò)游戲服裝研究進(jìn)展,為網(wǎng)絡(luò)游戲服裝的研究提供參考。
網(wǎng)絡(luò)游戲服裝研究現(xiàn)狀及研究熱點挖掘的第一步是建立網(wǎng)絡(luò)游戲服裝相關(guān)文獻(xiàn)的專業(yè)語料庫。在CNKI 數(shù)據(jù)庫中進(jìn)行高級檢索,檢索條件設(shè)置為:主題%=“網(wǎng)絡(luò)游戲服裝”or“網(wǎng)絡(luò)游戲服飾”or“電子游戲服裝”or“電子游戲服飾”,共檢索出網(wǎng)絡(luò)游戲服裝相關(guān)文獻(xiàn)282 篇。
我國網(wǎng)絡(luò)游戲服裝的研究起步于2000 年,起步較晚,發(fā)展較為緩慢,研究主題統(tǒng)計中,排名最高的是游戲角色設(shè)計,其次是與傳統(tǒng)文化、文化傳播、服裝設(shè)計等。
為了對網(wǎng)絡(luò)游戲服裝的相關(guān)文獻(xiàn)進(jìn)行進(jìn)一步的詳細(xì)分析,經(jīng)過人工篩選,剔除文獻(xiàn)核心與網(wǎng)絡(luò)游戲服裝關(guān)聯(lián)不夠緊密的文獻(xiàn),最終選擇其中的86 篇與網(wǎng)絡(luò)游戲服裝關(guān)聯(lián)度高的文獻(xiàn)構(gòu)建網(wǎng)絡(luò)游戲服裝專業(yè)語料庫。
KH coder 是一個計量文本數(shù)據(jù)挖掘軟件,用于處理和分析文本數(shù)據(jù),該軟件有詞頻分析、共現(xiàn)分析、相關(guān)性分析、聚類分析等功能,并將分析結(jié)果進(jìn)行可視化展示,適用于非結(jié)構(gòu)化文本的分析[9]。
為分析結(jié)果更加精確,首先進(jìn)行新詞詞表和停用詞表的設(shè)置。語料庫中部分詞匯屬于行業(yè)專有詞匯,需進(jìn)行新詞設(shè)置,才可被作為一個完整的詞語識別,從而進(jìn)行分析。例如“網(wǎng)絡(luò)游戲”,如不進(jìn)行新詞設(shè)置,軟件會把“網(wǎng)絡(luò)游戲”這個詞語分割成為單獨的兩個詞語:“網(wǎng)絡(luò)”和“游戲”進(jìn)行分析。通過反復(fù)試驗,共設(shè)置新詞306 個,例如:虛擬時尚、武俠小說、忍者服、插肩袖、卷草紋等。
為排除一些出現(xiàn)頻率高,但對分析結(jié)果無用的干擾詞匯,設(shè)定停用詞表,參考百度的常用中文停用詞表,最終設(shè)置停用詞2 101 個。
在完成新詞詞表及停用詞詞表的設(shè)置后,對網(wǎng)絡(luò)游戲服裝語料庫進(jìn)行分詞和詞性標(biāo)注,將詞語分為名詞(Noun)、專有名詞(ProperNoun)、新詞詞表詞語(TAG)、形容詞(Adj、JJ)、副詞(Adv)、動詞(Verb)。
層次聚類是一種常用的聚類分析方法,用于將一組樣本或數(shù)據(jù)點劃分為不同的群組或類別。通過計算每一個類別的數(shù)據(jù)點與所有數(shù)據(jù)點之間的距離來確定它們之間的相似性,距離越小,相似度越高,并將距離最近的兩個數(shù)據(jù)點或類別進(jìn)行組合,構(gòu)建聚類層次結(jié)構(gòu)[10]。
圖1 是網(wǎng)絡(luò)游戲服裝語料庫層次聚類的結(jié)果,共七個聚類,左側(cè)的柱狀圖反映詞頻的高低。
圖1 層次聚類分析圖Fig.1 Hierarchical cluster analysis diagram
由聚類A 可見,網(wǎng)絡(luò)游戲服裝與民族、傳統(tǒng)文化相關(guān)的符號學(xué)研究;由聚類B 可見,網(wǎng)絡(luò)游戲服裝的設(shè)計與角色的塑造密不可分,且聚類B 的詞頻明顯高于其他聚類,可見網(wǎng)絡(luò)游戲服裝設(shè)計和角色塑造相關(guān)的研究占比較大;聚類C 可見網(wǎng)絡(luò)游戲服裝的藝術(shù)表現(xiàn)形式與角色的人物造型有關(guān);聚類D 可見未來主義風(fēng)格相關(guān)游戲服裝的占比較大;聚類E 可見,網(wǎng)絡(luò)游戲服裝的設(shè)計元素,例如色彩、紋樣等與審美以及歷史背景相關(guān);聚類F 可見,網(wǎng)絡(luò)游戲服裝與玩家的虛擬形象相關(guān)聯(lián);聚類G 可見,游戲服裝的發(fā)展與玩家心理及虛擬社會中的社交活動相關(guān)。
KWIC(keyword in context)檢索即上下文關(guān)鍵詞檢索,通過對檢索詞左側(cè)右側(cè)的上下文適當(dāng)距離的詞匯進(jìn)行篩選及統(tǒng)計,探索與檢索詞一定距離內(nèi)的高度關(guān)聯(lián)詞。
表1 是與網(wǎng)絡(luò)游戲服裝風(fēng)格密切相關(guān)的詞匯集群。Jaccard系數(shù)越高,則表明該詞語在文本中權(quán)重越大。根據(jù)Jaccard 系數(shù)和詞頻判斷,在相關(guān)研究中,網(wǎng)絡(luò)游戲服裝風(fēng)格主要有:未來主義、古典、奇幻、浪漫、傳統(tǒng)等。
表1 “風(fēng)格”KWIC 檢索結(jié)果統(tǒng)計表(部分)Tab.1 "Style"KWIC search results statistic al table(Part)
多維尺度分析是根據(jù)具有多重維度的樣本或變量之間的相似性或非相似性來對其進(jìn)行分類的一種統(tǒng)計學(xué)研究方法,其中相似性越高,氣泡之間的距離就會越近。選用二維分析,橫豎坐標(biāo)分別對應(yīng)不同的維度,氣泡大小對應(yīng)該詞出現(xiàn)頻率的高低,不同顏色的氣泡則對應(yīng)不同的聚類。
圖2 是網(wǎng)絡(luò)游戲服裝語料庫數(shù)據(jù)選取形容詞進(jìn)行的多維尺度分析結(jié)果,展示了不同維度下形容詞之間的相關(guān)性。表2 是從形容詞中提取和網(wǎng)絡(luò)游戲服裝最為密切相關(guān)的美感類形容詞,并進(jìn)行了五個不同的子集劃分。
表2 美感形容詞分類子集(部分)Tab.2 Classification Subsets(part)ofaesthetic adjectives
圖2 形容詞多維尺度分析圖Fig.2 Adjective multidimensional scale analysis diagram
圖3 是動詞多維尺度分析結(jié)果,將聚類中的動詞按照關(guān)聯(lián)角色進(jìn)行分類,得到表3 所示的五個子集,分別與設(shè)計研發(fā)人員、運營人員、游戲玩家、研究人員相關(guān)聯(lián)。
表3 動詞分類子集(部分)Tab.3 Verb Classification Subsets(parts)
圖3 動詞多維尺度分析圖Fig.3 verbs Multidimensional scale analysis diagram
網(wǎng)絡(luò)游戲服裝在我國研究起步較晚,主要有文化、造型藝術(shù)、符號學(xué)、心理學(xué)等相關(guān)研究。文章通過對CNKI 數(shù)據(jù)庫內(nèi)網(wǎng)絡(luò)游戲服裝相關(guān)文獻(xiàn)進(jìn)行篩選后建立語料庫,并用文本挖掘工具對語料庫進(jìn)行數(shù)據(jù)分析,挖掘網(wǎng)絡(luò)游戲服裝的研究內(nèi)容和研究熱點。結(jié)果表明,運用語料庫分析法對網(wǎng)絡(luò)游戲服裝相關(guān)文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘及知識抽取具有可行性,實驗結(jié)果對網(wǎng)絡(luò)游戲服裝相關(guān)領(lǐng)域的研究和應(yīng)用具有一定的參考價值。