林文廣 劉曉東 肖人彬
摘要:借助大數(shù)據(jù)挖掘技術(shù),提出基于主語-謂語-賓語(SAO)的專利數(shù)據(jù)驅(qū)動產(chǎn)品創(chuàng)新設(shè)計方法。首先通過語義依存句法挖掘?qū)@谋緮?shù)據(jù)庫中的SAO結(jié)構(gòu),獲取產(chǎn)品元件之間的作用關(guān)系信息;其次構(gòu)建面向產(chǎn)品系統(tǒng)的復(fù)雜網(wǎng)絡(luò)知識模型,并引入結(jié)構(gòu)洞理論計算復(fù)雜網(wǎng)絡(luò)中元件約束性系數(shù),以此確定創(chuàng)新目標(biāo)元件,并借助Word2Vec計算元件語義相似性系數(shù),利用SAO相似性算法計算功能相似性系數(shù);在此基礎(chǔ)上,融合推薦算法以及組合矩陣,分別圍繞結(jié)構(gòu)創(chuàng)新、功能創(chuàng)新以及功能優(yōu)化三個方面實現(xiàn)產(chǎn)品創(chuàng)新。最后以具有典型代表性的衛(wèi)浴花灑產(chǎn)品為例,對所提方法進(jìn)行了詳細(xì)的演示,充分證實了所提方法的有效性和先進(jìn)性。
關(guān)鍵詞:專利數(shù)據(jù);主語-謂語-賓語(SAO);語言模型;復(fù)雜網(wǎng)絡(luò);推薦算法
中圖分類號:TH166;TP391
DOI:10.3969/j.issn.1004-132X.2023.15.001
Patent Data Driven Product Innovation Design Based on SAO
LIN Wenguang1 LIU Xiaodong1 XIAO Renbin2
1.Mechanical and Automotive Engineering,Xiamen University of Technology,Xiamen,F(xiàn)ujian,361024
2.School of Artificial Intelligence,Huazhong University of Science and Technology,Wuhan,430074
Abstract: The patent data-driven product innovation design method was proposed based on SAO using big data mining technology. Firstly, semantic dependency parsing was used to mine the SAO structure and interaction relationships among product components from patent text databases. Subsequently, a complex network knowledge model was constructed for product systems, and the constraint coefficients of components in the complex network were calculated by using structural hole theory to identify the innovative target components. Then, the semantic similarity coefficients of components were calculated using Word2Vec, and the functional similarity coefficients were calculated using SAO similarity algorithm. And the recommendation algorithm and combination matrix were integrated to achieve structural innovation, functional innovation, and functional optimization. Finally, a typical bathroom shower product was taken as an example to demonstrate the method in detail, which fully verifies the effectiveness and progressiveness of the method.
Key words: patent data; subject-action-object(SAO); language model; complex network; recommend scheme
0 引言
根據(jù)路甬祥院士的觀點(diǎn),設(shè)計經(jīng)歷了從傳統(tǒng)設(shè)計(設(shè)計1.0)到現(xiàn)代設(shè)計(設(shè)計2.0)再到創(chuàng)新設(shè)計(設(shè)計3.0)的進(jìn)化歷程[1]。因此,大力發(fā)展創(chuàng)新設(shè)計對建設(shè)制造強(qiáng)國至關(guān)重要。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)科學(xué)理論和數(shù)據(jù)處理技術(shù)得到了快速發(fā)展。將數(shù)據(jù)科學(xué)引入創(chuàng)新設(shè)計成為制造業(yè)信息化的一個重要趨勢,數(shù)據(jù)驅(qū)動的產(chǎn)品創(chuàng)新設(shè)計已逐漸成為人們關(guān)注的焦點(diǎn)。文獻(xiàn)[2-4]以數(shù)據(jù)驅(qū)動產(chǎn)品創(chuàng)新設(shè)計為導(dǎo)向,提出了相應(yīng)的研究框架和實施使能技術(shù),本文工作是對其所提出框架的一個技術(shù)層面的實現(xiàn)。目前數(shù)據(jù)驅(qū)動產(chǎn)品創(chuàng)新設(shè)計的具體實現(xiàn)主要分為以下4類:①基于客戶需求數(shù)據(jù);②基于歷史設(shè)計數(shù)據(jù);③基于協(xié)同類比數(shù)據(jù);④基于優(yōu)化設(shè)計數(shù)據(jù)。其中,基于客戶需求的數(shù)據(jù)挖掘方法通過挖掘用戶需求,設(shè)計符合用戶偏好的產(chǎn)品,但客戶需求較為隱晦,具有一定的挖掘難度[5];基于歷史設(shè)計數(shù)據(jù)方法,由于歷史數(shù)據(jù)多為非結(jié)構(gòu)化數(shù)據(jù),導(dǎo)致挖掘成本較高,效率較低[6];基于協(xié)同類比數(shù)據(jù)方法需要解決不同領(lǐng)域和環(huán)節(jié)數(shù)據(jù)的整合問題[7];基于優(yōu)化設(shè)計驅(qū)動方法處于發(fā)展階段,需要理清發(fā)明問題和解決辦法之間的關(guān)系[8]。上述方法各有優(yōu)缺點(diǎn),但算法效果均與數(shù)據(jù)質(zhì)量成正相關(guān),因此如何選擇結(jié)構(gòu)規(guī)范化且質(zhì)量高的數(shù)據(jù)成為提高方法準(zhǔn)確率的關(guān)鍵。
專利作為具有法律效力的文檔,是記錄發(fā)明人研發(fā)成果的主要載體。合理有效地利用專利信息有助于縮短60%的研發(fā)時間,節(jié)省40%的研發(fā)費(fèi)用[9]。專利已經(jīng)成為產(chǎn)品創(chuàng)新研究的主要數(shù)據(jù)來源。在此背景下,以專利數(shù)據(jù)為驅(qū)動對象的產(chǎn)品創(chuàng)新方法(patent data-driven product innovation design,P-D2PID)應(yīng)運(yùn)而生,由于專利中的80%以上信息都是通過文本進(jìn)行表述的,故基于專利文本驅(qū)動產(chǎn)品創(chuàng)新逐漸成為研究熱點(diǎn)[10]。邱清盈等[11]利用詞性篩選的方式從專利分類號中的文本描述信息中提取功能知識,以功能為節(jié)點(diǎn)構(gòu)建復(fù)雜網(wǎng)絡(luò)模型,結(jié)合分布位置差異提出三種創(chuàng)新策略。李少波等[12]利用術(shù)語頻率-逆文檔頻率算法(term frequency-inverse document frequency,TF-IDF)構(gòu)建專利結(jié)構(gòu)以及功能關(guān)鍵詞向量空間,并結(jié)合類比的方法獲取相似的技術(shù)方案。陳志泊等[13]利用圖排序算法提取行業(yè)專利關(guān)鍵詞,通過圖模型算法對關(guān)鍵詞進(jìn)行聚類成簇,進(jìn)而實現(xiàn)數(shù)據(jù)降維,再利用人工方式對簇給予標(biāo)注。DUFLOU等[14]通過主成分分析對專利數(shù)據(jù)庫中的特征詞類別進(jìn)行挖掘,從而系統(tǒng)地量化產(chǎn)品類別的開發(fā)狀態(tài),有助于進(jìn)一步開發(fā)感興趣的產(chǎn)品。PARK等[15]在分析專利文本時提出技術(shù)認(rèn)知診斷模型,為專利關(guān)鍵詞分析結(jié)果理解目標(biāo)技術(shù)提供了重要技術(shù)支撐。CHEN等[16]在專利文本語義基礎(chǔ)上通過深度學(xué)習(xí)提取專利實體詞匯和語義關(guān)系,從而獲取產(chǎn)品結(jié)構(gòu)化信息,保證了專利文本信息的提取精度。CHOETKIERTIKUL等[17]通過深度學(xué)習(xí)技術(shù)無監(jiān)督學(xué)習(xí)專利文本中的語義特征,結(jié)合文本相似性特征,為產(chǎn)品創(chuàng)新中的問題提供方案。此外,YOON等[18]同時引入隱含狄利克雷分布主題分析及信息熵兩種算法過濾專利中的噪聲,進(jìn)而提高專利關(guān)鍵詞提取效率。顯然,專利文本包含的巨大價值正逐步引起學(xué)術(shù)界的廣泛重視。
綜上所述,現(xiàn)有專利文本提取往往是基于概率統(tǒng)計的方法,在關(guān)鍵詞獲取方面有一定的效果,但仍存在噪聲大、價值低的問題,同時還忽略了關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系,使得在產(chǎn)品設(shè)計過程中難以對結(jié)構(gòu)之間的耦合關(guān)系進(jìn)行分析[19]。SAO作為基于文本語義的三元組信息,可以迅速獲取文本中心概念,并避免其他非必要語義的干擾,在文本語義理解、文章脈絡(luò)梳理以及關(guān)鍵字關(guān)系推導(dǎo)等方面具有明顯優(yōu)勢[20]。HE等[21]在專利文本SAO基礎(chǔ)上構(gòu)建技術(shù)路線圖,從而識別未來技術(shù)方向和行業(yè)目標(biāo),并指引研發(fā)路徑。HAN等[22]通過專利SAO詞匯及其關(guān)聯(lián)關(guān)系信息構(gòu)建關(guān)鍵詞復(fù)雜網(wǎng)絡(luò),結(jié)合鏈路預(yù)測算法對行業(yè)技術(shù)進(jìn)行預(yù)測。FENG等[23]從專利文本相關(guān)研究中的局限性入手,在現(xiàn)有SAO算法基礎(chǔ)上提出“主語-謂語-賓語-其他”的SAOx方法,旨在解決文本中一詞多義的提取難題??梢钥闯霈F(xiàn)有研究將SAO技術(shù)應(yīng)用于專利挖掘功能,但是主要設(shè)計專利信息提取和技術(shù)分析,對如何將SAO有效應(yīng)用于產(chǎn)品創(chuàng)新設(shè)計較少涉及。
本文引入面向SAO提取的專利文本信息提取方法,用以挖掘?qū)@谋局械恼Z義特征,以文本SAO為基礎(chǔ)構(gòu)筑產(chǎn)品復(fù)雜網(wǎng)絡(luò),融合結(jié)構(gòu)洞算法、語義相似性算法以及產(chǎn)品功能配置算法,并以具體產(chǎn)品為案例驗證產(chǎn)品創(chuàng)新設(shè)計方法的可行性。
1 研究方法
1.1 P-D2PID概述
P-D2PID的關(guān)鍵在于提取專利文本中的技術(shù)信息和產(chǎn)品信息 [24]。專利文本語義規(guī)范化對信息抽取具有積極影響,但如何在大量表層信息中抽取并挖掘深層知識仍然任務(wù)艱巨[25],這也是本文的主要研究內(nèi)容。本文結(jié)合專利大數(shù)據(jù)以及復(fù)雜網(wǎng)絡(luò)實現(xiàn)產(chǎn)品創(chuàng)新,通過使用依存句法獲取文本中的SAO三元組數(shù)據(jù),進(jìn)而構(gòu)建復(fù)雜網(wǎng)絡(luò),開展產(chǎn)品元件特征研究,最后結(jié)合推薦算法和功能優(yōu)化生成最終設(shè)計方案。
1.2 基于SAO的P-D2PID研究流程
依據(jù)語義-元件-功能-產(chǎn)品的自下而上設(shè)計過程,本文構(gòu)建了基于SAO的專利數(shù)據(jù)驅(qū)動產(chǎn)品創(chuàng)新設(shè)計流程,整個流程共分為四個步驟,具體框架如圖1所示。具體實施內(nèi)容如下:
(1)專利檢索與下載。針對具體產(chǎn)品創(chuàng)新需求,確定產(chǎn)品創(chuàng)新方向,同時根據(jù)專利發(fā)展過程和技術(shù)周期確定檢索范圍,進(jìn)而確定檢索關(guān)鍵詞和檢索數(shù)據(jù)庫,由布爾關(guān)系生成檢索式檢索行業(yè)專利數(shù)據(jù),然后下載檢索結(jié)果中的專利文本數(shù)據(jù);對因為續(xù)案以及公開導(dǎo)致重復(fù)申請的專利進(jìn)行去重合并,并剔除被駁回、主動撤回以及無效的專利,最大化清除垃圾專利以及低價值專利,提高專利數(shù)據(jù)的質(zhì)量,同時利用維持年限以及法律狀態(tài)對部分“專利煙霧”和“專利地雷”進(jìn)行排查;專利文本中包含標(biāo)題及各類噪聲,需要對其進(jìn)行剔除,同時使用正則表達(dá)式對專利文本中的語句進(jìn)行分句,為文本語義標(biāo)注做準(zhǔn)備;隨后對文本使用語義依存句法對語句中的詞語關(guān)聯(lián)關(guān)系進(jìn)行標(biāo)注,并確定詞語的主語、謂語和賓語等屬性信息。
(2)文本SAO提取與復(fù)雜網(wǎng)絡(luò)的構(gòu)建。通過對專利文本中的語句進(jìn)行語義標(biāo)注,提取文本中的SAO結(jié)構(gòu),構(gòu)建數(shù)據(jù)庫;分析產(chǎn)品元件之間的作用關(guān)系,以另一元件發(fā)揮作用的結(jié)構(gòu)作為源節(jié)點(diǎn),被支配的元件作為目標(biāo)節(jié)點(diǎn),作用方式設(shè)為連邊,從而構(gòu)建復(fù)雜網(wǎng)絡(luò);在復(fù)雜網(wǎng)絡(luò)中運(yùn)用結(jié)構(gòu)洞算法計算節(jié)點(diǎn)特征參數(shù)值,據(jù)此表示節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要程度;由Word2vec通過詞向量計算得到元件語義相似性計算結(jié)果,為下一步元件創(chuàng)新設(shè)計方案提供參考。
(3)產(chǎn)品設(shè)計創(chuàng)新推薦。產(chǎn)品創(chuàng)新設(shè)計主要分為兩部分,一部分是元件創(chuàng)新性替換,由檢索下載的專利文本提取文本中的名詞短語,這些名詞短語即為產(chǎn)品元件,從而構(gòu)建元件庫,通過在元件庫中對元件進(jìn)行相似性檢索,得到元件創(chuàng)新性替換方案;另一部分是功能載體相似性計算,元件是產(chǎn)品功能實現(xiàn)的載體,具有相同或相似功能實現(xiàn)的載體具有可替換性,通過計算元件語義相似性和功能相似性,結(jié)合元件約束性系數(shù)確定元件創(chuàng)新參數(shù)。此外,通過構(gòu)建功能鏈優(yōu)化模型對產(chǎn)品元件功能組合進(jìn)行分析,實現(xiàn)功能優(yōu)化,然后創(chuàng)建產(chǎn)品功能組合矩陣,發(fā)現(xiàn)可以合并或拆分的功能載體,進(jìn)而實現(xiàn)功能載體組合或拆分創(chuàng)新。
(4)最終設(shè)計方案產(chǎn)出。首先,由元件功能相似計算結(jié)果確定相似功能元件推薦;其次,根據(jù)元件相似性檢索,確定相同構(gòu)型元件創(chuàng)新推薦方案;根據(jù)產(chǎn)品功能-結(jié)構(gòu)映射關(guān)系,確定功能載體組合/拆分創(chuàng)新設(shè)計;最終對產(chǎn)品創(chuàng)新設(shè)計方案進(jìn)行合成,并對方案創(chuàng)新性做出評價。
1.3 基于語義依存句法的專利文本SAO獲取
SAO是一種典型的語法結(jié)構(gòu),也可表示為SV(verb)O [26]或主語-謂詞-賓語 SP(predicate)O [27]。SAO可以用來表示事物之間的聯(lián)系,其中,主語和賓語一般為名詞或代詞,表征動作的執(zhí)行者和被執(zhí)行者,謂語一般為動詞,表征主語和賓語之間的關(guān)聯(lián)屬性。經(jīng)過對專利文本的閱讀和分析,發(fā)現(xiàn)專利文本中SAO形式共有五種,其結(jié)構(gòu)和示例見表1??梢钥闯?,在專利文本中有些語句不僅包含一組SAO,有些語句可能包含多個主語,有些語句可能包含多個謂語或賓語,甚至有些語句包含多個SAO。在專利文本中,SAO表示技術(shù)元素間的關(guān)聯(lián)屬性,主語和賓語代表產(chǎn)品技術(shù)元素(元件、能量、物料或者信號),謂語代表技術(shù)元素間的邏輯關(guān)系[28]。因此,SAO能夠較好地描述專利產(chǎn)品和技術(shù)信息。
依存句法是指以詞語的關(guān)聯(lián)特性為依據(jù)劃分詞類,通過該方法可以識別詞語在文本中的位置和作用。語義依存句法通過對詞語的含義和詞語在語句中的上下文進(jìn)行標(biāo)注,從而確定詞語在文本中的詞性和作用,因此該分析方法廣泛應(yīng)用于自然語言處理中的文本處理[29]。以表1中語句為例,語義依存句法分析過程如圖2所示。圖2中的上半部分為語句中的詞語,下半部分為該詞語的語義依存句法結(jié)果。目前常用的依存句法關(guān)系及其具體含義見表2[28-30]。通過對文本語句進(jìn)行語義依存句法分析,發(fā)現(xiàn)主語的詞性標(biāo)簽多為名詞性主語(nsubj)或被動形式名詞主語(nsubj-pass),謂語多為根詞(ROOT),賓語多為賓語(obj)或直接賓語(dobj)等。由詞語分別對應(yīng)的標(biāo)簽即可確定語句SAO結(jié)構(gòu)。
1.4 基于結(jié)構(gòu)洞理論的元件特征參數(shù)計算
復(fù)雜網(wǎng)絡(luò)由節(jié)點(diǎn)和連邊組成,其中節(jié)點(diǎn)可以代表任何事物,連邊表示節(jié)點(diǎn)之間的關(guān)系,邊權(quán)重表示關(guān)系強(qiáng)弱程度。通過復(fù)雜網(wǎng)絡(luò)可以表示一些具有相互關(guān)聯(lián)的事物組成的整體,由此能夠開展網(wǎng)絡(luò)幾何性質(zhì)、網(wǎng)絡(luò)演化以及網(wǎng)絡(luò)結(jié)構(gòu)等方面的研究[31]。結(jié)構(gòu)洞示意如圖3所示。圖中,A、B、C和D均為節(jié)點(diǎn),r1、r2和r3為節(jié)點(diǎn)有向連邊。
結(jié)構(gòu)洞是指網(wǎng)絡(luò)中個體與個體之間由于非直接聯(lián)系而出現(xiàn)空隙的現(xiàn)象[32]。結(jié)構(gòu)洞理論指出,一個節(jié)點(diǎn)與其他節(jié)點(diǎn)聯(lián)系越頻繁,說明此節(jié)點(diǎn)在網(wǎng)絡(luò)中扮演的角色越重要,但隨著該節(jié)點(diǎn)在網(wǎng)絡(luò)中的聯(lián)系越來越多,節(jié)點(diǎn)受到的約束越多,周圍的結(jié)構(gòu)洞逐漸減少,該節(jié)點(diǎn)獲得新連接的可能性也逐漸降低。節(jié)點(diǎn)之間聯(lián)系強(qiáng)度的計算公式如下:
式中,aij、aji為節(jié)點(diǎn)之間相連邊的權(quán)重;aik、aki為節(jié)點(diǎn)i與任一節(jié)點(diǎn)k之間相連邊的權(quán)重總和;Aij為節(jié)點(diǎn)i和節(jié)點(diǎn)j之間聯(lián)系強(qiáng)度。
結(jié)構(gòu)洞理論指出,衡量節(jié)點(diǎn)在網(wǎng)絡(luò)中所受到約束的算法是網(wǎng)絡(luò)約束性系數(shù)[33]。設(shè)節(jié)點(diǎn)i的網(wǎng)絡(luò)約束系數(shù)為Ni,其計算公式如下:
其中,k≠i,j。由式(2)可以看出,當(dāng)j是i的唯一相連節(jié)點(diǎn)時,Ni取最大值1;當(dāng)節(jié)點(diǎn)j與節(jié)點(diǎn)i沒有直接和間接聯(lián)系時,Ni=Aij。從網(wǎng)絡(luò)約束系數(shù)的計算公式來看,約束系數(shù)越小的節(jié)點(diǎn)在網(wǎng)絡(luò)中掌握的信息越多,該節(jié)點(diǎn)在網(wǎng)絡(luò)中鄰域越密集,所受到的約束越高。借助約束性系數(shù)分析節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性,系數(shù)越高則重要性越高,即一旦該節(jié)點(diǎn)發(fā)生變動,整個網(wǎng)絡(luò)所受影響越大。
1.5 基于詞向量的語義相似性計算
計算詞語語義相似性時,對詞語所處上下文詞匯進(jìn)行向量化后計算的數(shù)學(xué)模型稱為詞向量,目前應(yīng)用較廣泛且經(jīng)典的詞向量處理技術(shù)是Word2Vec。2013年MIKOLOV等[34]開發(fā)出語言處理工具包Word2Vec,通過將文本預(yù)料庫中的詞語轉(zhuǎn)換成維度相同的向量形式,使文本轉(zhuǎn)換為數(shù)字形式,從而利于機(jī)器識別和處理。根據(jù)詞語上下文詞向量構(gòu)建序列矩陣,可以用來對詞語進(jìn)行分類、聚類和詞語相似度計算。Word2Vec主要分為兩個模型:CBOW模型和SKIP-GRAM模型。兩種模型的區(qū)別見表3,可以看出CBOW模型的訓(xùn)練效率更高,適用于海量專利數(shù)據(jù)對象的訓(xùn)練與處理。
CBOW是一個三層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),分為輸入層、投影層和輸出層,在輸入層,以目標(biāo)詞為中心,獲取目標(biāo)詞前后各n個詞向量,在投影層將這n個向量累加求和,在輸出層以目標(biāo)詞為根節(jié)點(diǎn)、周圍詞為葉子節(jié)點(diǎn),以詞語共現(xiàn)次數(shù)為權(quán)重構(gòu)建哈夫曼樹,用以預(yù)測投影層的結(jié)果。SKIP-GRAM模型與CBOW模型的訓(xùn)練方式互逆。CBOW訓(xùn)練模型表示如圖4所示。
使用Word2Vec計算詞語相似度時,需要使用余弦相似度計算詞語詞向量。設(shè)待比較的詞語為x和y,使用Word2Vec計算詞語x和詞語y的語義相似度方法如下:
1.6 基于S?rensen相似度的節(jié)點(diǎn)相似性計算
復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)之間通過連邊建立聯(lián)系,具有聯(lián)系的兩個節(jié)點(diǎn)互相成為對方的“鄰居”,一個節(jié)點(diǎn)的所有鄰居節(jié)點(diǎn)組成的集合稱為鄰居集合,在兩個節(jié)點(diǎn)的鄰居集合中同時存在的節(jié)點(diǎn)稱為兩個節(jié)點(diǎn)的共同鄰居。設(shè)在復(fù)雜網(wǎng)絡(luò)G=(V,E)中,V為頂點(diǎn)集合,E為連邊集合,對于頂點(diǎn)u和v,V(u)為頂點(diǎn)u的鄰居集合,V(v)為頂點(diǎn)v的鄰居集合,則對于(u,v)∈V,它們的共同鄰居C(u,v)的計算公式如下:
C(u,v)=|V(u)∩V(v)|(4)
對于頂點(diǎn)u和v,兩者所有鄰居頂點(diǎn)的集合稱為所有鄰居集合T(u,v),其計算公式如下:
T(u,v)=|V(u)∪V(v)|(5)
衡量兩個節(jié)點(diǎn)的相似度時,可以通過節(jié)點(diǎn)之間的共同鄰居來判斷,其中,S?rensen相似度[36]以節(jié)點(diǎn)間共同鄰居與所有鄰居的比值作為衡量節(jié)點(diǎn)間相似度的指標(biāo),節(jié)點(diǎn)u和節(jié)點(diǎn)v的S?rensen相似度S(u,v)計算公式如下:
S?rensen相似度能夠較好地衡量兩個節(jié)點(diǎn)之間的相似性,有利于在推薦算法中實現(xiàn)相似推薦,目前仍然有較多文獻(xiàn)采用該算法[37-39]。
2 專利數(shù)據(jù)驅(qū)動產(chǎn)品推薦創(chuàng)新方法
借鑒文獻(xiàn)[40]中所提的推薦算法,本文將產(chǎn)品創(chuàng)新過程分為三類:第一類為基于內(nèi)容的相同構(gòu)型元件替換,主要聚焦于元件本身;第二類為基于協(xié)同過濾的相似功能元件替換,主要聚焦于實現(xiàn)功能的功能載體;第三類為基于功能拆解/合并的創(chuàng)新性方案,主要從產(chǎn)品功能-結(jié)構(gòu)映射角度實現(xiàn)產(chǎn)品創(chuàng)新。其中,第一類和第二類方案為一對一元件創(chuàng)新方案,第三類為一對多/多對一元件創(chuàng)新方案。具體產(chǎn)品過程如圖5所示。
2.1 基于內(nèi)容的相同構(gòu)型元件替換
對產(chǎn)品進(jìn)行創(chuàng)新設(shè)計時使用相同元件的創(chuàng)新型替換,優(yōu)點(diǎn)在于相同元件具有高度相似的材料特性、流特性和功能描述,因而在創(chuàng)新過程中牽扯到的產(chǎn)品改動較小。為此,本文提出基于內(nèi)容的相同構(gòu)型元件替換。
首先根據(jù)目標(biāo)產(chǎn)品結(jié)構(gòu),分析組成產(chǎn)品的元件及元件間關(guān)系,以元件為節(jié)點(diǎn),以元件間關(guān)系為邊,構(gòu)建產(chǎn)品復(fù)雜網(wǎng)絡(luò);通過產(chǎn)品復(fù)雜網(wǎng)絡(luò)和式(2)對網(wǎng)絡(luò)中的元件進(jìn)行計算,得到元件在產(chǎn)品網(wǎng)絡(luò)中的約束性系數(shù)。在考慮對約束性較高的元件進(jìn)行替換時,需要注意由于該元件牽扯到的其他元件較多,故涉及的改動較多,創(chuàng)新成本較高;對于約束性系數(shù)較低的元件,因為牽扯到的其他元件較少,產(chǎn)品改動成本較低,更適合于產(chǎn)品創(chuàng)新。其次,由專利文本獲取專利中的元件組成元件庫,并以包含該元件的專利頻率為權(quán)值;以上述目標(biāo)元件為關(guān)鍵字檢索元件庫,查找具有相同功能的相同構(gòu)型元件,從而生成該元件的創(chuàng)新性替換方案。最后,結(jié)合元件在專利中出現(xiàn)頻次生成最終方案,頻次較高的元件說明技術(shù)相對成熟,采用這種方案的專利較多;反之,頻次較低的元件說明較少被采用,方案更容易“出其不意”。為了對多結(jié)構(gòu)方案進(jìn)行有效篩選,提高方案的創(chuàng)新性,結(jié)合“出其不意”程度,本文提出了元件達(dá)到“出其不意”效果的程度值Vi,設(shè)共有n個推薦元件,推薦元件i出現(xiàn)頻次為Fi,則Vi的計算公式如下:
基于相同構(gòu)型元件的創(chuàng)新型替換方案更有利于在已有產(chǎn)品基礎(chǔ)上開發(fā)不同型號,對母產(chǎn)品的改動較小,只需對現(xiàn)有生產(chǎn)線做出部分調(diào)整即可,可在更短時間內(nèi)增加產(chǎn)品種類,快速為用戶提供多樣化的選擇,擴(kuò)大產(chǎn)品的市場占有率。
2.2 基于協(xié)同過濾的相似功能元件替換
對目標(biāo)產(chǎn)品進(jìn)行拆分,分析其具體功能及功能載體有助于了解產(chǎn)品結(jié)構(gòu),進(jìn)而在產(chǎn)品結(jié)構(gòu)上對產(chǎn)品做出創(chuàng)新性設(shè)計。產(chǎn)品的主要價值是實現(xiàn)其特定功能,元件作為功能載體,直接影響產(chǎn)品功能的實現(xiàn)效果[5]。例如,花灑噴頭承載著引導(dǎo)水流、控制液體噴出方式的作用,有些噴頭的材質(zhì)為金屬,容易與水中的離子發(fā)生反應(yīng),導(dǎo)致噴頭形變,直接影響產(chǎn)品使用體驗,而硅膠材質(zhì)噴頭則不會發(fā)生此類狀況。此外,同樣具有調(diào)整并固定角度的球鉸和棘輪,球鉸鑄造相對簡單,且在調(diào)整角度時具有很好的隨意性,磨損較低,抗腐蝕性好,但球鉸容易滑動;棘輪相對牢固,且調(diào)整角度具有規(guī)律性,調(diào)整時具有聲音反饋,但棘輪易磨損,抗腐蝕性較差。由此可見,實現(xiàn)某種功能的功能載體有多種,在對產(chǎn)品功能創(chuàng)新過程中,本文考慮在同一功能下尋找不同的功能載體實現(xiàn)創(chuàng)新。
為獲得相似功能載體,本文選用Word2Vec訓(xùn)練專利文本得到詞向量,通過詞向量和式(3)計算詞語相似度,作為元件相似度的參考。通過式(6)計算元件之間的SAO相似度從而得到元件功能相似性參數(shù),結(jié)合Word2Vec計算詞語語義相似度得到元件可替換性參數(shù)。對于元件語義相似性和功能相似性的計算結(jié)果,還需要引入頻率作為判斷使用量的依據(jù),與相同元件替換方案類似:使用量越多的元件,體現(xiàn)出的創(chuàng)新價值越低;使用量越少的元件,體現(xiàn)出的創(chuàng)新價值越高。綜合多個指標(biāo),得到元件的推薦指數(shù),從而對相同功能不同元件的性能進(jìn)行評價,具體計算公式如下:
式中,M(i)為第i個推薦元件的總體評價指標(biāo);W(i)、S(i)分別為由Word2Vec計算出的推薦元件i與目標(biāo)元件的相似度和S?rensen相似度;V(i)為推薦元件i出其不意的程度值。
通過功能載體的相似性判斷,可以實現(xiàn)產(chǎn)品的創(chuàng)新性設(shè)計,有利于對已有產(chǎn)品進(jìn)行升級改造。確定產(chǎn)品設(shè)計方案之后,一旦存在相關(guān)專利侵權(quán),就能夠進(jìn)行方案調(diào)整,有利于實現(xiàn)專利規(guī)避。
2.3 基于功能拆解/合并的創(chuàng)新型方案
設(shè)計者在進(jìn)行產(chǎn)品設(shè)計時,根據(jù)產(chǎn)品總功能需求,利用“功能白箱”或“功能黑箱”對產(chǎn)品進(jìn)行逐層剖析,進(jìn)而確定產(chǎn)品功能原理和具體結(jié)構(gòu)。這種由總功能到子功能的分解延伸方式由于過程較為抽象,分解過程對設(shè)計師經(jīng)驗要求較高,且設(shè)計過程易受設(shè)計師個人偏好的影響,導(dǎo)致最終設(shè)計結(jié)果出現(xiàn)不必要的結(jié)構(gòu)冗余或功能重合。例如有些功能需要多個功能載體(元件)共同作用實現(xiàn),但在保證功能實現(xiàn)不變的情況下,可以對功能載體進(jìn)行創(chuàng)新組合和拆分。
為了形象化產(chǎn)品功能與元件的關(guān)系,同時參考文獻(xiàn)[41],本文提出構(gòu)建產(chǎn)品元件-功能映射關(guān)系。首先對產(chǎn)品功能及功能載體進(jìn)行分析,并假設(shè)目標(biāo)產(chǎn)品由n個元件組成,元件共包含m個子功能,則產(chǎn)品元件-功能映射關(guān)系如圖6所示。
例如,產(chǎn)品的某項功能需要n個元件共同作用實現(xiàn),實現(xiàn)該功能的元件共對應(yīng)m個子功能,經(jīng)過對產(chǎn)品構(gòu)建功能優(yōu)化模型,將重復(fù)功能合并,得到最終功能優(yōu)化示意圖,如圖7所示。由合并后的功能示意圖及文獻(xiàn)[42]中功能組合及功能關(guān)系組合矩陣的設(shè)計思路,本文組合及創(chuàng)建了產(chǎn)品功能組合矩陣,該矩陣見表4。通過功能組合矩陣,對實現(xiàn)組合功能的元件進(jìn)行檢索和創(chuàng)新,可以有效實現(xiàn)產(chǎn)品創(chuàng)新,優(yōu)化產(chǎn)品結(jié)構(gòu)。
3 案例分析
3.1 背景概述
企業(yè)在保證衛(wèi)浴產(chǎn)品基本功能的同時,若能開發(fā)出新穎且實用的新品類,將會極大提高企業(yè)在行業(yè)中的市場份額,提升企業(yè)核心競爭力。受本地區(qū)相關(guān)衛(wèi)浴合作企業(yè)的委托,本文課題組以
該企業(yè)目前在售的一款手持花灑(https:∥item.jd.com/100023325172.html)為研究對象,借助專利挖掘技術(shù)對產(chǎn)品進(jìn)行二次創(chuàng)新設(shè)計,盡可能降低開發(fā)成本,提高產(chǎn)品性能,創(chuàng)造更多賣點(diǎn)。產(chǎn)品結(jié)構(gòu)如圖8所示。
1.外保護(hù)罩2.面板3.負(fù)離子球4.過濾網(wǎng)容器5.手柄上部外罩6.螺紋接口7.麥飯石礦化球8.過濾網(wǎng)容器9.手柄10.軟管螺紋接口11.底座12.軟管13.密封圈14.過濾網(wǎng)外殼15.電氣石陶瓷球16.按鈕
3.2 專利數(shù)據(jù)庫與產(chǎn)品元件庫的構(gòu)建
本文選用專利文本作為語料庫,通過專利檢索網(wǎng)站(https:∥www.patsnap.com/)下載發(fā)表于美國專利商標(biāo)局的花灑專利文本,花灑專利檢索式見表5??紤]到美國專利保護(hù)最長年限為20年,專利檢索范圍對申請時間做了約束。通過專利前期清洗過濾,共獲取1733件衛(wèi)浴花灑專利及其全文說明書信息。
專利文本主要包含四部分:摘要、專利概述、附圖說明和具體實施方式。通過統(tǒng)計專利文本各部分的內(nèi)容,專利文本結(jié)構(gòu)對比見表6??梢钥闯鰧@攀鰞?nèi)容量較大,包含的產(chǎn)品設(shè)計信息較豐富,且文本內(nèi)容有利于SAO結(jié)構(gòu)的抽取,因此,實驗選擇專利概述作為信息提取內(nèi)容。
對專利概述部分文本進(jìn)行噪聲清理,通過正則表達(dá)式去除標(biāo)題、不必要的標(biāo)點(diǎn)符號等。本文使用python作為文本處理程序語言,使用spacy模塊對專利文本進(jìn)行語義依存句法分析,根據(jù)依存關(guān)系提取SAO,并以此構(gòu)建專利數(shù)據(jù)庫。最終獲取到1703 016組SAO結(jié)構(gòu),SAO提取結(jié)果見表7??梢钥闯?,主語和賓語主要為元件,謂語主要為元件作用關(guān)系,從而驗證了通過提取文本中SAO獲取產(chǎn)品結(jié)構(gòu)和功能信息的可行性。
為驗證本文所提信息抽取方法的準(zhǔn)確性,實驗選取準(zhǔn)確率(precision)、召回率(recall)和F-score三種檢驗指標(biāo),其中TP為被正確預(yù)測的正例,TN為被正確預(yù)測的反例,F(xiàn)P為被錯誤預(yù)測的正例,F(xiàn)N為被錯誤預(yù)測的反例,計算公式如下:
實驗選取2021年1月1日至2022年12月31日的衛(wèi)浴花灑產(chǎn)品專利文本作為驗證數(shù)據(jù)集,將本文所提SAO提取方法與傳統(tǒng)信息抽取算法TF和TF-IDF進(jìn)行了對比,計算結(jié)果如圖9所示。顯然本文方法在三種檢驗指標(biāo)中均明顯優(yōu)于其他信息提取算法。
3.3 目標(biāo)產(chǎn)品分析與元件約束系數(shù)計算
通過對目標(biāo)產(chǎn)品的結(jié)構(gòu)分析,以產(chǎn)品功能鏈及其功能載體為基礎(chǔ),以圖6所示的功能-元件分析圖為依據(jù),構(gòu)建目標(biāo)產(chǎn)品結(jié)構(gòu)分析圖,其結(jié)果如圖10所示。根據(jù)目標(biāo)產(chǎn)品分析,構(gòu)建以目標(biāo)產(chǎn)品元件為節(jié)點(diǎn)、以元件間功能作用為邊、以元件間聯(lián)系頻次為邊權(quán)重的產(chǎn)品復(fù)雜網(wǎng)絡(luò),如圖11所示。
依照目標(biāo)產(chǎn)品復(fù)雜網(wǎng)絡(luò),用式(2)計算產(chǎn)品元件的約束性系數(shù),計算結(jié)果見表8。約束性系數(shù)的主要作用是衡量元件在產(chǎn)品中的重要性程度,元件重要性越高,說明該元件在產(chǎn)品網(wǎng)絡(luò)中越處于中心地位,從該元件流入或流出到其他元件的能量、物料或信號越多,進(jìn)行產(chǎn)品創(chuàng)新時改動元件牽扯到的其他元件越多,創(chuàng)新成本越高。由計算結(jié)果可知,邊緣節(jié)點(diǎn)的約束性系數(shù)為1,約束性系數(shù)越高的節(jié)點(diǎn)所受到的約束越小,改動該節(jié)點(diǎn)對產(chǎn)品總體結(jié)構(gòu)的調(diào)整越小。
3.4 相同構(gòu)型元件創(chuàng)新推薦
由產(chǎn)品復(fù)雜網(wǎng)絡(luò)和約束性系數(shù),結(jié)合元件庫檢索,對元件及其功能實現(xiàn)做出分析,獲得元件功能替換方案。由表8中復(fù)雜網(wǎng)絡(luò)約束性系數(shù)可知,在base、ball、nozzle以及button等元件位置入手產(chǎn)生的創(chuàng)新成本較低。以button為例,在功能不變的情況下進(jìn)行功能載體創(chuàng)新,通過元件庫檢索,得到功能載體button的創(chuàng)新方法,見表9。功能載體創(chuàng)新在原有功能載體上,通過專利數(shù)據(jù)構(gòu)建的元件庫中查找相關(guān)元件進(jìn)行替換,該方法僅對具有相同功能的元件進(jìn)行檢索和替換,適合對已有產(chǎn)品進(jìn)行調(diào)整,擴(kuò)展產(chǎn)品型號,提高產(chǎn)品在市場中的占有率。
3.5 相似功能元件創(chuàng)新推薦
關(guān)于相似功能載體推薦,使用專利文本語料庫、窗口為15、上下文詞量為5、訓(xùn)練模式為CBOW訓(xùn)練的Word2Vec詞向量模型生成元件的近似替換方案。將每個專利詞條的文本轉(zhuǎn)換為一行文本,并對語料庫進(jìn)行噪聲清理、去除標(biāo)點(diǎn)符號等;以python作為編程語言,利用Gensim模塊對專利文本語料庫進(jìn)行訓(xùn)練,具體訓(xùn)練過程如圖4所示。實驗環(huán)境如下:(Intel(R)Xeon(R)Gold 5218R CPU @ 2.10GHz)×2,64.00 GB內(nèi)存,Windows 10 64位操作系統(tǒng)。最終得到Word2Vec詞向量模型,以此模型為基礎(chǔ),計算詞語間語義相似性。
由于過濾裝置是花灑產(chǎn)品比較流行的功能載體,故本文以過濾功能載體為案例開展產(chǎn)品創(chuàng)新設(shè)計研究。首先,根據(jù)式(3)計算元件語義相似性,得到以“filter”為關(guān)鍵字的相似性詞語排名,再篩選出元件描述詞語,最終得到與“filter”功能相似的推薦方案,其語義相似性計算結(jié)果見表10“語義相似性”列。語義相似性描述的是詞語在上下文語境中的相似性,在專利文本中,元件所處的上下文通常為元件的材料特性描述,通過語義相似性計算能夠獲取元件描述的相似性。但以詞語所處上下文為判斷依據(jù)的Word2Vec并不能描述元件之間的作用方式,因此,以元件SAO相似性更有利于判斷元件功能相似性。借由式(6)和表8計算推薦元件的功能相似性,計算結(jié)果見表10“功能相似性”列。
對推薦元件語義相似性和功能相似性做出判斷后,檢索專利語料庫中推薦元件出現(xiàn)頻次,并依據(jù)式(7)獲得元件的新穎性指標(biāo),計算結(jié)果見表10“V值”列。最后,由式(8)以及上述指標(biāo)的計算結(jié)果,得出“filter”功能的相似推薦推薦指數(shù),見表10“推薦指數(shù)”列。其中,基于word2vec計算的“porous”為形容詞,不具有功能相似性計算結(jié)果,因此推薦指數(shù)計算結(jié)果只包含語義相似性和V值的平均值。
為形象化展示表10中獲取到的推薦方案,其推薦結(jié)果和案例見表11。其中,方案1為“filter”功能的元件“cartridge”,為墨盒式過濾器,見其圖示;方案2為混合式過濾器,其內(nèi)部為混合類型過濾材質(zhì);方案3為多孔式過濾器,可將其配置于花灑頭部;方案4為臭氧型過濾器,能夠氧化分解一些大分子有機(jī)物;方案5為藥物過濾器,能夠在水流中加入藥物,輔助皮膚類疾病的治療??梢钥闯龌赟AO方法可提供豐富且新穎的功能推薦方案。
3.6 功能載體組合/拆分創(chuàng)新方案
對產(chǎn)品復(fù)雜網(wǎng)絡(luò)及其元件進(jìn)行功能分析時發(fā)現(xiàn),有些功能需要多種功能載體實現(xiàn),即元件間通過功能組合生成功能鏈,功能載體之間以空間、能量、物料以及信號進(jìn)行功能傳遞。例如過濾功能,需要過濾網(wǎng)、過濾容器以及過濾球三種元件組合共同完成。然而,在工業(yè)設(shè)計時,可以將多個載體有機(jī)結(jié)合,形成功能一體化的功能載體,即復(fù)合型元件,不僅可以簡化元件的加工、裝配等工藝,還能降低成本。為方便起見,本文將此方法稱為載體組合法。參考載體組合法的思想,對實現(xiàn)過濾功能的載體進(jìn)行合成,尋找能夠容納過濾材料且實現(xiàn)過濾水體功能的元件。
首先以圖6為參考,對于上述需要組合及拆分的功能載體,將handle、filter以及ball所承擔(dān)的功能摘取出來進(jìn)行分析,創(chuàng)建目標(biāo)產(chǎn)品功能鏈模型,如圖12所示。通過圖12中功能鏈模型,將目標(biāo)產(chǎn)品中的功能進(jìn)行優(yōu)化,合并重疊功能,然后依據(jù)圖7創(chuàng)建產(chǎn)品功能組合矩陣,見表12。
以表12中“handle-shape filter”為例,參考美國專利US6537455中的方案,將過濾部件和手柄結(jié)合為一體。以“special material filter housing”為例,參考US2015/0076254A1中的方案,采用特殊材料制作過濾套筒;以“special material filter”為例,可以參考US9878921中的方案,采用特殊材料制作過濾元件。具體參考結(jié)果見表13。由于功能拆分與功能組合互為逆過程,故不再贅述。通過該功能組合矩陣,在保證功能實現(xiàn)的同時實現(xiàn)了結(jié)構(gòu)優(yōu)化。
4 結(jié)論
(1)利用詞性標(biāo)注提取專利文本中的結(jié)構(gòu)及其功能短語信息,借助依存算法獲取不同短語對象的層級關(guān)系信息,兩項相結(jié)合以構(gòu)建SAO組合單元,通過構(gòu)建設(shè)計知識數(shù)據(jù)庫,為產(chǎn)品創(chuàng)新設(shè)計提供靈感來源。
(2)通過目標(biāo)產(chǎn)品結(jié)構(gòu)分析構(gòu)建目標(biāo)產(chǎn)品復(fù)雜網(wǎng)絡(luò),利用結(jié)構(gòu)洞算法計算產(chǎn)品元件約束性系數(shù),進(jìn)而探測創(chuàng)新目標(biāo)元件,同時利用Word2Vec訓(xùn)練專利文本獲取目標(biāo)元件語義相似性,進(jìn)而獲取目標(biāo)元件相似的其他對象。
(3)考慮實際需求,分別從增加產(chǎn)品種類、專利侵權(quán)規(guī)避以及功能配置優(yōu)化三個方面借助內(nèi)容推薦、協(xié)同過濾以及功能拆解合并三種策略實現(xiàn)專利數(shù)據(jù)驅(qū)動產(chǎn)品創(chuàng)新設(shè)計。
本研究仍然存在不足之處:首先,受制于專利文本存在大量的噪聲,本文所提知識提取方法的效率有待進(jìn)一步提升;其次,由于專利從申請到公開存在時間差,導(dǎo)致市場分析存在一定的滯后性,故有必要借助其他數(shù)據(jù)進(jìn)行聯(lián)合研究;此外,專利數(shù)據(jù)除了文本還有部分圖像信息,這些信息對產(chǎn)品創(chuàng)新設(shè)計也具有一定研究價值,本文未開展相應(yīng)的挖掘研究;最后,根據(jù)新穎性及市場價值,產(chǎn)品設(shè)計分為原始創(chuàng)新、改進(jìn)創(chuàng)新及集成創(chuàng)新,鑒于專利的特點(diǎn),本文主要聚焦于改進(jìn)創(chuàng)新及部分集成創(chuàng)新,尚未涉及原始創(chuàng)新。未來將考慮改善數(shù)據(jù)利用效率,開展多數(shù)據(jù)融合產(chǎn)品創(chuàng)新的研究,同時研究如何實現(xiàn)數(shù)據(jù)驅(qū)動原始創(chuàng)新,以更高的研發(fā)效率滿足消費(fèi)者更多的個性化需求[43]。
參考文獻(xiàn):
[1] 路甬祥. 論創(chuàng)新設(shè)計[M]. 北京:中國科學(xué)技術(shù)出版社, 2017.
LU Yongxiang. On Innovative Design[M]. Beijing:Science and Technology of China Press, 2017.
[2] 肖人彬, 林文廣. 數(shù)據(jù)驅(qū)動的產(chǎn)品創(chuàng)新設(shè)計研究[J]. 機(jī)械設(shè)計, 2019, 36(12):1-9.
XIAO Renbin, LIN Wenguang. Research on Data-Driven Product Innovation Design[J]. Journal of Machine Design, 2019, 36(12):1-9.
[3] LIN W G, LIU X D, XIAO R B. Data-driven Product Functional Configuration:Patent Data and Hypergraph[J]. Chinese Journal of Mechanical Engineering, 2022, 35(4):108-124.
[4] 肖人彬, 林文廣, 賴榮燊, 等. 數(shù)據(jù)驅(qū)動的產(chǎn)品大規(guī)模個性化設(shè)計研究[J]. 機(jī)械設(shè)計, 2021, 38(10):1-14.
XIAO Renbin, LIN Wenguang, LAI Rongshen, et al. Research on the Data-driven Product Design for Mass Personalization[J]. Journal of Machine Design, 2020, 38(10):1-14.
[5] 王朝霞, 邱清盈, 馮培恩, 等. 機(jī)械產(chǎn)品專利技術(shù)方案信息抽取方法[J]. 機(jī)械工程學(xué)報, 2009, 45(10):198-206.
WANG Zhaoxia, QIU Qingying, FENG Peien, et al. Information Extraction Method of Technical Solution from Mechanical Product Patent[J]. Journal of Mechanical Engineering, 2009, 45(10):198-206.
[6] 吳揚(yáng)東, 張?zhí)A, 劉丹, 等. 復(fù)雜產(chǎn)品設(shè)計方案的數(shù)據(jù)驅(qū)動多屬性優(yōu)化決策[J]. 中國機(jī)械工程, 2020, 31(7):865-870.
WU Yangdong, ZHANG Taihua, LIU Dan, et al. Data-driven Multi-attribute Optimization Decision-making for Complex Product Design Schemes[J]. China Mechanical Engineering, 2020, 31(7):865-870.
[7] 陳亮, 竇昊, 魏煌, 等. 基于質(zhì)量功能展開、發(fā)明問題解決理論和仿生學(xué)的產(chǎn)品創(chuàng)新設(shè)計[J]. 中國機(jī)械工程, 2020, 31(11):1285-1295.
CHEN Liang, DOU Hao, WEI Huang, et al. Product Innovation Design Based on QFD, TRIZ and Bionics[J]. China Mechanical Engineering, 2020, 31(11):1285-1295.
[8] 劉江南, 姜光, 盧偉健, 等. TRIZ工具集用于驅(qū)動產(chǎn)品創(chuàng)新及生態(tài)設(shè)計方法研究[J]. 機(jī)械工程學(xué)報, 2016, 52(5):12-21.
LIU Jiangnan, JIANG Guang, LU Weijian, et al. Driving Innovative and Ecological Design of Product Development by Utilizing TRIZ Tools[J]. Journal of Mechanical Engineering, 2016, 52(5):12-21.
[9] 林文廣, 賴榮燊, 肖人彬. 基于復(fù)雜網(wǎng)絡(luò)的專利數(shù)據(jù)驅(qū)動的產(chǎn)品創(chuàng)新設(shè)計[J]. 中國機(jī)械工程, 2020, 31(7):842-852.
LIN Wenguang, LAI Rongshen, XIAO Renbin. Patent Data-driven Product Innovative Design Based on Complex Network[J]. China Mechanical Engineering, 2020, 31(7):842-852.
[10] 梁艷紅, 檀潤華, 馬建紅. 面向產(chǎn)品創(chuàng)新設(shè)計的專利文本分類研究[J]. 計算機(jī)集成制造系統(tǒng), 2013, 19(2):382-390.
LIANG Yanhong, TAN Runhua, MA Jianhong. Study on Patent Text Classification for Product Innovative Design[J]. Computer Integrated Manufacturing Systems, 2013, 19(2):382-390.
[11] 邱清盈, 冀瑜, 馮培恩. 基于國際專利分類表知識社團(tuán)發(fā)現(xiàn)和重組的功能創(chuàng)新策略[J]. 機(jī)械工程學(xué)報, 2016, 52(23):43-49.
QIU Qingying, JI Yu, FENG Peien. Functional Innovation Strategies Based on IPC Knowledge Community Detection and Reorganization[J]. Journal of Mechanical Engineering, 2016, 52(23):43-49.
[12] 李少波, 吳正, 楊觀賜, 等. 基于類比設(shè)計的專利知識挖掘算法[J]. 計算機(jī)集成制造系統(tǒng), 2017, 23(11):2344-2352.
LI Shaobo, WU Zheng, YANG Guanci, et al. Patent Mining Algorithm Based on Analogy Design[J]. Computer Integrated Manufacturing Systems, 2017, 23(11):2344-2352.
[13] 陳志泊, 李鈺曼, 許福, 等. 基于TextRank和簇過濾的林業(yè)文本關(guān)鍵信息抽取研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2020, 51(5):207-214.
CHEN Zhibo, LI Yuman, XU Fu, et al. Key Information Extraction of Forestry Text Based on Text Rank and Clusters Filtering[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(5):207-214.
[14] DUFLOU J R, VERHAEGEN P A. Systematic Innovation Through Patent Based Product Aspect Analysis[J]. CIRP Annals, 2011, 60(1):203-206.
[15] PARK S, JUN S. Technological Cognitive Diagnosis Model for Patent Keyword Analysis[J]. ICT Express, 2020, 6(1):57-61.
[16] CHEN L, XU S, ZHU L, et al. A Deep Learning Based Method for Extracting Semantic Information from Patent Documents[J]. Scientometrics, 2020, 125(1):289-312.
[17] CHOETKIERTIKUL M, DAM H K, TRAN T, et al. Automatically Recommending Components for Issue Reports Using Deep Learning[J]. Empirical Software Engineering, 2021, 26(2):1-39.
[18] YOON J, JEONG B, KIM M, et al. An Information Entropy and Latent Dirichlet Allocation Approach to Noise Patent Filtering[J]. Advanced Engineering Informatics, 2021, 47:101243.
[19] ZHANG Y, ZHANG G, CHEN H, et al. Topic Analysis and Forecasting for Science, Technology and Innovation:Methodology with a Case Study Focusing on Big Data Research[J]. Technological Forecasting and Social Change, 2016, 105:179-191.
[20] 曹國忠, 楊雯丹, 劉新星. 基于主體-行為-客體(SAO)三元結(jié)構(gòu)的專利分析方法研究綜述[J]. 科技管理研究, 2021, 41(4):158-167.
CAO Guozhong, YANG Wendan, LIU Xinxing. Review of Patent Analysis Methods Based on Subject-action-object Ternary Structure[J]. Science and Technology Management Research, 2021, 41(4):158-167.
[21] HE C, LI Z, WANG S, et al. A Systematic Data-mining-based Methodology for Product Family Design and Product Configuration[J]. Advanced Engineering Informatics, 2021, 48:101302.
[22] HAN X, ZHU D, WANG X, et al. Technology Opportunity Analysis:Combining SAO Networks and Link Prediction[J]. IEEE Transactions on Engineering Management, 2021, 68(5):1288-1298.
[23] FENG Y, ZHAO Y, ZHENG H, et al. Data-driven Product Design toward Intelligent Manufacturing:a Review[J]. International Journal of Advanced Robotic Systems, 2020, 17(2):1-18.
[24] 吳穎文, 紀(jì)楊建, 顧新建. 基于專利動態(tài)復(fù)雜網(wǎng)絡(luò)的產(chǎn)業(yè)共性技術(shù)預(yù)測[J]. 計算機(jī)集成制造系統(tǒng), 2020, 26(12):3185-3194.
WU Yingwen, JI Yangjian, GU Xinjian. Industrial Generic Technology Prediction Based on Dynamic Complex Network of Patents[J]. Computer Integrated Manufacturing Systems, 2020, 26(12):3185-3194.
[25] LI H, YUAN J, TAN R, et al. Design around Bundle Patent Portfolio Based on Technological Evolution[J]. Chinese Journal of Mechanical Engineering, 2019, 32(1). 86-98.
[26] WANG X, REN H, CHEN Y, et al. Measuring Patent Similarity with SAO Semantic Analysis[J]. Scientometrics, 2019, 121:1-23.
[27] HUANG Z, GUO X, LIU Y, et al. A Smart Conflict Resolution Model Using Multi-layer Knowledge Graph for Conceptual Design[J]. Advanced Engineering Informatics, 2023, 55:101887.
[28] OH M, JANG H, KIM S, et al. Main Path Analysis for Technological Development Using SAO Structure and DEMATEL Based on Keyword Causality[J]. Scientometrics, 2023, 1(1):1-26.
[29] LI D, LEI Z L, SONG B Y, et al. Neural Attentional Relation Extraction with Dual Dependency Trees[J]. Journal of Computer Science and Technology, 2022, 37(6):1369-1381.
[30] CHENG K F, YUE Y A, SONG Z W. Sentiment Classification Based on Part-of-speech and Self-attention Mechanism[J]. IEEE Access, 2020, 8:16387-16396.
[31] LU J H, WEN G H, LU R Q, et al. Networked Knowledge and Complex Networks:an Engineering View[J]. IEEE-CAA Journal of Automatica Sinica, 2022, 9(8):1366-1383.
[32] BURT R S. Structural Holes[M]. Cambridge:Harvard University Press, 1995.
[33] LIN W G, LIU X D, XIAO R B. Research on Product Core Component Acquisition Based on Patent Semantic Network[J]. Entropy, 2022, 24(4):549-569.
[34] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient Estimation of Word Representations in Vector Space[EB/OL]. https:∥arxiv. org/pdf/1301. 3781. pdf.
[35] BAEK J W, CHUNG K Y. Multimedia Recommendation Using Word2Vec-based Social Relationship Mining[J]. Multimedia Tools and Applications, 2021, 80(26):34499-34515.
[36] SRENSEN T. A Method of Establishing Groups of Equal Amplitude in Plant Sociology Based on Similarity of Species and Its Application to Analyses of the Vegetation on Danish Commons[J]. Kongelige Danske Videnskabernes Selskab, 1948, 5(4):1-34.
[37] MAMMOLA S. Assessing Similarity of N-dimensional Hypervolumes:Which Metric to Use?[J]. Journal of Biogeography, 2019, 46(9):2012-2023.
[38] ZHAN Y Z, TAN K H, JI G, et al. A Big Data Framework for Facilitating Product Innovation Processes[J]. Business Process Management Journal, 2017, 23(3):518-536.
[39] HE C, LI Z, WANG S, et al. A Systematic Data-mining-based Methodology for Product Family Design and Product Configuration[J]. Advanced Engineering Informatics, 2021, 48:101302.
[40] 黃震華, 張佳雯, 張波, 等. 語義推薦算法研究綜述[J]. 電子學(xué)報, 2016, 44(9):2262-2275.
HUANG Zhenhua, ZHANG Jiawen, ZHANG Bo, et al. Survey of Semantics-based Recommendation Algorithms[J]. Acta Electronica Sinica, 2016, 44(9):2262-2275.
[41] VITELLI V, SORENSEN O, CRISPINO M, et al. Probabilistic Preference Learning with the Mallows Rank Model[J]. Journal of Machine Learning Research, 2018, 18:1-49.
[42] RENIERS G, SORENSEN K, DULLAERT W. A Multi-attribute Systemic Risk Index for Comparing and Prioritizing Chemical Industrial Areas[J]. Reliability Engineering & System Safety, 2012, 98(1):35-42.
[43] 肖人彬, 賴榮燊, 李仁旺. 從大規(guī)模定制化設(shè)計到大規(guī)模個性化設(shè)計[J]. 南昌工程學(xué)院學(xué)報, 2021, 40(1):1-12.
XIAO Renbin, LAI Rongshen, LI Renwang. From Design for Mass Customization to Design for Mass Personalization[J]. Journal of Nanchang Institute of Technology, 2021, 40(1):1-12.