王 含
(青島科技大學,山東 青島 266061)
服裝的領型設計屬于服裝零部件設計之一。領子所處的位置靠近頭部,映襯臉部,很容易形成視覺的焦點[1]。常見的領型有圓領、方形領、V領、一字領、彼得潘領、翻領、駁領、立領等。本研究選取領面、領座、駁頭這3個造型要素,分為不同形態(tài)下有無領面、領座、駁頭產生的5種不同領型:無領、立領、翻領、駁領、平貼領,另外還有一種特殊的領型—連帽領,將這6種領型作為領型的分類標準。
2.1.1 構建原始圖像數據庫
根據多元線性回歸模型的要求,本研究以具有代表性的10個國際知名品牌(Chanel、Christian Dior、Louis Vuitton、Giorgio Armani、Givenchy、Saint Laurent、Versace、Valentino、Hermès、Burberry)為研究對象,搜集Vogue Runway官網2016—2020年,Fall Couture、Fall Ready-to-Wear、Pre-Fall、Resort、Spring Couture、Spring Ready-to-wear系列近5年的所有圖片構成原始圖像數據庫,這些系列出自倫敦、米蘭、紐約和巴黎四大國際時裝周[2]。
2.1.2 圖片分析與預處理
所有原始圖片按照季度、年份、系列、品牌(數字)、X領等基本信息進行分類歸檔,最終以JEPG圖像格式存儲于原始圖像數據庫中。該數據庫共存儲10個品牌2016年春夏至2020年秋冬12季共12 662張圖片。
用Python調用os和glob包遍歷文件夾,按照年份和季節(jié),統(tǒng)計各種領型的數量和該領型的占比百分數,整理成Excel表格。
參考《用回歸分析法預測服裝流行色》一文中作者對流行色數值化的處理方法,對Excel表格里各領型的占比百分數進行流行程度的權重定義。若百分比為0,流行程度的定義標簽為0;百分比在(0,11),定義標簽為1;百分比在[11,20),定義標簽為2……以此類推,并在Python調用os和glob包遍歷文件夾統(tǒng)計后,將得到的領型占比結果與定義流行程度的結果繪制在同一張Excel表格中。定義后的流行程度權重賦值如表1所示[3]。
表1 流行程度權重表
第一步,選擇合適的模型,對模型的好壞進行評估;第二步,構建數據集,對數據進行預處理,處理缺失值、異常值;第三步,利用數據歸一化統(tǒng)一數據的維度,既可以加快梯度下降,尋求最優(yōu)解的速度,又可以提高預測的準確性;第四步,通過機器監(jiān)督學習樣本,訓練模型,推導回歸參數;第五步,得到測試結果和擬合圖,利用mse評價模型好壞。模型預測流程如圖1所示。
圖1 模型預測流程
多元線性回歸模型運用的是機器學習中有監(jiān)督學習的方法。有監(jiān)督學習是指利用輸入數據及其對應的標簽來訓練模型[4]。關于服裝領型設計的研究屬于預測連續(xù)值的有監(jiān)督學習。在有監(jiān)督學習中,數據=(特征,標簽),如果預測的是離散值,此類學習任務稱為分類;如果預測的是連續(xù)值,此類學習任務則稱為回歸[5]。
設定test.csv、train.csv、train2.csv、result.csv 4個數據文件夾,test.csv是測試數據集,train.csv是年份和季節(jié),train2.csv是流行程度,result.csv是輸出的流行程度的預測值。選擇基于梯度下降的線性回歸模型,通過算法擬合就可以得到不同領型的多元線性回歸方程,繪制出領型隨年份、季節(jié)影響波動的流行程度的擬合圖。
其中,梯度下降[6]的目的是通過迭代找到目標函數的最小值,或者將目標函數收斂到最小值,尋找函數的最優(yōu)解。均方誤差用來評價數據的變化程度,mse的值越小,說明預測模型描述的最優(yōu)解精度越高。
一個因變量與大于等于兩個預測變量之間的聯系被稱為多元相關,在這種情況下作出的預測被稱為多元回歸[6]。多元線性回歸方程表示影響領子流行程度的因素有多個,且這些影響因素與因變量呈線性關系。假設多元線性回歸模型如下:
式中,y為因變量,x1,x2…xm-1為自變量;β0,β1,β2,…βm-1是m個回歸系數;ε是均值為零、方差為σ2>0的隨機變量,稱為誤差項,并通常假定ε~N(0,σ2)。
通過算法得到不同領型的回歸預測方程,其中,y—流行程度;x1—年份,x2—季節(jié)。不同領型的回歸方程的回歸預測值和mse偏差值如表2所示,將所有領型的回歸方程進行整合,用matplotlib畫出擬合折線圖(圖2)。
表2 領型回歸方程預測值和mse偏差值
圖2 領型擬合曲線
擬合圖中,橫坐標0~20表示2016—2020年一共20個季度連續(xù)的流行程度數據,縱坐標表示流行度的數值,x1、x2前面的回歸系數分別表示流行程度與年份、季節(jié)的相關性。回歸系數絕對值的大小表示相關性的強弱程度。系數為正數,則表示流行度與年份或季節(jié)呈正相關,說明隨著時間的增長,流行程度也增長;反之說明隨著時間的增長,流行程度反而降低,這種類型的領子越來越不流行。
從多元線性回歸方程可以看出,各種領型的預測值大小為無領>駁領>翻領>立領>平貼領=連帽領,無領的預測值遠遠大于其他5種領型,即無領在這6種領型中最流行。
擬合圖中的藍色線(target)是實際通過統(tǒng)計領型占比得到的真實的流行度趨勢,黃色線(preds)則是通過算法預測到的流行程度趨勢。其中,平貼領和連帽領的真實趨勢與預測趨勢相吻合,所以在擬合圖中兩條線重合了。可以看出,算法預測的黃色線更能體現隨著時間、季節(jié)的波動,領子的流行度呈現的大趨勢是逐漸攀升還是逐漸下降,不斷波動或始終保持一個不變的流行狀態(tài)。
通過跨學科使用計算機技術構建多元線性回歸方程的方法,能夠更加科學、準確地預測領型隨著時間變化的流行趨勢,一方面彌補了傳統(tǒng)人為統(tǒng)計方法存在的局限性和主觀性,另一方面也為服裝預測機制提供了新思路,有利于引導服裝市場的設計與研發(fā),具有重要的實用性價值。