摘 要:文中設(shè)計了一種基于AIGC技術(shù)的虛擬試衣系統(tǒng)。該虛擬試衣系統(tǒng)由STM32F407微處理器和Stable Diffusion圖像生成工具構(gòu)成。微處理器與多種外設(shè)相結(jié)合,負(fù)責(zé)采集、保存、顯示以及傳輸環(huán)境圖像數(shù)據(jù)。系統(tǒng)內(nèi)含GUI小程序,通過觸控方式在顯示屏上實現(xiàn)鏡子模式、試衣模式、衣裝選擇、試衣結(jié)果展示等功能。Stable Diffusion工具基于阿里云服務(wù)器部署,有助于提高硬件適配性。試衣結(jié)果在云端生成,并被傳輸至下位機保存與展示。該系統(tǒng)既能提供定制化的虛擬試衣體驗,也能迎合服裝品牌宣傳需求,幫助品牌方以新穎的方式展示產(chǎn)品,提高商品成交率。
關(guān)鍵詞:AIGC;虛擬試衣;STM32F407微處理器;Stable Diffusion圖像生成工具;阿里云服務(wù)器;圖像采集;觸摸熱區(qū)
中圖分類號:TP368.1 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-1302(2025)07-00-06
0 引 言
在數(shù)字世界與物理世界日益融合的背景下,人工智能生成內(nèi)容(AIGC)正逐漸改變并可能顛覆現(xiàn)有的數(shù)字內(nèi)容創(chuàng)作和消費方式[1]。隨著消費需求的快速升級,傳統(tǒng)的線上服裝購物方式正面臨許多挑戰(zhàn)。對消費者而言,僅僅依據(jù)商家展示的服裝照片和其他簡單信息進(jìn)行選品,往往會出現(xiàn)選品困難、溝通時間長、收貨后不滿意、退換貨等問題,這不僅增加了消費者購物的時間成本,也讓許多消費者花了“冤枉錢”。對商家而言,貧乏的商品展示方式會大大增加與消費者的溝通時間,同時又很難使消費者充分了解“好衣物”的絕對價值,導(dǎo)致雙方更難達(dá)成交易。
由此可見,打造沉浸式的購物體驗正成為電商領(lǐng)域的發(fā)展趨勢。有數(shù)據(jù)顯示,沉浸式購物的轉(zhuǎn)化率平均值為70%,較行業(yè)平均水平提升了9倍,同比正常引導(dǎo)或交客單價提升超200%,同時商品退換貨率明顯降低[1]。
在這樣的情形下,“虛擬試衣”平臺的存在則有了必要性。它可以幫助用戶在線試穿衣物、讓用戶直觀地觀察到服裝的上身效果,使消費者更容易接觸到“好衣物”的絕對價值[2]。代入日常視角,選擇不同場合下的穿搭也需要時間成本,“虛擬試衣”可以輔助大眾最快速地做出搭配的決策,降低時間成本、豐富穿搭體驗。
1 系統(tǒng)功能分析與總體設(shè)計
1.1 系統(tǒng)功能分析
本文初步設(shè)計了一款基于AIGC技術(shù)的虛擬試衣系統(tǒng)。具體實現(xiàn)以下五個功能:
(1)鏡子模式:攝像頭傳感器采集環(huán)境圖像的實時數(shù)據(jù),然后將采集到的信息呈現(xiàn)在液晶顯示屏上。此時,顯示屏相當(dāng)于一面鏡子,能夠滿足用戶照鏡子的需求。
(2)照片拍攝:利用攝像頭拍攝上衣照片、下裝照片以及人體照片。
(3)虛擬衣柜:當(dāng)用戶想將實體服裝虛擬化時,可以在拍攝照片以后,將衣服的圖像保存至虛擬衣柜的上衣、下裝或人體三個模塊。
(4)虛擬試衣:用戶選擇人體照片以及需要更換的上衣和下裝后,系統(tǒng)調(diào)用AI合成試衣效果圖,并將結(jié)果顯示在液晶屏上。
(5)穿搭推薦:用戶在完成一次虛擬試衣后,可以為試衣結(jié)果打上各種標(biāo)簽,將其保存到穿搭庫中。在重要場合,用戶可以通過篩選標(biāo)簽,選擇合適的穿搭,節(jié)省決策成本。
1.2 系統(tǒng)功能設(shè)計框圖
本虛擬試衣系統(tǒng)的設(shè)計包含硬件和軟件兩個子系統(tǒng)。系統(tǒng)總體設(shè)計框圖如圖1所示。硬件子系統(tǒng)以正點原子探索者STM32F407開發(fā)板為核心,基于系統(tǒng)功能分析,把整個系統(tǒng)劃分成若干功能相關(guān)聯(lián)的模塊。采用模塊化開發(fā)方式,既能確保各模塊高效運行,又能降低工程開發(fā)難度。該硬件系統(tǒng)主要有存儲模組、WiFi通信模組、攝像模組、顯示模組等,在降低開發(fā)成本的同時保證了產(chǎn)品質(zhì)量。
軟件子系統(tǒng)包含基于阿里云部署的Stable Diffuison WebUI和GUI小程序。用戶可通過點擊觸摸熱區(qū)與GUI小程序交互,控制下位機的攝像頭采集圖像、視頻信息和其他數(shù)據(jù),再利用WiFi模塊將數(shù)據(jù)傳輸至阿里云服務(wù)器。然后,在Stable Diffusion WebUI界面選擇合適的生成式AI模型以及圖像生成參數(shù)以實現(xiàn)虛擬換衣[3],隨后將試衣結(jié)果保存在云端,通過WiFi傳輸至下位機的液晶顯示屏上,從而展示最終的試衣效果。
2 硬件模塊設(shè)計與實現(xiàn)
2.1 硬件框圖設(shè)計
系統(tǒng)硬件框圖設(shè)計如圖2所示。其中包括主控板、WiFi通信模組、SD存儲模組、攝像模組、LCD液晶顯示屏。
2.2 核心開發(fā)板
在本次系統(tǒng)開發(fā)中,選用正點原子的探索者STM32F407開發(fā)板作為核心開發(fā)板(實物如圖3所示)。此開發(fā)板以意法半導(dǎo)體的STM32F407ZGT6微控制器為核心,該微控制器基于高性能的ARM Cortex-M4處理器,配備浮點運算單元。而且,開發(fā)板具備多種優(yōu)勢:支持UART、SPI、I2C、ADC、CAN和USB等多種外設(shè);支持多種通信接口和協(xié)議;可擴展模塊和外設(shè)接口;擁有豐富的開發(fā)工具和在線資源[4],這些優(yōu)勢使其非常契合本系統(tǒng)的設(shè)計需求。
2.3 攝像模塊
攝像模塊主要借助CMOS或CCD傳感器來捕獲圖像,先是把光信號轉(zhuǎn)換為電信號,接著通過內(nèi)部電路將電信號轉(zhuǎn)化為數(shù)字信號。之后,運用顏色校正和白平衡調(diào)整等圖像處理算法完成數(shù)字圖像的處理。處理后的圖像數(shù)據(jù)會被壓縮和格式化,再經(jīng)由I2C、SPI或者USB等接口與主處理器通信,以傳輸圖像數(shù)據(jù)。
本系統(tǒng)借助OV2640攝像模塊實現(xiàn)圖像采集。該模塊具備8位數(shù)據(jù)接口,其控制協(xié)議為SCCB,I/O口電平為2.8 V LVTTL,能夠與3.3 V兼容,輸出像素尺寸可在UXGA標(biāo)準(zhǔn)值以下至40×30之間任意調(diào)整,輸出位寬為8位[5]。攝像模塊實物如圖4所示。
2.4 顯示模塊
顯示模塊借助背部光源來照亮液晶層。在電場的作用下,液晶層中的液晶分子會調(diào)整方向,從而對光線量進(jìn)行控制。每個像素背后的薄膜晶體管負(fù)責(zé)控制電壓,這種電壓的改變會使液晶排列發(fā)生變化,進(jìn)而調(diào)整透過的光量。像素點上的紅綠藍(lán)濾光片混合后便形成顏色??刂齐娐穼斎胄盘栠M(jìn)行處理,以此來控制屏幕上的像素點,最終展現(xiàn)出高清晰度圖像。
本系統(tǒng)采用4.3英寸的TFT LCD顯示屏,LCD驅(qū)動芯片為NT35510,接口為Intel8080-16位并口,分辨率為800×480;電容觸摸芯片為GT968,采取電容觸摸模式,最多支持5點同時觸摸,顏色格式為RGB565。顯示模塊實物如圖5所示。
2.5 存儲模塊
本系統(tǒng)使用32 GB的TF卡作為存儲模塊。TF卡使用非易失性閃存技術(shù)存儲數(shù)據(jù),能在斷電情況下保持?jǐn)?shù)據(jù)。插入設(shè)備后,通過內(nèi)置接口進(jìn)行數(shù)據(jù)的讀取和寫入。內(nèi)部控制器管理數(shù)據(jù)存儲和訪問,確保數(shù)據(jù)正確性。由于TF卡采用標(biāo)準(zhǔn)化設(shè)計,適用于多種設(shè)備,可作為開發(fā)板的外設(shè)之一。存儲模塊實物如圖6所示。
2.6 傳輸模塊
傳輸模塊通過無線電波在設(shè)備與網(wǎng)絡(luò)間傳輸數(shù)據(jù)。模塊接收來自設(shè)備的數(shù)字信號,將其轉(zhuǎn)換為無線電波,并通過微型天線發(fā)射。接收時,它捕捉無線電波,轉(zhuǎn)換回數(shù)字信號供設(shè)備使用。模塊通過特定頻段(如2.4 GHz或5 GHz)進(jìn)行通信,支持無線網(wǎng)絡(luò)標(biāo)準(zhǔn)如802.11b/g/n/ac。通過這種方式,WiFi模塊連接設(shè)備與互聯(lián)網(wǎng)或其他網(wǎng)絡(luò),實現(xiàn)遠(yuǎn)程數(shù)據(jù)傳輸。
本文采用ATK-ESP8266 WiFi傳輸模塊,支持802.11 b/g/n網(wǎng)絡(luò)標(biāo)準(zhǔn),具有WiFi STA/AP/STA+AP三種工作模式[6]。傳輸模塊實物如圖7所示。
2.7 硬件系統(tǒng)實物
將各個外設(shè)模塊連接到核心開發(fā)板后即可得到硬件系統(tǒng)。硬件系統(tǒng)的實物如圖8所示。
3 系統(tǒng)軟件設(shè)計與實現(xiàn)
3.1 初始化界面設(shè)計
本系統(tǒng)的液晶顯示屏負(fù)責(zé)接收來自核心處理器STM32F407傳輸?shù)臄?shù)據(jù)。上電后,屏幕顯示初始化界面,用戶點擊相應(yīng)觸摸熱區(qū),選擇進(jìn)入“鏡子模式”“試衣模式”“選擇衣裝”以及“試衣結(jié)果”這四個功能界面。該部分程序基于C語言編程實現(xiàn)。該部分的整體系統(tǒng)流程如圖9所示,初始化界面如圖10所示。
3.2 各功能界面設(shè)計
3.2.1 鏡子模式
用戶點擊初始化界面中的“鏡子模式”進(jìn)入該功能界面后,攝像頭將實時采集到的環(huán)境圖像信息顯示在液晶屏幕上,此時液晶顯示屏成為一塊數(shù)字化的鏡子,可供用戶實時觀察試衣效果,用戶可通過點擊屏幕右下角退出該模式。該功能界面整體操作流程如圖11所示,界面展示如圖12所示。
3.2.2 試衣模式
用戶進(jìn)入初始化界面中的“試衣模式”功能界面后,若繼續(xù)點擊“拍攝上衣”“拍攝下裝”“拍攝人體”這三個子界面,就能通過點擊實體按鍵,操控攝像頭拍攝對應(yīng)的上衣、下裝、人體照片并保存。拍攝成功后,蜂鳴器會短鳴提示,此時用戶可點擊“回主菜單”退出該模式。該功能界面的整體操作流程如圖13所示,界面展示如圖14所示,按鍵反饋界面如圖15所示。
3.2.3 選擇衣裝
用戶點擊初始化界面中的“選擇衣裝”進(jìn)入該功能界面后,繼續(xù)點擊“選擇上衣/下裝/人體”三個子界面,則可通過按鍵確定將心儀的上衣、下裝、人體照片上傳至云端待AI合成,用戶可點擊“回主菜單”退出該模式。該功能界面的整體操作流程如圖16所示,界面展示如圖17所示,按鍵反饋界面如圖18所示。
3.2.4 試衣結(jié)果
上位機在云端合成試衣結(jié)果,并將其保存至云服務(wù)器,試衣結(jié)果傳輸至下位機后,用戶點擊初始化界面中的“試衣結(jié)果”進(jìn)入該功能界面,則可通過按鍵翻頁查看AI生成的試衣結(jié)果。用戶點擊屏幕右下角則可返回初始界面。該功能界面的操作流程如圖19所示,結(jié)果實例如圖20所示。
3.3 AI圖像生成平臺
3.3.1 阿里云服務(wù)器
本系統(tǒng)以Stable Diffusion作為核心的AI圖像生成工具,該工具具有開源、可塑性強的特點,但對本地計算機的硬件配置要求過高,因此本系統(tǒng)使用阿里云平臺的FC函數(shù)計算和NAS存儲空間作為中間平臺[7],基于阿里云在云端部署Stable Diffusion WebUI[8],保證系統(tǒng)可以在大多數(shù)配置一般的計算機上運行。阿里云的系統(tǒng)后臺及資源信息如圖21和圖22所示。
3.3.2 Stable Diffuson WebUI
本系統(tǒng)在云端部署Stable Diffusion WebUI,其工作界面、文件系統(tǒng)如圖23和圖24所示,下位機上傳的上衣、下裝、人體照片將作為AI圖像合成的基本素材,用戶在該界面選擇AI模型后,可輸入提示詞、訓(xùn)練步數(shù)等具體參數(shù),并在輸出窗口觀察最終的合成結(jié)果[9]。阿里云提供了豐富的AI模型供用戶選擇,模型庫界面如圖25所示。
4 創(chuàng)新點分析
4.1 便捷省時
本系統(tǒng)以虛擬試衣技術(shù)取代傳統(tǒng)實體試衣,極大地提升了試衣的便捷性與效率。具體而言,用戶僅需使用系統(tǒng)拍攝所選衣物與自身照片,系統(tǒng)就能依靠先進(jìn)的AI模型生成衣物上身效果圖。此過程既節(jié)省了用戶在試衣間來回?fù)Q衣的時間,又減少了因尺寸或風(fēng)格問題造成的退換貨麻煩,讓購物體驗更具個性化和高效性。借助這種方式,用戶可隨時隨地進(jìn)行試衣,突破了傳統(tǒng)購物的時空限制,進(jìn)一步優(yōu)化了用戶體驗。
4.2 個性交互
在本系統(tǒng)的幫助下,用戶可以通過觸屏操作的方式將包括上衣、下裝在內(nèi)的衣物數(shù)字化,建立用戶專屬的虛擬衣柜,同時用戶可以保存心儀的穿搭結(jié)果,并給不同穿搭結(jié)果設(shè)立穿搭標(biāo)簽,進(jìn)而可以提前做好穿搭策略,方便在未來的各個情境下最快速地做出合適的穿搭決策。此外,系統(tǒng)通過用戶歷史的選擇和偏好,智能推薦搭配方案,進(jìn)一步增強個性化體驗,提升用戶滿意度。
4.3 市場適應(yīng)
本系統(tǒng)具有多方面的優(yōu)勢。首先,它能夠提供定制化的虛擬試衣體驗,適應(yīng)多樣化的服裝選擇與風(fēng)格。其次,該系統(tǒng)能積極響應(yīng)服裝品牌方的營銷訴求,助力他們以新穎的方式展示產(chǎn)品,從而提高商品成交率。這些優(yōu)勢使系統(tǒng)具有很強的市場適應(yīng)性,在復(fù)雜多變的市場環(huán)境中能夠保持競爭力,吸引大量用戶。此外,系統(tǒng)還能針對不同消費群體和市場趨勢進(jìn)行靈活調(diào)整,提供更為精準(zhǔn)的市場分析和產(chǎn)品推薦,幫助品牌更高效地進(jìn)行市場定位。
5 結(jié) 語
本文闡述了虛擬試衣系統(tǒng)的設(shè)計與實現(xiàn)過程。該系統(tǒng)以STM32F407微處理器為核心,融合了AIGC技術(shù),將軟硬件系統(tǒng)設(shè)計相結(jié)合。這一系統(tǒng)有效解決了服裝購物過程中的選品困難、購物體驗缺乏沉浸感等問題,極大地改善了線上服裝購物體驗,還為服裝商家提供了商品線上展示的新途徑,是AI賦能實體行業(yè)的創(chuàng)新應(yīng)用[10]。隨著AIGC技術(shù)的不斷發(fā)展與應(yīng)用,虛擬試衣系統(tǒng)定將改變傳統(tǒng)的服裝購物模式,給消費雙端提供更多便利性。
參考文獻(xiàn)
[1] 國通信研究院,京東探索研究院.人工智能生成內(nèi)容(AIGC)白皮書[EB/OL].(2022-09) . http: //www.cbdio.com/BigData/2022-09/04 / content_ 6170457.htm.
[2] 王京晶.虛擬試衣技術(shù)[J].中國藝術(shù),2023(6):114.
[3] 陳英,馬洪濤. AIGC在藝術(shù)設(shè)計專業(yè)領(lǐng)域的神助攻——以Stable Diffusion為例[J].服裝設(shè)計師,2024(1):73-84.
[4] ST半導(dǎo)體公司. STM32F407ZET6數(shù)據(jù)手冊[EB/OL]. [2022-07-20]. https://pdf1. Alldatasheetcn.com/datasheet-pdf/view/556789/STMICROELECTRONICS/STM32F407ZET6.html.
[5] Omnivisioin Technology. OV2640 Datasheet [EB/OL]. https://pdf1.alldatasheetcn.com/datasheet-pdf/view/312407/OMNIVISION/OV2640.html.
[6] ESPRESSIF. ESP8266 Datasheet [EB/OL]. https://pdf1.alldatasheetcn. com/datasheet-pdf/view/1132995/ESPRESSIF/ESP8266. html.
[7] 張建源,王秀華.基于附網(wǎng)數(shù)據(jù)存儲技術(shù)(NAS)實現(xiàn)企業(yè)數(shù)據(jù)高效安全存儲應(yīng)用的研究[J].軟件,2023,44(12):94-98.
[8] 鄭凱,王菂.人工智能在圖像生成領(lǐng)域的應(yīng)用——以Stable Diffusion和ERNIE-ViLG為例[J].科技視界,2022(35):50-54.
[9] 薛山.人工智能加持!Blender+StableDiffusion組合教學(xué)[N].電腦報,2024-01-08(11).
[10] 許雪晨,田侃,李文軍.新一代人工智能技術(shù)(AIGC):發(fā)展演進(jìn)、產(chǎn)業(yè)機遇及前景展望[J].產(chǎn)業(yè)經(jīng)濟評論,2023(4):5-22.
收稿日期:2024-04-30 修回日期:2024-05-29
基金項目:湖南省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目:基于AIGC技術(shù)的“虛擬試衣”交互平臺(1739)