求文星,李 超
(安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
隨著人工智能技術(shù)的發(fā)展,以現(xiàn)代化工業(yè)為主要依托的機(jī)器人技術(shù)越來越多地應(yīng)用于軍事國防、科教文娛等領(lǐng)域,形成獨(dú)立學(xué)科,一個智能機(jī)器人改變制造模式和生活模式的時(shí)代已經(jīng)到來。人工智能對各行各業(yè)都有重要應(yīng)用,學(xué)者對于智能機(jī)器人的發(fā)展前景普遍持樂觀態(tài)度,認(rèn)為其發(fā)展方向多維且潛力巨大。楊娟、陳小紅[1]等認(rèn)為,智能機(jī)器人市場需求持續(xù)增加,機(jī)器人與信息技術(shù)深度融合,向模塊化、智能化和系統(tǒng)化方向發(fā)展;石征、吳難[2]等認(rèn)為,機(jī)器人性能將不斷提高,控制系統(tǒng)不斷完善,傳感器融合技術(shù)不斷成熟,向著仿生性方向發(fā)展。
本文通過對智能機(jī)器人國內(nèi)、安徽省發(fā)展現(xiàn)狀以及相關(guān)研究的梳理[3~5],以供給和需求作為切口,通過實(shí)地問卷調(diào)查和網(wǎng)上數(shù)據(jù)爬取,采用機(jī)器學(xué)習(xí)的方法,進(jìn)行線上線下家用智能機(jī)器人消費(fèi)研究。具體而言,線下主要針對安徽省蚌埠市區(qū)居民,調(diào)查其對家用智能機(jī)器人消費(fèi)意愿和需求類型;線上主要針對大型網(wǎng)購平臺京東商城的消費(fèi)數(shù)據(jù),分析現(xiàn)階段家用智能機(jī)器人熱銷類型及體驗(yàn)評價(jià),為相關(guān)企業(yè)、研發(fā)部門有關(guān)家用智能機(jī)器人的種類研發(fā)、功能探索提供一定借鑒,打造更好的智能家居生活服務(wù),以滿足人民日益增長的中高端消費(fèi)和個性化消費(fèi)等消費(fèi)升級需求。
1.調(diào)查對象
問卷調(diào)查主要針對蚌埠市區(qū)(不包括三縣)四個區(qū)12個鄉(xiāng)、鎮(zhèn)、街道市民,采用區(qū)域分層取樣與多階段抽樣中的三階段抽樣相結(jié)合的抽樣方法,根據(jù)預(yù)調(diào)研有效問卷回收率90%,并結(jié)合實(shí)際的調(diào)查情況和團(tuán)隊(duì)的人力物力資本,以及理論計(jì)算所得的樣本容量410份,考慮問卷損壞、無效等人為因素,確定最終問卷量為450份。在調(diào)查過程中已進(jìn)行人為篩選,主動挑選對家用智能機(jī)器人感興趣的人群進(jìn)行訪問。
網(wǎng)購數(shù)據(jù)主要是從最大的網(wǎng)購平臺之一——京東商城,以“家用智能機(jī)器人”為關(guān)鍵詞爬取相關(guān)商品信息,共4 082個產(chǎn)品,228 960條評論。
2.調(diào)查方法
此次調(diào)查主要采取線上線下相結(jié)合的方式,并根據(jù)各階段不同目標(biāo)運(yùn)用四種調(diào)研方法。具體調(diào)查方法如下:(1)文案調(diào)研。為了解當(dāng)代最新家用智能機(jī)器人類型、功能[6~18],在中國知網(wǎng)、維普等中、外文檢索庫中,搜索與之相關(guān)的文獻(xiàn),進(jìn)行研讀總結(jié),得出研究框架并設(shè)計(jì)問卷。(2)預(yù)調(diào)研法。為減小誤差和保證問卷具有較好的信度和效度,采取街頭攔截面訪。結(jié)合調(diào)查中出現(xiàn)的問題、受訪者建議對問卷進(jìn)行修改完善,以確定最終問卷。(3)實(shí)地調(diào)研。為保證研究的真實(shí)有效性,調(diào)查主要采取實(shí)地訪談。按各區(qū)域樣本量的分配,在公共場所隨機(jī)攔截志愿者做訪問。(4)數(shù)據(jù)爬蟲。為了解全國消費(fèi)者對家用智能機(jī)器人的消費(fèi)需求,綜合考慮各種因素,選取了較具代表性的京東網(wǎng)購平臺,爬取相關(guān)數(shù)據(jù),進(jìn)行整理分析、歸納總結(jié),作為對實(shí)地調(diào)研的重要補(bǔ)充。
3.數(shù)據(jù)整理
采用機(jī)器學(xué)習(xí)方法“決策樹”填補(bǔ)缺失值,并利用信度檢驗(yàn)和效度檢驗(yàn)來檢測問卷設(shè)計(jì)的合理性。通過相關(guān)統(tǒng)計(jì)軟件的計(jì)算,克朗巴哈系數(shù)為0.920,KMO值為0.716,Bartlett檢驗(yàn)的p值為0.000<0.05,說明此次調(diào)查問卷信度較好,具有結(jié)構(gòu)效度。
1.樣本概況
表1樣本基本情況分布表
受訪對象中女性稍多于男性,女性通常在家居配置方面擁有更多的決策權(quán),因此側(cè)重于考慮女性的意見;主要的年齡群體為21-30歲,該群體將會是家用智能機(jī)器人消費(fèi)的主力軍;婚姻情況中,大部分家庭構(gòu)成較為龐大,對家居服務(wù)有更多元化的需求;調(diào)查對象整體學(xué)歷水平較高,符合社會現(xiàn)階段及未來的發(fā)展趨勢;關(guān)于職業(yè),就業(yè)者和即將就業(yè)的學(xué)生達(dá)90%;居住狀況中,大部分屬于大家庭生活。由此可見受訪群體都比較貼合本次調(diào)研的要求。
2.消費(fèi)意愿
圖1 線下購買意愿圖
此次調(diào)查中(如圖1),僅有28.04%的受訪群體表明有購買意愿。由于調(diào)查設(shè)于經(jīng)濟(jì)水平較低的蚌埠市,群眾對家用智能機(jī)器人的消費(fèi)潛力有待挖掘,此意愿分布亦符合實(shí)際情況。為進(jìn)行各省市家用智能機(jī)器人潛在消費(fèi)能力推廣探索,以調(diào)查中的個人屬性、家庭屬性和了解情況三個大類9項(xiàng)細(xì)化指標(biāo)作為自變量,消費(fèi)意愿作為因變量,構(gòu)造預(yù)測模型。采用logistic回歸、決策樹、隨機(jī)森林和支持向量機(jī)以及混合模型等機(jī)器學(xué)習(xí)方法進(jìn)行模型構(gòu)造,擇其最優(yōu),并篩選影響顯著的因素?;旌夏P褪侵妇C合決策樹、隨機(jī)森林和支持向量機(jī)三個模型,以少數(shù)服從多數(shù)的規(guī)則來確定預(yù)測結(jié)果。
五類模型預(yù)測準(zhǔn)確率見表2:
表2 預(yù)測準(zhǔn)確率結(jié)果表
所有模型中,隨機(jī)森林模型的預(yù)測效果是最好。同時(shí),探究對隨機(jī)森林模型預(yù)測效果影響最大的因素。
圖2 消費(fèi)意愿的隨機(jī)森林模型影響因素
影響因素分析圖中分別顯示了mean decrease accuracy和mean decrease gini兩個指標(biāo)值。mean decrease accuracy是直接測量每種特征對模型預(yù)測準(zhǔn)確率的影響,指標(biāo)值越大,影響越大。mean decrease gini是基于節(jié)點(diǎn)不純度降低的特征選擇,該值越大表示該變量的重要性越大。從消費(fèi)意愿的隨機(jī)森林模型中,可知,“性別”的兩指標(biāo)值均最大,說明“性別”是所有變量中最重要的,同時(shí)也是對預(yù)測準(zhǔn)確性影響最大的。“戶籍”的mean decrease accuracy指標(biāo)值最小,即“戶籍”對模型預(yù)測準(zhǔn)確性影響最小;“職業(yè)”的mean decrease gini值最小,即重要性程度最低。
3.需求類型
圖3 線上線下需求類型對比條形圖
對比線上線下的需求類型(如圖3),線上主要消費(fèi)類型為兒童陪伴型;線下主要需求類型為家政服務(wù)型,其他類型占比相對均衡。線下數(shù)據(jù)主要表現(xiàn)了受訪對象想要購買的機(jī)器人類型;而線上數(shù)據(jù)則表明,在實(shí)際購買時(shí),消費(fèi)群體往往選擇購買兒童陪伴型機(jī)器人,對比可得,大眾群體往往更愿意為孩子花錢。
以相同的細(xì)化指標(biāo)作為自變量,對需求類型(選擇哪一類型機(jī)器人)分別構(gòu)造五類預(yù)測模型。預(yù)測準(zhǔn)確率見表3:
表3 預(yù)測準(zhǔn)確率結(jié)果表
隨機(jī)森林模型的預(yù)測效果最好,進(jìn)行影響因素分析。由于文章篇幅有限,整理六類家用智能機(jī)器人隨機(jī)森林模型的關(guān)鍵因素(見表4)。兒童陪伴型和教學(xué)輔導(dǎo)型,“婚姻狀況”因素對預(yù)測效果影響較大,重要程度最高,“收入”的影響程度較低,“戶籍”的重要性最低。老人陪伴與看護(hù)型和殘助型均是“居住狀況”因素影響最大,重要性較高,其中老人看護(hù)型模型是“戶籍”影響程度最低,最不重要,而殘助型則是“了解程度”影響最小,最不重要。住宅安全與監(jiān)視型和家政服務(wù)型,“年齡”影響最大,較重要,“戶籍”影響最小,最不重要。
表4隨機(jī)森林模型關(guān)鍵因素表
4.體驗(yàn)評論
對于網(wǎng)購數(shù)據(jù)的體驗(yàn)評價(jià),采用文本分析。關(guān)于網(wǎng)購評價(jià)的詞頻共現(xiàn)(見表5),與“機(jī)器人”關(guān)聯(lián)最緊密的詞匯為“智能”“學(xué)習(xí)”“功能”;與“質(zhì)量”“功能”“服務(wù)”“物流”聯(lián)系最緊密的詞匯均為積極詞匯,網(wǎng)購群體大部分認(rèn)為現(xiàn)階段消費(fèi)的智能機(jī)器人質(zhì)量較好,功能強(qiáng)大、齊全,客服熱情周到,物流比較快、很給力。
表5 評論詞頻共現(xiàn)表
圖4 評論詞云圖
對所有的消費(fèi)評論進(jìn)行刪除停用詞、提取關(guān)鍵詞、繪制詞云圖(如圖4),發(fā)現(xiàn)好評居多,均為積極評價(jià)詞,還有一些“愛不釋手”“齊全”“豐富”等體驗(yàn)評價(jià),都體現(xiàn)了家長和孩子對兒童陪伴型智能機(jī)器人非常滿意。
5.未來展望
采用主題建模和情感分析對問卷中未來展望的主觀題進(jìn)行文本挖掘。對于問卷中“對智能機(jī)器人未來十年的發(fā)展看法”的主題建模,概括得出如下三個主題(見表6):一是人類社會在不久將來是智能時(shí)代,機(jī)器人的使用會更常見;二是人們對科技的發(fā)展有一定的需求;三是人也將越來越懶。
表6 未來展望主題詞
圖5 理由詞頻條形圖
情感分析中(如圖5),頻數(shù)最大的十個詞匯中,“不夠”“難題”“未知”三個消極詞均出現(xiàn)兩次,“成熟”“成為”“發(fā)達(dá)”“發(fā)展”“進(jìn)步”“希望”和“迅速”七個積極詞匯,“發(fā)展”出現(xiàn)六次,“發(fā)達(dá)”和“進(jìn)步”出現(xiàn)四次,其余均出現(xiàn)兩次。無論從積極詞、消極詞占比,還是從兩類詞出現(xiàn)次數(shù),都表明受訪對象對家用智能機(jī)器人未來發(fā)展持積極的態(tài)度。
本次市場調(diào)查分線上線下兩部分,線下以蚌埠市區(qū)居民為調(diào)查對象,從消費(fèi)需求的角度探索了關(guān)于家用智能機(jī)器人的消費(fèi)意愿、需求類型和未來展望,線上以智能機(jī)器人網(wǎng)購數(shù)據(jù)為分析內(nèi)容,從供給市場角度探索了現(xiàn)階段的智能機(jī)器人市場、熱銷機(jī)器人類型、產(chǎn)品體驗(yàn)評價(jià)等?;诒疚姆治?,提出幾點(diǎn)相應(yīng)的建議:
第一,現(xiàn)階段實(shí)地調(diào)查中最愿意購買的是家政服務(wù)型機(jī)器人,而網(wǎng)購數(shù)據(jù)顯示購買最多的是兒童智能陪伴型機(jī)器人。目前智能機(jī)器人市場總需求大但有效需求不足,由于現(xiàn)有產(chǎn)品智能化程度不夠,功能類型單調(diào),人機(jī)交互體驗(yàn)效果不佳,企業(yè)研發(fā)部門急需突破技術(shù)瓶頸,可以針對以上的技術(shù)瓶頸采取些許有效措施。
第二,所有機(jī)器學(xué)習(xí)方法構(gòu)建的預(yù)測模型中,隨機(jī)森林模型的預(yù)測效果最好??蛇M(jìn)一步將預(yù)測效果最好的隨機(jī)森林模型推廣應(yīng)用于全國各省市,預(yù)測全國各地的各類家用智能機(jī)器人的有效需求,為企業(yè)市場部門提供一定的參考,進(jìn)一步擴(kuò)大市場。
第三,企業(yè)銷售部門可參考隨機(jī)森林模型的重要影響因素,從用戶需求個性化、創(chuàng)新化、多樣化等特點(diǎn)出發(fā),加強(qiáng)對智能機(jī)器人行業(yè)的知識學(xué)習(xí),加大市場調(diào)研的深度與廣度,提高產(chǎn)品與需求之間的匹配度,深刻把握市場動向,推陳出新。
第四,人們對智能機(jī)器人未來發(fā)展大多持積極看好的態(tài)度,認(rèn)為存在較大的市場需求。政府部門應(yīng)當(dāng)高度重視智能機(jī)器人產(chǎn)業(yè)的發(fā)展,根據(jù)設(shè)定的戰(zhàn)略目標(biāo)制定相關(guān)政策,提供有效的市場監(jiān)管和安全保障,加大對相關(guān)產(chǎn)業(yè)的投資和扶持力度,完善與新興企業(yè)間的溝通機(jī)制,打造開放高效的協(xié)同體系。
湖北科技學(xué)院學(xué)報(bào)2020年2期