楊浩然
摘要:本文應用了pandas算法對附件進行數(shù)據(jù)清洗,建立基于熵權法的權重分析模型分析因素對不同品牌電動汽車的銷售的影響,從而得出目標客戶購買電動汽車的可能性。首先需要對數(shù)據(jù)進行數(shù)據(jù)清洗,將數(shù)據(jù)分為兩個部分,利用Excel對各項指標的進行均值計算,然后用ACSI模型進行滿意度分析,構建滿意度的數(shù)學關系式,篩選出所有有意愿購買電動汽車的客戶,將各品牌銷售的綜合分數(shù)則作為因變量,建立基于熵權法的權重分析模型,權重越大,則評分越高,得出a1,a2,B12,B13,B15,B17等因素對不同品牌電動汽車的銷售有影響,其中B17的權重最大,其影響則為最大。
關鍵詞:pandas 法;熵權法;相關性分析
1 引言
汽車產(chǎn)業(yè)是國民經(jīng)濟的重要支柱產(chǎn)業(yè),而新能源汽車產(chǎn)業(yè)是戰(zhàn)略性新興產(chǎn)業(yè)。大力發(fā)展以電動汽車為代表的新能源汽車是解決能源環(huán)境問題的有效途徑,市場前景廣闊。但是,電動汽車畢竟是一個新興的事物,與傳統(tǒng)汽車相比,消費者在一些領域,如電池問題,還是存在著一些疑慮,其市場銷售需要科學決策。
2 問題分析
針對該問題,首先需要對數(shù)據(jù)進行數(shù)據(jù)清洗,應用 Python 的強大的 pandas 處理,找出異常值,利用均值插值法對異常值進行處理,同時將 B7 的空值全部取值為 0。我們將數(shù)據(jù)分為兩個部分,分別是汽車的滿意度打分,一個是問卷調查數(shù)據(jù),將數(shù)據(jù)進行處理后,進行均值處理,然后進行滿意度分析,最后利用 spss 進行描述性統(tǒng)計分析。篩選出所有有意愿購買電動汽車的客戶,然后導入 spss 進行相關性分析得出的相關性,然后根據(jù)相關性分析的結果,篩選出 11 個影響因子,然后根據(jù)這些影響因子建立基于熵權法的權重分析模型,對影響各品牌銷售的進行綜合評分,因子的權重越大,則對評分影響就越大,分析各個因子的權重,得出影響各品牌銷售的因素。
3 數(shù)據(jù)清洗與分析
附件中的數(shù)據(jù)有異常值與缺失值,所以我們需要對數(shù)據(jù)進行處理。我們首先需要對數(shù)據(jù)進行數(shù)據(jù)清洗,應用 Python 的強大的 pandas 處理,找出異常值,利用均值插值法對異常值進行處理,同時將 B7 的空值全部取值為 0。我們將數(shù)據(jù)分為兩個部分,分別是汽車的滿意度打分,一個是問卷調查數(shù)據(jù),將數(shù)據(jù)進行處理后,進行均值處理,然后進行滿意度分析,最后利用 spss 進行描述性統(tǒng)計分析,可以得出部分異常值如下所示:
4 滿意度分析
我們應用 ACSI 模型進行滿意度分析,首先構建滿意度的數(shù)學關系式:
分析 a1-a8 的每列打分的平均值,以及這 8 列的總體平均分,其數(shù)學描述如下:
我們應用 Python 進行編程計算得出的結果如下表所示:
根據(jù)表 2可得,三個品牌在群眾中的滿意度分別是 77.45%,77.37%,78.54%,由此可以得出 3 品牌的滿意度更高。
5基于熵權法的權重分析模型
本文選用熵權法對一級指標進行權重的確定。首先這十個影響因子的數(shù)據(jù),對各個危險因素的重要性進行評價與測度,以熵權法進行權重[4]的計算,主要步驟與計算邏輯如下:
由于各項指標的計量單位并不統(tǒng)一,因此在用它們計算綜合指標前,先要進行標準化處理,即把指標的絕對值轉化為相對值,從而解決各項不同質指標值的同質化問題。
另外,正向指標和負向指標數(shù)值代表的含義不同(正向指標數(shù)值越高越好,負向指標數(shù)值越低越好),因此,對于正向負向指標需要采用不同的算法進行數(shù)據(jù)標準化處理:正向指標
6 結論分析
表2可得,a1,a2,B12,B13,B15,B17 等因素是對 Q 存在影響的,則 a1,a2,B12,B13,B15,B17 等因素對不同品牌電動汽車的銷售有影響,其中 B17 的權重最大,為 0.46,其影響則為最大。
參考文獻:
[1]歐陽元東,基于 Python 的網(wǎng)站數(shù)據(jù)爬取與分析的技術實現(xiàn)策略[J],電腦知識與技術 . 2020,16(13).
[2]Python 數(shù)據(jù)分析中的數(shù)據(jù)整理探討[J]. 張向偉. ?電子世界. ?2021(11)
[3]基于 Python 的數(shù)據(jù)分析[J]. 李俊華. 電子技術與軟件工程. 2018(17)
[4]張 虹、莊文英,基于創(chuàng)新能力的小微企業(yè)活力指數(shù)體系研究[J],Business Management,商業(yè)經(jīng)濟研究 2019 年 16 期
[5]張軍.算法設計與分析[M].清華大學出版社.2011.8.P100-P215