• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于主成分分析的電影數(shù)據(jù)研究

    2019-12-16 02:57:56張超
    電腦知識(shí)與技術(shù) 2019年30期
    關(guān)鍵詞:主成分分析數(shù)學(xué)模型

    張超

    摘要:為了綜合分析電影數(shù)據(jù),本文通過工具SPSS19.0,運(yùn)用主成分分析方法,對(duì)樣本進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,建立了對(duì)應(yīng)的數(shù)學(xué)模型,希望為電影制作方和影院提供一定的參考。

    關(guān)鍵詞:主成分分析;數(shù)學(xué)模型;SPSS

    中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A

    文章編號(hào):1009-3044(201 9)30-0001-02

    1概述

    隨著涌現(xiàn)出很多優(yōu)秀并且龐大的電影量,一部電影又包含了眾多的屬性,這些不同的屬性引起的效應(yīng)大小各異。基于龐大的電影數(shù)據(jù),就需要我們用計(jì)算機(jī)來處理和分析,來減少人工工作量,獲得我們想要的信息。本文使用主成分分析方法,對(duì)電影數(shù)據(jù)進(jìn)行綜合統(tǒng)計(jì)分析,希望可以為電影制片方合理分配資源和影院排片提供一定的參考。

    3實(shí)驗(yàn)數(shù)據(jù)

    本文實(shí)驗(yàn)采用了50部電影數(shù)據(jù),其來源于豆瓣網(wǎng)站,包含了導(dǎo)演影響指數(shù)、明星指數(shù)、評(píng)分、片長、是否黃金周、影片類型、是否續(xù)集、想看人數(shù)、制作地區(qū)、票房收入共10個(gè)屬性。其中影片類型和制作地區(qū)數(shù)據(jù)不能直接使用,必須先轉(zhuǎn)換為數(shù)值類型,本文采用最基本的分類標(biāo)記,對(duì)制作地區(qū)中國大陸標(biāo)記為1,香港標(biāo)記為2,美國標(biāo)記為3,印度標(biāo)記為4。同理對(duì)影片類型進(jìn)行標(biāo)記。通過這種簡單的數(shù)值標(biāo)記能確保這兩個(gè)變量能進(jìn)人數(shù)據(jù)分析。

    4主成分分析過程

    本文使用從豆瓣電影搜集的票房相關(guān)數(shù)據(jù)進(jìn)行分析,借助數(shù)據(jù)統(tǒng)計(jì)分析工具SPSS19.0對(duì)樣本數(shù)據(jù)進(jìn)行主成分分析,分析步驟:首先加載數(shù)據(jù):文件一打開一數(shù)據(jù)一選擇本地?cái)?shù)據(jù)。然后分析數(shù)據(jù):分析一降維一因子分析。獲得輸出結(jié)果如下表1、2所示:

    由表1結(jié)果可知,在本例中,成份1、2、3和4的特征值大于1,他們累計(jì)貢獻(xiàn)率達(dá)到70.21%,還算不錯(cuò),所以我們通過主成分分析,可以提取4個(gè)主要成份,轉(zhuǎn)換后的這4個(gè)綜合指標(biāo)可以大致反映原始數(shù)據(jù)。

    使用spss數(shù)據(jù)分析軟件對(duì)電影票房數(shù)據(jù)進(jìn)行分析,從中提取出了4個(gè)主要成份,從表2可知導(dǎo)演影響指數(shù)、評(píng)分、片長和想看人數(shù)在第一主成份具有較高載荷,明星指數(shù)和是否續(xù)集在第二主成份具有較高載荷,第三主成份上沒有反映出較高載荷的指標(biāo),第四主成份主要反映了是否黃金周這一個(gè)指標(biāo)信息。

    用成份矩陣中一個(gè)主成分對(duì)應(yīng)的數(shù)值,與主成分相對(duì)應(yīng)特征值平方根的商,計(jì)算出的數(shù)值便是一個(gè)主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù),便得到4個(gè)主成分的數(shù)學(xué)模型如下:

    5結(jié)束語

    本文通過主成分分析數(shù)據(jù)分析方法,使用spss軟件分析數(shù)據(jù),提取了4個(gè)主成分,他們累計(jì)貢獻(xiàn)率達(dá)到70.21%,轉(zhuǎn)換后的這4個(gè)綜合指標(biāo)可以大致反映原始數(shù)據(jù),并且建立了綜合數(shù)學(xué)模型,對(duì)于電影的綜合評(píng)價(jià)分析具有一定的參考意義。但由于實(shí)驗(yàn)數(shù)據(jù)面窄,某些重要的特征屬性無法獲取,這些因素對(duì)綜合分析電影數(shù)據(jù)都有一定的幫助,未來通過搜集更全面的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行改進(jìn)。

    猜你喜歡
    主成分分析數(shù)學(xué)模型
    AHP法短跑數(shù)學(xué)模型分析
    活用數(shù)學(xué)模型,理解排列組合
    主成分分析法在大學(xué)英語寫作評(píng)價(jià)中的應(yīng)用
    江蘇省客源市場影響因素研究
    SPSS在環(huán)境地球化學(xué)中的應(yīng)用
    考試周刊(2016年84期)2016-11-11 23:57:34
    對(duì)一個(gè)數(shù)學(xué)模型的思考
    長沙建設(shè)國家中心城市的瓶頸及其解決路徑
    古塔形變的數(shù)學(xué)模型
    河南科技(2014年5期)2014-02-27 14:08:47
    广宗县| 合水县| 滁州市| 阿城市| 泰安市| 高州市| 荔浦县| 朔州市| 壤塘县| 通河县| 横峰县| 甘洛县| 永康市| 义乌市| 麦盖提县| 岳普湖县| 灵山县| 宜阳县| 界首市| 涪陵区| 抚松县| 平塘县| 合水县| 哈密市| 卓尼县| 徐汇区| 仙游县| 瑞金市| 丹巴县| 金门县| 廉江市| 定远县| 固始县| 临江市| 万载县| 肃南| 余干县| 方山县| 宁城县| 玉屏| 宜川县|