• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于python+pandas的數(shù)據(jù)分析處理應(yīng)用

    2018-12-24 15:06:05何春燕王超宇成都理工大學(xué)
    數(shù)碼世界 2018年7期
    關(guān)鍵詞:程序段用戶數(shù)面向?qū)ο?/a>

    何春燕 王超宇 成都理工大學(xué)

    1.引言

    Python是一種面向?qū)ο蟮哪_本語言,自20世紀(jì)90年代初誕生到現(xiàn)在,已經(jīng)被廣泛應(yīng)人工智能,機(jī)器學(xué)習(xí),大數(shù)據(jù)等方面。python語法簡單,容易理解和上手。無論安裝還是使用python都不需要付費(fèi)。python是一種面向?qū)ο蟮恼Z言,同時(shí)也支持面向過程?;谒拈_源的本質(zhì),python可在許多平臺(tái)上使用,包括Windows,Linux等。python有強(qiáng)大的標(biāo)準(zhǔn)庫和豐富的第三方庫。.

    Pandas被廣泛運(yùn)用于金融、統(tǒng)計(jì)以及社會(huì)科學(xué)領(lǐng)域的數(shù)據(jù)處理。

    2.Pandas處理數(shù)據(jù)

    2.1 數(shù)據(jù)導(dǎo)入

    程序段1:

    從mangoDB讀取用戶表

    import pandas as pd

    from pymongo import MongoClient

    host = ‘0.0.0.0’# 配置 MongoDB 連接信息

    port = 27019

    client = MongoClient(host=host, port=port)

    collenction =‘user’

    cursor = db[collection].find({})

    User = pd.DataFrame(list(cursor))

    部分?jǐn)?shù)據(jù)展示:

    user_id channel

    first_visit_time

    2018-01-04 10:43:33 33737760 anzhishichang

    2018-01-04 13:54:50 33217154 anzhishichang

    2018-01-08 17:46:22 33130645 anzhishichang

    2.2 數(shù)據(jù)處理

    2.2.1. 獲取新增用戶

    新增用戶:首次使用應(yīng)用程序的用戶,以first_visit_time為依據(jù),判斷用戶是否為新增用戶。

    時(shí)間序列分析在金融數(shù)據(jù)分析中占據(jù)重要位置,可傳入字符串進(jìn)行索引。

    例如可傳入”20180109”來獲取1月9號(hào)首次訪問應(yīng)用程序的用戶數(shù)據(jù),

    User[‘20180109]

    user_id channel

    first_visit_time

    2018-01-09 15:50:44 33217151 anzhishichang

    可傳入時(shí)間段獲取數(shù)據(jù):

    User[“201808”:”20180111”]

    user_id channel

    first_visit_time

    2018-01-08 17:43:11 4897182 anzhishichang

    2018-01-11 09:18:59 33217153 anzhishichang

    時(shí)間索引的切片操作包含尾部的數(shù)據(jù)。

    2.2.2.獲取最近7天新增用戶數(shù)

    程序段2:

    import pandas as pd

    from datetime import datetime, date, timedelta

    end_date = date.today()

    new_user = pd.Series(name=`新增用戶數(shù)`)

    #通過for循環(huán)獲取7天的新增用戶數(shù)

    for i in range(7):

    dt = date.today() - timedelta(days=i)

    sum_new = User[dt[-4:]]

    new_user[dt] = len(sum_new)

    返回結(jié)果:

    0522 65

    0521 36

    0520 8

    0519 6

    0518 3

    0517 41

    0516 58

    可清晰的看到,每天的新增用戶數(shù)。

    2.2.3.獲取最近7天不同渠道的新增用戶數(shù)

    程序段3:

    import pandas as pd

    from datetime import datetime, timedelta, date

    new7channel = pd.DataFrame()

    #外層for循環(huán)獲取最近7天的新增用戶數(shù)據(jù)

    for i in range(7):

    Dt = date.today() - timedelta(days=i)

    dt1 = datetime.strftime(dt, "%Y%m%d")

    data = User[dt1]

    Channel = data[`channel`].drop_duplicates()

    new_channel=pd.Series(name=dt1[-4:])

    #內(nèi)層for循環(huán),獲取各渠道新增用戶數(shù)

    for cn in channel:

    dt_cn = data[data[`channel`] == cn]

    num_channel[cn] = len(dt_cn)

    #concat函數(shù)將數(shù)據(jù)連接起來。通過fillna函數(shù)將值為NaN數(shù)據(jù)用0填充。

    new7channel=pd.concat([new7channel,new_channel],axis=1).fillna(0)

    部分結(jié)果:

    0523 0522 0521 0520 0519 0518 0517

    AppStore 8.0 20.0 13.0 13.0 12.0 11.0 20.0

    c360 0.0 2.0 2.0 0.0 0.0 0.0 1.0

    橫向數(shù)據(jù)表示不同渠道最近7天的新增用戶數(shù),縱向則表明不同渠道的新增用戶數(shù)。

    3 結(jié)束語

    在大數(shù)據(jù)時(shí)代,數(shù)據(jù)分析的影響及重要性在不斷拓寬和加深。本文介紹了基于Python,pandas簡單的數(shù)據(jù)分析過程。

    猜你喜歡
    程序段用戶數(shù)面向?qū)ο?/a>
    基于WinCC的物料小車控制系統(tǒng)設(shè)計(jì)與仿真
    數(shù)控系統(tǒng)手輪回退功能的研究與實(shí)現(xiàn)*
    基于NC程序段的提高數(shù)控加工監(jiān)控閾值與信號(hào)同步的方法*
    面向?qū)ο蟮挠?jì)算機(jī)網(wǎng)絡(luò)設(shè)計(jì)軟件系統(tǒng)的開發(fā)
    面向?qū)ο蟮臄?shù)據(jù)交換協(xié)議研究與應(yīng)用
    面向?qū)ο骔eb開發(fā)編程語言的的評(píng)估方法
    基于VBS實(shí)現(xiàn)BRAS在線用戶數(shù)的自動(dòng)提取
    2016年6月電話用戶分省情況
    2013年12月電話用戶分省情況
    面向?qū)ο笮畔⑻崛≈杏跋穹指顓?shù)的選擇
    河南科技(2014年10期)2014-02-27 14:09:03
    和平县| 大足县| 雅安市| 农安县| 高陵县| 兴和县| 上饶市| 绥德县| 西青区| 喀喇沁旗| 连江县| 新密市| 霞浦县| 临颍县| 赤壁市| 石首市| 信阳市| 横峰县| 海盐县| 上饶市| 塔城市| 琼海市| 宝丰县| 建宁县| 宜宾市| 义马市| 丰宁| 武冈市| 梁山县| 大石桥市| 阿图什市| 安岳县| 庄河市| 织金县| 汶上县| 江油市| 偏关县| 普宁市| 应用必备| 泉州市| 广昌县|