摘 ?要:隨著時(shí)代的發(fā)展和進(jìn)步,大數(shù)據(jù)理念已經(jīng)逐漸為人們所熟知,并無(wú)時(shí)無(wú)刻不在影響著人們的生活和工作。通過(guò)利用大數(shù)據(jù)能夠有效促進(jìn)校園管理和建設(shè)的開(kāi)展,能夠?qū)π@就業(yè)情況進(jìn)行用戶(hù)畫(huà)像建設(shè),一方面實(shí)現(xiàn)校園就業(yè)用戶(hù)的更好管理,另一方面也能夠促進(jìn)校園就業(yè)工作的更好開(kāi)展。
關(guān)鍵詞:大數(shù)據(jù);校園就業(yè);用戶(hù)畫(huà)像;數(shù)據(jù)收集
中圖分類(lèi)號(hào):TP311.13;TP391.1 ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)17-0110-03
Abstract:With the development and progress of the times,the concept of big data has gradually become known to people,and has always been affecting people’s lives and work. The use of big data can effectively promote the development of campus management and construction,and can build user portraits of campus employment. On the one hand,it can achieve better management of campus employment users,on the other hand,it can also promote better development of campus employment work.
Keywords:big data;campus employment;user portrait;data collection
0 ?引 ?言
伴隨著大數(shù)據(jù)時(shí)代的到來(lái),社交網(wǎng)絡(luò)與互聯(lián)網(wǎng)的應(yīng)用范圍處于持續(xù)擴(kuò)大之中。在整個(gè)互聯(lián)網(wǎng)中,社交發(fā)揮著重要的基礎(chǔ)作用。對(duì)于各個(gè)重大網(wǎng)站而言,其重要課題之一就是采集用戶(hù)數(shù)據(jù),并對(duì)其開(kāi)展科學(xué)推薦工作。在開(kāi)展個(gè)性化推薦工作的過(guò)程中,其包括許多步驟,用戶(hù)畫(huà)像提取過(guò)程發(fā)揮著關(guān)鍵作用。
1 ?畫(huà)像的定義和用途
1.1 ?畫(huà)像的定義
畫(huà)像與profile為同一概念,均是通過(guò)不同的維度,來(lái)對(duì)一個(gè)人進(jìn)行描述,這些維度可以是事實(shí)的,亦可以是抽象的;可以是性別、年齡等自然屬性,亦可以為職業(yè)、社交特征等社會(huì)屬性;可以為是否高收入人群、是否有固定資產(chǎn)等財(cái)富情況,亦可以為是否已婚、是否有子女等家庭情況;可以是喜歡網(wǎng)購(gòu)、喜歡逛商場(chǎng)等購(gòu)物習(xí)慣,亦可以是位于在城市生活等位置特征;也可以是其他行為習(xí)慣??偠灾?,在畫(huà)像的范圍中,將各個(gè)大家能夠想象到的表達(dá)一個(gè)人特征的都包括進(jìn)來(lái),實(shí)際上,畫(huà)像就是利用各種方法,通過(guò)數(shù)據(jù)來(lái)對(duì)人的特征進(jìn)行描述。
1.2 ?畫(huà)像的用途
(1)能夠精確開(kāi)展相關(guān)營(yíng)銷(xiāo)工作,對(duì)產(chǎn)品潛在用戶(hù)進(jìn)行科學(xué)分析。通過(guò)短信郵件等形式,針對(duì)特定群體,開(kāi)展相關(guān)營(yíng)銷(xiāo)工作。
(2)針對(duì)對(duì)用戶(hù)進(jìn)行相關(guān)統(tǒng)計(jì),例如:全國(guó)就業(yè)高等院校有哪些、中國(guó)大學(xué)購(gòu)買(mǎi)書(shū)籍人數(shù)TOP10等。
(3)進(jìn)一步挖掘相關(guān)數(shù)據(jù),建設(shè)智能推薦系統(tǒng),通過(guò)關(guān)聯(lián)規(guī)則,開(kāi)展相關(guān)計(jì)算工作,比如,就業(yè)崗位更喜歡什么樣的學(xué)生。通過(guò)聚類(lèi)算法,開(kāi)展相關(guān)分析工作,了解就業(yè)學(xué)生的特點(diǎn)以及行業(yè)分布狀況等。
(4)開(kāi)展效果評(píng)估工作,健全產(chǎn)品運(yùn)營(yíng)情況,以此來(lái)實(shí)現(xiàn)服務(wù)質(zhì)量的提升。換而言之,就是開(kāi)展市場(chǎng)與用戶(hù)調(diào)研活動(dòng),在短時(shí)間內(nèi)對(duì)服務(wù)群體做出定位,并提供具備較高水平的服務(wù),
(5)針對(duì)特殊用戶(hù)開(kāi)展私人定制工作,換而言之,對(duì)某類(lèi)群體,甚至每位用戶(hù)提供個(gè)性化服務(wù)。
(6)可以科學(xué)分析業(yè)務(wù)經(jīng)營(yíng)情況,亦可以合理分析競(jìng)爭(zhēng)情況,上述分析結(jié)果會(huì)對(duì)企業(yè)發(fā)展戰(zhàn)略的制定與實(shí)施,造成一定的影響。
2 ?大數(shù)據(jù)的校園就業(yè)用戶(hù)畫(huà)像的構(gòu)建和應(yīng)用
2.1 ?數(shù)據(jù)收集
通常情況下,在數(shù)據(jù)收集方面,可以分為四種類(lèi)型,即:基本用戶(hù)數(shù)據(jù)、就業(yè)行為數(shù)據(jù)、就業(yè)行業(yè)數(shù)據(jù)以及未來(lái)發(fā)展數(shù)據(jù)。
(1)基本用戶(hù)數(shù)據(jù)。其主要內(nèi)容包括就業(yè)學(xué)生的姓名、性別、年齡、年級(jí)、學(xué)習(xí)的專(zhuān)業(yè)等。
(2)就業(yè)行為數(shù)據(jù)。其主要包含:就業(yè)中的表現(xiàn)、就業(yè)的情緒、就業(yè)過(guò)程中的經(jīng)歷、面試的單位、參與面試的心理狀態(tài)、進(jìn)入就業(yè)市場(chǎng)到成功就業(yè)時(shí)間等。
(3)就業(yè)行業(yè)數(shù)據(jù)。其主要包括:就業(yè)的行業(yè)、就業(yè)的類(lèi)別、就業(yè)崗位、就業(yè)之后的薪資待遇、走入工作崗位的心理感受、就業(yè)環(huán)境等。
(4)未來(lái)發(fā)展數(shù)據(jù)。此部分?jǐn)?shù)據(jù)主要包括學(xué)生就業(yè)行業(yè)的未來(lái)發(fā)展趨勢(shì)、就業(yè)崗位的未來(lái)發(fā)展趨勢(shì)、自身的就業(yè)成長(zhǎng)前景等。
這些所收集的數(shù)據(jù)信息具備一定的不確定性,其準(zhǔn)確率不能夠達(dá)到百分之百,在后臺(tái)階段之中,需要開(kāi)展相關(guān)建模工作,并在此基礎(chǔ)上,做出相關(guān)判斷。例如:在性別一欄中,某用戶(hù)所填寫(xiě)的為“男”,但是利用其他數(shù)據(jù),能夠有80%的概率判斷其性別為“女”。值得注意的是,針對(duì)用戶(hù)行為數(shù)據(jù)信息,在開(kāi)展相關(guān)儲(chǔ)存工作的過(guò)程中,應(yīng)當(dāng)最大限度地對(duì)發(fā)生該行為的場(chǎng)景進(jìn)行存儲(chǔ),這樣有助于數(shù)據(jù)分析工作的順利開(kāi)展。
針對(duì)這一階段所收集的數(shù)據(jù),應(yīng)當(dāng)開(kāi)展行為建模工作,以此來(lái)將用戶(hù)標(biāo)簽抽象出來(lái)。在該階段中,應(yīng)當(dāng)高度關(guān)注大概率事件,利用數(shù)學(xué)算法模型,最大限度地排除用戶(hù)偶然行為。在這個(gè)過(guò)程中,也應(yīng)當(dāng)通過(guò)機(jī)器學(xué)習(xí),針對(duì)用戶(hù)的行為以及偏好,開(kāi)展相關(guān)猜測(cè)工作。
在這個(gè)階段中,為了能夠針對(duì)用戶(hù)貼標(biāo)簽,需要運(yùn)用許多模型,行為建模這一階段的深入,就是基于大數(shù)據(jù)校園就業(yè)用戶(hù)畫(huà)像基本成型,應(yīng)當(dāng)從大體上,標(biāo)簽化用戶(hù)基本屬性、購(gòu)買(mǎi)能力、行為特征、興趣愛(ài)好、心理特征,以及社交網(wǎng)絡(luò)。其中,其基本屬性主要指的是性別、年齡、地域等。這里所指的基本成型,究其緣由就是在對(duì)個(gè)人進(jìn)行描述的過(guò)程中,用戶(hù)畫(huà)像不可能對(duì)其進(jìn)行百分之百的描述,只能夠不斷貼近實(shí)際情況。所以,針對(duì)基于大數(shù)據(jù)的校園就業(yè)用戶(hù)畫(huà)像,能夠依據(jù)變化的基礎(chǔ)數(shù)據(jù),持續(xù)開(kāi)展相關(guān)修正工作。與此同時(shí),還能夠依據(jù)已知數(shù)據(jù),對(duì)新標(biāo)簽進(jìn)行抽象,進(jìn)而提升用戶(hù)畫(huà)像的立體性。
針對(duì)“標(biāo)簽化”而言,通常情況下,會(huì)運(yùn)用多級(jí)標(biāo)簽與多級(jí)分類(lèi)。其中,年齡、性別、地域等基本信息屬于第一級(jí)標(biāo)簽,消費(fèi)習(xí)慣與用戶(hù)行為屬于第二級(jí)標(biāo)簽。在第一級(jí)分類(lèi)中,將人口屬性包括進(jìn)來(lái)。在二級(jí)分類(lèi)中,除了基本信息與地理位置之外,還將人口屬性等內(nèi)容包括進(jìn)來(lái)。在地理位置方面,可以劃分為工作地址與家庭地址三級(jí)分類(lèi)。
針對(duì)基于大數(shù)據(jù)校園就業(yè)用戶(hù)畫(huà)像,要想將其真正利用起來(lái),就需要采用數(shù)據(jù)可視化分析。在該步驟中,相關(guān)工作的開(kāi)展,通常是針對(duì)群體分析來(lái)進(jìn)行的。例如:能夠依據(jù)用戶(hù)價(jià)值,對(duì)相關(guān)核心用戶(hù)開(kāi)展細(xì)致劃分工作,并對(duì)某一群體的潛在價(jià)值空間進(jìn)行相關(guān)評(píng)估,進(jìn)而不斷提高相關(guān)運(yùn)營(yíng)工作的針對(duì)性,確保運(yùn)營(yíng)工作的高效開(kāi)展。
2.2 ?常用算法
在對(duì)模型設(shè)計(jì)與數(shù)據(jù)計(jì)算處理方式進(jìn)行確定的過(guò)程中,應(yīng)當(dāng)以業(yè)務(wù)目標(biāo)與原材料為基礎(chǔ)來(lái)進(jìn)行。在面對(duì)不同行業(yè)與應(yīng)用情景的情況下,應(yīng)當(dāng)利用不同的數(shù)據(jù)源,開(kāi)展不同的標(biāo)簽設(shè)計(jì)和計(jì)算工作。
(1)人口屬性主要指的是人的基本特征,例如:年齡、性別等;
(2)資產(chǎn)情況主要指的是資產(chǎn)特征,例如:房產(chǎn)、收入、車(chē)輛等;
(3)興趣特征主要指的是興趣偏好,例如:運(yùn)動(dòng)健康、閱讀資訊等;
(4)消費(fèi)特征主要指的是網(wǎng)上消費(fèi)類(lèi)別品牌、線下消費(fèi)類(lèi)別品牌等;
(5)位置特征主要指的是職住距離、常駐城市等;
(6)設(shè)備屬性指的是所運(yùn)用終端的特性等。
要想對(duì)上述標(biāo)簽的設(shè)計(jì)進(jìn)行計(jì)算與支持,離不開(kāi)多種維度的數(shù)據(jù)源:
(1)針對(duì)產(chǎn)生維度而言,包括線下數(shù)據(jù)、移動(dòng)終端數(shù)據(jù)、PC端數(shù)據(jù);
(2)針對(duì)數(shù)據(jù)擁有者而言,包含市場(chǎng)采集數(shù)據(jù)、外部官方渠道數(shù)據(jù)以及一方客戶(hù)自身數(shù)據(jù);
(3)針對(duì)數(shù)據(jù)類(lèi)型而言,包括交易數(shù)據(jù)、位置數(shù)據(jù)、運(yùn)營(yíng)商數(shù)據(jù)、社交數(shù)據(jù)等。
通過(guò)這些不同源的數(shù)據(jù),在對(duì)處理業(yè)務(wù)所需要的標(biāo)簽進(jìn)行計(jì)算的過(guò)程中,通常包括以下步驟:
(1)抽取數(shù)據(jù):通過(guò)不同數(shù)據(jù)源,將需要計(jì)算標(biāo)簽的數(shù)據(jù)原材料抽取出來(lái);
(2)數(shù)據(jù)標(biāo)準(zhǔn)化:清洗所抽取的數(shù)據(jù)使其成為標(biāo)準(zhǔn)格式,并提出錯(cuò)誤與無(wú)效數(shù)據(jù);
(3)數(shù)據(jù)打通:數(shù)據(jù)來(lái)源不同,其所具備的主鍵與屬性就有所不同,數(shù)據(jù)打通的關(guān)鍵就是怎樣將這些數(shù)據(jù)關(guān)聯(lián)起來(lái);
(4)模型設(shè)計(jì):在構(gòu)建模型的過(guò)程中,針對(duì)不同的數(shù)據(jù)內(nèi)容與業(yè)務(wù)目標(biāo),對(duì)不同的規(guī)則與算法進(jìn)行設(shè)計(jì)。
常用算法方面,主要包括線性回歸、邏輯回歸與多分類(lèi)邏輯回歸。
2.3 ?重點(diǎn)難點(diǎn)
(1)怎樣對(duì)畫(huà)像主體進(jìn)行定義。在現(xiàn)實(shí)世界中,每個(gè)人均為一個(gè)獨(dú)立實(shí)體。然而,在虛擬世界中,個(gè)人可能進(jìn)行變身,不再是一個(gè)獨(dú)立個(gè)體,可以成為多個(gè)。例如:每個(gè)人的身份ID只有一個(gè),但是可能具備多部手機(jī),這樣對(duì)應(yīng)的手機(jī)號(hào)為多個(gè),設(shè)備終端ID為多個(gè),所對(duì)應(yīng)移動(dòng)終端的使用行為同樣為多個(gè)。對(duì)于這個(gè)實(shí)體而言,多個(gè)終端ID所對(duì)應(yīng)的特征不同,只有拼接起來(lái)這個(gè)實(shí)體,才能夠?qū)⒄w畫(huà)像體現(xiàn)出來(lái)。一個(gè)人的QQ號(hào)可能為多個(gè),倘若通過(guò)QQ行為角度做出相關(guān)分析,其所運(yùn)用的邏輯基本相同,充分表現(xiàn)出終端實(shí)體多對(duì)一。反而言之,一對(duì)多的情形也會(huì)存在。例 如:對(duì)于一個(gè)家庭用的iPad而言,兒童可以通過(guò)iPad進(jìn)行游戲,父親可以通過(guò)iPad來(lái)查收有關(guān)郵件,母親可以通過(guò)iPad來(lái)開(kāi)展相關(guān)購(gòu)物活動(dòng),通過(guò)這一個(gè)iPad,能夠?qū)⒍鄠€(gè)實(shí)體的行為特征體現(xiàn)出來(lái),并且很難將其拆分開(kāi)來(lái)。因此,要想對(duì)實(shí)體進(jìn)行完整的定義,其所存在的難度系數(shù)非常高。這就要求,在相關(guān)業(yè)務(wù)領(lǐng)域中,部分情況下,要追求標(biāo)簽的整體性,要想實(shí)現(xiàn)該目標(biāo)所存在的難度系數(shù)非常高,反之,應(yīng)當(dāng)不斷提高對(duì)標(biāo)簽代表性的關(guān)注度,不論是在一對(duì)多的情況下,還是在多對(duì)一的情況下,只要能夠利用標(biāo)簽,將所需要尋找的受眾群體篩選出來(lái)即可。即使是面對(duì)家庭共用的iPad,雖然具備相關(guān)游戲標(biāo)簽,這能夠充分體現(xiàn)出,在該家庭中,其成員具備相關(guān)方面的興趣愛(ài)好。
(2)怎樣將不同源的數(shù)據(jù)打通。針對(duì)一些不同源的數(shù)據(jù),主要包括PC端的行為信息、移動(dòng)終端的行為信息,以及TV端的行為信息,怎樣關(guān)聯(lián)起上述信息內(nèi)容?在上述問(wèn)題中,居于核心地位的問(wèn)題就是怎樣打通這些終端的唯一標(biāo)識(shí)ID。在Talking Data的數(shù)據(jù)體系中,已經(jīng)完成了ID關(guān)聯(lián)圖譜的建設(shè)工作。在該ID關(guān)聯(lián)圖譜中,TD ID居于核心地位,發(fā)揮著至關(guān)重要的作用。通過(guò)Talking Data的ID-Mapping能力,已經(jīng)促進(jìn)了跨設(shè)備ID關(guān)聯(lián)映射工作的完成。因此,只需要將一家與Talking Data類(lèi)似的數(shù)據(jù)接入,就能夠解決不同源ID的打通問(wèn)題。
3 ?結(jié) ?論
伴隨著社交網(wǎng)絡(luò)突飛猛進(jìn)的發(fā)展與進(jìn)步,媒體類(lèi)型變得更加豐富多彩,正在持續(xù)降低用戶(hù)參與門(mén)檻。用戶(hù)表達(dá)的數(shù)據(jù)模態(tài)變得更加多樣化,進(jìn)而促使用戶(hù)畫(huà)像提取空間變得更加寬廣。伴隨著用戶(hù)畫(huà)像數(shù)量的持續(xù)增長(zhǎng),越來(lái)越多的用戶(hù)開(kāi)始通過(guò)大數(shù)據(jù)技術(shù),開(kāi)展高效的存儲(chǔ)以及用戶(hù)畫(huà)像計(jì)算工作。相關(guān)人員及院校也需要在大數(shù)據(jù)掌握基礎(chǔ)上做好校園就業(yè)用戶(hù)畫(huà)像的構(gòu)建和應(yīng)用,使校園就業(yè)工作得以更好推動(dòng)。
參考文獻(xiàn):
[1] 袁軍.大數(shù)據(jù)環(huán)境下用戶(hù)畫(huà)像在高校圖書(shū)館的應(yīng)用研究 [J].圖書(shū)館研究與工作,2019(6):22-26.
[2] 汪強(qiáng)兵,章成志.基于手勢(shì)行為的社交網(wǎng)絡(luò)用戶(hù)興趣畫(huà)像構(gòu)建及應(yīng)用 [J].圖書(shū)與情報(bào),2019(2):114-119+132.
[3] 劉漫.基于用戶(hù)畫(huà)像的高校圖書(shū)館閱讀推廣模式構(gòu)建 [J].圖書(shū)館理論與實(shí)踐,2019(1):1-8.
[4] 茶利強(qiáng),余添李,施菡,等.用戶(hù)畫(huà)像在企業(yè)人才標(biāo)準(zhǔn)構(gòu)建中的應(yīng)用 [J].管理觀察,2019(6):39-40+47.
[5] 姚遠(yuǎn),張蕙,郝群,等.基于本體的用戶(hù)畫(huà)像構(gòu)建方法 [C] //中國(guó)計(jì)算機(jī)用戶(hù)協(xié)會(huì)網(wǎng)絡(luò)應(yīng)用分會(huì)2018年第二十二屆網(wǎng)絡(luò)新技術(shù)與應(yīng)用年會(huì).北京:北京聯(lián)合大學(xué)北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室,2018.
作者簡(jiǎn)介:劉艷(1982-),女,漢族,湖南長(zhǎng)沙人,講師,碩士,研究方向:移動(dòng)應(yīng)用、大數(shù)據(jù)。