馬道京 陳有源 宋海波
摘 要:本文概述了在大數(shù)據(jù)背景條件下,Excel的基本應(yīng)用技巧、查詢方式及數(shù)據(jù)透視表的使用,介紹了大數(shù)據(jù)平臺(tái)架構(gòu)與Excel業(yè)務(wù)分析如何實(shí)現(xiàn)直連的解決方案。
關(guān)鍵詞:大數(shù)據(jù);Excel;應(yīng)用
大數(shù)據(jù)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
具體多大的數(shù)據(jù)才能稱(chēng)之為“大”,并未有一個(gè)普遍和具體的量度,但其數(shù)據(jù)規(guī)模如此龐大,以至于不能用G或T來(lái)衡量,處理這些數(shù)據(jù)更好地是選擇專(zhuān)業(yè)化的大數(shù)據(jù)處理工具,如果這些大量的數(shù)據(jù)用Excel來(lái)分析的話,連載入內(nèi)存都不可能。但是,對(duì)于我們普通的用戶而言,這些工具顯得過(guò)于專(zhuān)業(yè),如果想要了解大數(shù)據(jù)處理的原理方法或是完成一些簡(jiǎn)單的業(yè)務(wù)分析,在數(shù)據(jù)規(guī)模適量的情況下,Excel作為一個(gè)入門(mén)級(jí)工具,也何嘗不是一個(gè)快速分析數(shù)據(jù)的理想工具,熟練使用它,可以加快數(shù)據(jù)分析的時(shí)間,提高查詢效率,也能創(chuàng)建供內(nèi)部使用的數(shù)據(jù)圖,也可以與其他大數(shù)據(jù)處理工具直連配合使用,具有一定的實(shí)際價(jià)值。
一、Excel批量數(shù)據(jù)操作技巧
(一)基本技巧
(1)“&”連接符實(shí)現(xiàn)批量數(shù)據(jù)的合并。具體操作:選擇單元格或英文狀態(tài)下雙引號(hào)括起來(lái)的字符串,填入“&”符號(hào),后緊跟合并單元個(gè)或字符串。
(2)區(qū)域快速求和。具體操作:選擇計(jì)算區(qū)域,然后按下快捷鍵“ALT+=”。
(3)數(shù)據(jù)批量填充。具體操作:使用F8擴(kuò)展區(qū)域方式選連續(xù)的多單元格:先選第1個(gè)有公式的單元格,然后按一下F8,再點(diǎn)擊滾動(dòng)條找到要填的最后一個(gè)單元格,選擇它,按組合鍵CTRL+D。
(4)快速刪除空白行。具體操作:選取區(qū)域數(shù)據(jù),使用“Ctrl+G”定位空格所在行,然后區(qū)域右鍵選取刪除整行。
(5)重復(fù)上一次操作。具體操作:完成上一步操作后,直接按下F4即可。
(6)快速選取數(shù)據(jù)。具體操作:按住快捷鍵[Ctrl+Shift+方向鍵],能夠快速地將指定的Excel數(shù)據(jù)選取上。
(7)刪除重復(fù)值。具體操作:依次點(diǎn)擊[數(shù)據(jù)]-[刪除重復(fù)值],選擇需要篩選的行列,然后直接刪除即可。
(二)Ctrl+E運(yùn)用
Ctrl+E快捷鍵是通過(guò)比對(duì)字符串間的關(guān)系,來(lái)給出最符合用戶需要的一種填充規(guī)則??蓞⒖嫉膶?duì)應(yīng)關(guān)系越多,判斷越準(zhǔn)確。運(yùn)用它可實(shí)現(xiàn)如連接單元格、拆分單元格內(nèi)容、替換字符、去除空格和符號(hào)、自動(dòng)換行、提取身份證信息、分離文本和數(shù)字等。版本限制為2013版以上。
例:有如下表,要求從身份證號(hào)中提取出出生日期。
第一步:首先在第一個(gè)單元格手動(dòng)輸入身份證對(duì)應(yīng)的出生日期數(shù)據(jù)。
第二步:按下Ctrl+E,Excel會(huì)自動(dòng)識(shí)別填充規(guī)則,并進(jìn)行填充。結(jié)果如下。
二、Excel批量數(shù)據(jù)查詢
(一)VLOOKUP+MATCH+INDEX函數(shù)匹配
VLOOKUP是一個(gè)查找函數(shù),給定一個(gè)查找的目標(biāo),它就能從指定的查找區(qū)域中查找返回想要查找到的值。語(yǔ)法結(jié)構(gòu)=VLOOKUP(查找值,查找區(qū)域,返回的列數(shù),查找類(lèi)型)。查找為0則精確匹配,為1則近似匹配。
MATCH函數(shù)指返回要查找的數(shù)據(jù)在區(qū)域中的相對(duì)位置。語(yǔ)法結(jié)構(gòu)=MATCH(查找值,查找區(qū)域,查找類(lèi)型)。查找類(lèi)型為0則精確查找,為1則查找小于或等于查找值的最大值,為-1則查找大于或等于查找值的最小值且查找區(qū)域中參數(shù)必須按降序排列。
INDEX函數(shù)是返回表或區(qū)域中的值或值的引用。函數(shù)INDEX()有兩種形式:數(shù)組形式和引用形式。數(shù)組形式通常返回?cái)?shù)值或數(shù)值數(shù)組;引用形式通常返回引用[1]。
通過(guò)上述三個(gè)函數(shù)的相互匹配,可以實(shí)現(xiàn)多條件的批量數(shù)據(jù)查找和填充。
(二)VBA應(yīng)用
VBA(Visual Basic for Applications)是Visual Basic的一種宏語(yǔ)言,是在其桌面應(yīng)用程序中執(zhí)行通用的自動(dòng)化(OLE)任務(wù)的編程語(yǔ)言。主要能用來(lái)擴(kuò)展Windows的應(yīng)用程序功能,特別是Microsoft Office軟件。它也可說(shuō)是一種應(yīng)用程式視覺(jué)化的Basic腳本,語(yǔ)法簡(jiǎn)單易學(xué)。在Excel中,我們可以使用VBA進(jìn)行編程,充分利用編程語(yǔ)言的邏輯、數(shù)組、Find函數(shù)等實(shí)現(xiàn)批量數(shù)據(jù)的各種復(fù)雜的查詢工作。
三、Excel數(shù)據(jù)透視表
數(shù)據(jù)透視表是Excel中一個(gè)強(qiáng)大的數(shù)據(jù)處理分析工具,通過(guò)數(shù)據(jù)透視表可以快速分類(lèi)匯總、比較大量的數(shù)據(jù),并且可以根據(jù)用戶的業(yè)務(wù)需求,快速變換統(tǒng)計(jì)分析維度來(lái)查看統(tǒng)計(jì)結(jié)果,特別是大數(shù)據(jù)時(shí)代的來(lái)臨,用戶需要處理的數(shù)據(jù)體量也越來(lái)越大,如何高效地完成統(tǒng)計(jì)分析,數(shù)據(jù)透視表無(wú)疑將成為一把利器。數(shù)據(jù)透視表不僅綜合了數(shù)據(jù)排序、篩選、組合及分類(lèi)匯總等數(shù)據(jù)分析方法的優(yōu)點(diǎn),而且匯總的方式更靈活多變,并能以不同方式顯現(xiàn)數(shù)據(jù)。一張“數(shù)據(jù)透視表”僅靠鼠標(biāo)指針移動(dòng)字段所處位置,即可變換出各種報(bào)表,以滿足廣大你的工作需求。同時(shí)數(shù)據(jù)透視表也是解決Excel函數(shù)公式速度“瓶頸”的重要手段之一[2]。
數(shù)據(jù)透視表的數(shù)據(jù)源可以來(lái)自Excel數(shù)據(jù)列表清單、外部數(shù)據(jù)源(文本、SQL Server、Microsoft Access數(shù)據(jù)庫(kù)、Microsoft OLAP多維數(shù)據(jù)集等)、多個(gè)獨(dú)立的Excel數(shù)據(jù)列表以及其他的數(shù)據(jù)透視表。其結(jié)構(gòu)包含篩選區(qū)域、行區(qū)域、列區(qū)域以及值區(qū)域四個(gè)部分,可通過(guò)軟件的插入菜單,選擇數(shù)據(jù)透視表工具選項(xiàng)按步驟進(jìn)行創(chuàng)建。
四、Excel大數(shù)據(jù)分析直連方案
隨著互聯(lián)網(wǎng)和新媒體技術(shù)的飛速發(fā)展,企業(yè)擁有的數(shù)據(jù)量呈現(xiàn)出幾何倍數(shù)增長(zhǎng),傳統(tǒng)數(shù)倉(cāng)和OLAP技術(shù)已經(jīng)無(wú)法滿足業(yè)務(wù)的場(chǎng)景需求。這就需要提供一個(gè)統(tǒng)一的大數(shù)據(jù)分析平臺(tái),能夠在亞秒級(jí)分析超大規(guī)模的數(shù)據(jù),提供統(tǒng)一的業(yè)務(wù)語(yǔ)義定義能力,并能夠直連Excel,幫助不少企業(yè)實(shí)現(xiàn)了數(shù)據(jù)平臺(tái)架構(gòu)升級(jí),釋放業(yè)務(wù)的大數(shù)據(jù)分析能力。例如,Kyligence公司為用戶打造的基于Apache Kylin的智能分析平臺(tái)及產(chǎn)品,可以在業(yè)務(wù)端輕松支持上千名分析師并發(fā)使用Excel進(jìn)行分析,使用Excel透視表直連Kyligence進(jìn)行大數(shù)據(jù)分析以及使用Excel實(shí)現(xiàn)交互式分析大數(shù)據(jù)。其實(shí)現(xiàn)架構(gòu)圖如下:
五、結(jié)語(yǔ)
綜上所述,掌握Excel的基本操作技能,熟練運(yùn)用Excel進(jìn)行業(yè)務(wù)數(shù)據(jù)的分析,在大數(shù)據(jù)時(shí)代,通過(guò)大數(shù)據(jù)的智能分析平臺(tái),實(shí)現(xiàn)直連交互,幫助企業(yè)高效升級(jí)到現(xiàn)代化架構(gòu),透明加速業(yè)務(wù)用戶使用Excel的分析體驗(yàn)。
參考文獻(xiàn):
[1]馮注龍.Excel之光:高效工作的Excel完全手冊(cè):電子工業(yè)出版社,2019.5.
[2]Excel Home.Excel 2016數(shù)據(jù)透視表應(yīng)用大全:北京大學(xué)出版社,2018.11.
作者簡(jiǎn)介:馬道京(1984—),男,漢族,貴州都勻人,碩士,副教授,研究方向:信息系統(tǒng)。
*通訊作者:陳有源(1968—),男,漢族,貴州都勻人,本科,副教授,研究方向:計(jì)算機(jī)基礎(chǔ)教育。