於遒 郭海兵
摘要:大數據的五V特征對數學建模教學產生新的沖擊,這表現在課程目標、課程內容、教學手段等方面。面對樣本數據收集的信息化、自動化、全樣本和大數據化,課程應更加側重于發(fā)現海量數據下各種關聯細節(jié)的相關分析能力的培養(yǎng);在教學內容上,應增加反映兼顧大數據和信息技術特點的數據挖掘內容和環(huán)節(jié);在教學手段上,數學軟件的應用及編程能力的強化應成為數學建模必不可少的手段之一。
關鍵詞:數學建模;大數據;全樣本;數據挖掘;編程能力
中圖分類號:G712 文獻標志碼:A 文章編號:1673-9094-(2018)05C-0074-03
隨著新技術和新應用帶動數據爆發(fā)式的增長,大數據正逐步走進人們生活,并對傳統(tǒng)數學建模課程產生深刻的影響。近年來,在美國大學生數學建模大賽中,具有顯著大數據特征的賽題不斷涌現,以2017年A賽題為例,其關于贊比西河管理問題的解決涉及大量非結構化數據,特別是地理數據,對數學建模能力的考核已經不再表現為分析問題能力和數據執(zhí)行能力的獲取,而是上述兩種能力的合取。2018年大賽甚至系統(tǒng)性地專門增加一個數據處理題以反映時代對這方面的要求。因此,在數學建模教學中,任何割裂分析問題能力與數據執(zhí)行能力聯系的做法已經無法應對大數據對數學建模能力提出的挑戰(zhàn)。具體到教學改革上,需要我們分析好大數據型問題對數學建模課程的影響,對傳統(tǒng)數學建模的課程目標、課程內容、教學手段做出相應調整。
一、構建體現大數據特點的數學建模課程目標
課程目標是教學活動的指導思想,是課程設計的出發(fā)點和依托。因此,數學建模課程目標應順應大數據發(fā)展的要求進行相應調整,為構建與大數據處理相適應的,新的課程觀、課程目標、課程內容、課程結構和課程活動方式奠定基礎。
數學建模的主要目的是培養(yǎng)學生應用數學理論和知識解決實際問題的能力,而應用好數學解決問題的前提是建模時首先能正確地面對數據類型和關系,進行合理假設。人們在自覺和非自覺狀態(tài)下創(chuàng)造的大量非結構化數據和半結構化大數據,它們有些表現為傳統(tǒng)的數、表等結構化特征,有些則表現為諸如文本數據、音頻數據和視頻數據等現代非結構化數據和半結構化數據,多且雜亂。因此,在數學建模課程目標的設定上首先應體現數據結構的特點對調整數學建模課程目標提出的要求。
大數據具有5V特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。如,智能制造中設備產生的數據流實時、高速,這些高速數據通過通訊網絡快速與控制系統(tǒng)鏈接,數據流數量級的計算加速大幅提升數據處理與分析的效率,使得機器硬件性能得以充分挖掘,進而提升經營與管理的效益;其他如醫(yī)學掃描數據、天文數據、網站流量等,其具有低價值密度的特點。這些不同于以往數據的特征要求我們需要有新的數學建模課程目標與之匹配,這主要表現在數據觀、數據刻畫及數據表現等幾個方面。
傳統(tǒng)數學建模中,數據收集只能通過隨機樣本,利用少數的特征對總體的屬性進行統(tǒng)計推斷。在大數據時代,人們可以通過互聯網、即時通訊工具以及數據庫,獲取各種海量數據。因此,大數據背景下,全數據或海量數據成為樣本數據,即樣本就是總體,樣本就是大數據。
面對這樣的全樣本或海量數據,隨機抽樣有時僅表現為一種邏輯上的意義。而在大數據背景下,一方面,數據收集過分地依賴技術手段,很難進行人為的精度控制;另一方面,數據無論在空間和時間方面,來源更加復雜,格式更加多樣,這就使得數據的前期清洗處理變得非常困難。由于存在系統(tǒng)性的偏差,很難將全部的雜質項從數據中萃取掉,在秉持“數據多比少好”的情況下,就得接受數據混亂和不確定性的代價。當然,在大數據中,忽略一部分模型的精確性,并不是說不要模型的精確性,而是指我們對于模型精確性的可控性在減弱。所以,新的數學建模分析應更加側重于發(fā)現海量數據下的各種關聯細節(jié),這可以成為數學建模邏輯思維能力培養(yǎng)新的補充目標,從而使我們在知識與技能、過程與方法等維度上把握好該課程的教學。
隨著數據通訊技術,尤其是移動智能設備的普及發(fā)展,人們可以在任何時間和地點發(fā)布信息和獲取數據,數據的實時分析成為提高大數據分析效率的必由之路。與傳統(tǒng)數據相比,數據不再局限于一條條記錄,伴隨著大量由物聯網、傳感器等產生的圖片、視頻等非結構化數據的產生,實時分析需要學生掌握新的數據挖掘技術,并以集群、分割、孤立點分析及其他算法深入數據內部挖掘價值,從而實現處理數據量和處理數據速度的統(tǒng)一。
此外,數據倉庫、聯機分析和數據挖掘技術的不斷完善,推動著數據以圖形和圖像等可視化方式的執(zhí)行,[1]展示數據、理解數據、演繹數據呼喚數據的可視化;從直方圖到網狀圖,從三維地圖到動態(tài)模擬,從動畫技術到虛擬現實,枯燥乏味的數據生動形象起來,爆炸性數據壓縮起來,這對于數學建模的數據輸出提出新挑戰(zhàn)。
二、構建兼顧大數據和信息技術特點的數學建模課程內容
數學建模本質上是一種數學實驗,人們在實驗、觀察和分析的基礎上,對實際問題的主要方面做出合理的假設和簡化,明確變量和參數,應用數學語言和方法,形成一個明確的數學問題,然后用數學或計算的方法精確或近似地求解該數學問題,進而檢驗結果是否能說明實際問題的主要現象,能否進行預測。這樣的過程多次反復進行,直到能較好地解決問題,這就是數學建模的全過程。
大數據的處理也有自身的步驟,一般來說可以分為6個不同階段:(1)存儲管理階段,它實現了多維數據的聯機分析;(2)數據倉庫階段,它解決數據整合集成問題;(3)聯機分析階段,它實現數據存儲管理和快速組織;(4)數據挖掘階段,它實現探索性分析,發(fā)現數據背后模式和有用信息;(5)輔助決策階段,它綜合運用數據倉庫、聯機分析和數據挖掘,實現結果;(6)大數據分析,它實現非結構化數據、海量數據、實時數據的分析。
因此,面對大數據,如何實現上述兩者的有機融合,必然需要注意新數學建模各階段表現出的新的特點,如在實驗、觀察階段,樣本數據收集的信息化與自動化,海量信息和全樣本數據成為分析常態(tài)。在問題的數學刻畫階段,相關分析可以作為進行模型分析之前數據探索的一個手段,這是因為由于數據的結構復雜,變量眾多,數據體量大,有時候很難用一個“普世”函數描述出變量之間的準確關系,在無法綜合評價出變量之間關系的情況下,我們可以部分揭示出變量之間的關系。事實上,由于相關分析無需太多模型假設,運算成本較低等眾多原因,使得相關關系的分析成為了大數據分析的基礎。[2]在模型驗證階段,以數據為中心的非普世和精確化的數學模型往往可以得到海量信息和全樣本數據的支撐等。
因此,在數學建模課程內容架構中,應兼顧大數據和信息技術的特點,逐漸改變數據挖掘技術在數學建模教學上輔助性的作用,將有關計算機和信息技術的教學很好地落實到課程計劃、課程標準和教科書中。如在教學中,可以增加通過“網絡爬蟲”程序直接抓取互聯網數據的內容;從傳感器、云端直接獲取智能制造中現實數據的方法;將并行處理數據的思想引入建模教學;加強相關分析的內容教學等。所有這些可以讓計算機的數據采集能力和數據處理能力成為變量間邏輯關系探索、復雜模型構建的有力工具,推動人們對數學建模的認知。
三、強化數學建模中的軟件教學
首先,強化數學軟件的教學。常見的數學軟件有Matlab、Mathematica,Lingo,SAS、SPSS、Eview、
R、Python等,它為計算機解決現代科學技術各領域中所提出的數學問題提供求解手段。
其次,加強數學算法的介紹。常見的數學算法包括運籌學類的算法、概率分析與隨機算法、時間序列算法等,其他的如十大經典算法等。
另外,對于以往建模中的數據處理,人們更習慣運用SPSS、Eview等這類封裝好的、以體驗式為主的方式進行,然而,相比于機械的拖拽軟件分析數據,編程分析更加靈活,因為,編程使數據處理無論在體量上,還是在方式的靈活度上,更有利于激發(fā)數據分析者的主動性和創(chuàng)造性,因此,能夠駕馭軟件編程的教學應是更高的數學建模課程的要求。
當然,大數據處理也還有其他特殊的技術,如大規(guī)模并行處理數據庫、分布式文件系統(tǒng)、分布式數據庫、虛擬化和內存計算等,其中,大規(guī)模并行數據處理運用的hadoop技術,內存計算的hana工作原理等在教學過程需要予以關注。
數學建模中軟件工具部分是發(fā)展極為迅速的領域,從實際教學活動看,一般數學建模課程因為教學時數少,大數據意識薄弱,使得教學內容面臨著較為陳舊的尷尬,數學軟件教學明顯滯后于數學軟件發(fā)展的水平。這需要我們在教學過程中注意強調這部分內容的前沿性,以便更好地契合該課程建設的需要。
總而言之,大數據時代對數學建模教學的影響是多方面的,現代信息技術使得樣本數據的收集實現了信息化、自動化、全樣本和大數據化;面對數據結構復雜,變量眾多,數據體量大的新情況,相關分析逐步取代精確模型的分析,成為模型分析之前數據探索的一個重要手段;在數據處理中,數學軟件的應用及編程能力的強化應成為數學建模必不可少的手段,所有這些都改變著數學建模的課程觀,使我們在未來數學建模中兼顧好數學理論和信息技術的平衡。
參考文獻:
[1]裴光亞.大數據:教學研究的曙光[J].中學數學教學參考,2017(13).
[2]茆詩松,程依明,濮曉龍.概率論與數理統(tǒng)計教程[M].北京:高等教育出版社,2004.
責任編輯:陳向陽
A Reflection on the Teaching Reform of Mathematical
Modeling under the Background of Big Data
YU Qiu & GUO Haibing
(Huaihai Institute of Technology, Lianyungang 222005, Jiangsu Province)
Abstract: The five V features of big data have a new impact on the teaching of mathematical modeling, which is reflected in the aspects of curriculum objectives, curriculum contents, teaching methods and so on. In the face of information, automation, full sample and big data of sample data collection, the curriculum should focus more on the cultivation of relevant analysis ability of various related details under mass data; the data mining contents and links should be increased with the reflection of the characteristics of big data and information technology; and the application of mathematical software and the enhancement of programming ability should become one of the essential means of mathematical modeling.
Key words: mathematical modeling; big data; full sample; data mining; programming ability