趙 楊 姜 穎 金英蘭
(沈陽大學 遼寧 沈陽 110044)
高考對于每個學生而言都十分重要,它不僅決定一個人的命運,更甚至決定一個家庭、一個家族的命運,如果說高考是一個人邁向新階段的起點,那么高考后的志愿填報就是決定我們能否進入這個新階段的關鍵?;诖髷祿母呖贾驹篙o助填報系統,通過大數據分析與數據挖掘,可為廣大考生提供海量真實、有價值的高考志愿填報信息,并提供院校/專業(yè)查詢,該系統具有數據分析、投檔分析、模擬填報等功能,幫助廣大考生報考理想學校,提高錄取機率。
高考志愿輔助填報系統是針對考生需求而設計的,因而首先綜合分析了考生在填報志愿過程中存在的問題,并歸納總結如下:(1)面對互聯網海量的高校宣傳信息,考生缺乏快速、準確辨識有用信息的甄別能力;(2)考生對自身的職業(yè)傾向不明確,對高校的專業(yè)設置、專業(yè)發(fā)展前景、就業(yè)方向缺乏明確認識;在此基礎上,本文設計開發(fā)了高考志愿輔助填報系統,以考生為主體,通過采集考生的成績排名和考生志愿填報的主要意向(專業(yè)和城市)信息,基于大數據的計算得到適合考生意向的院校、專業(yè)等信息;通過成績排名和歷年專業(yè)分數線排名得到錄取概率。
本文設計的高考志愿輔助填報系統由院校/專業(yè)咨詢、數據分析、測評中心等功能模塊組成。系統功能模塊如圖 1所示。
圖1 系統功能模塊
(1)院校/專業(yè)咨詢模塊。本模塊分為院校信息庫和專業(yè)信息庫兩個子功能模塊。其中院校信息庫子功能模塊設置了區(qū)域、院校類別、985/211、大學名稱等查詢條件,系統可根據用戶設置的查詢條件自動甄選目標院校,并提供目標院校的學校類型、學歷層次、院校介紹、重點學科、特色專業(yè)、學科評估等信息,幫助考生快速了解目標院校的相關信息。專業(yè)信息庫子功能模塊主要包括專業(yè)介紹的查詢功能。專業(yè)介紹查詢功能可根據用戶選擇的目標專業(yè)向用戶展示該專業(yè)的科目設置、發(fā)展前景和就業(yè)方向,幫助考生根據個人興趣遴選目標專業(yè)。(2)數據分析模塊。本模塊中院校數據分析模塊可根據用戶設置的院校名稱、所在區(qū)域等查詢條件,從高考志愿填報數據庫中查詢該校往年的投檔分數、計劃招生人數、錄取最低分、錄取最高分、批次分數線等信息為考生提供參考。(3)測評中心模塊。本模塊是針對部分考生在填報志愿時由于自身的職業(yè)傾向不明確而導致專業(yè)選擇迷茫的情況而設計的,本模塊提供的測評有助于考生更加清晰地認識自我,明確職業(yè)方向,確定報考學校、專業(yè)。(4)本系統構建的高考志愿填報信息庫以全國各高校官方數據信息的為依托,通過高校招生信息數據挖掘系統獲取院校、專業(yè)的最新招生信息。(5)高校招生信息數據挖掘系統設計。高校招生信息數據挖掘系統采用分布式體系結構,以高考志愿填報數據庫、普招電子數據、應用編程接口、部分高校網絡應用提供的大型數據文件為數據依托,采用分析、預測、關聯規(guī)則、聚類等挖掘方法,從大量的、不完全的、模糊的實際應用數據中,發(fā)現隱含在其中的院校、專業(yè)之間的關系,通過對考生成績、院校關系、歷史錄取分數、招生計劃等有效信息進行分析、統計、推理,為考生填報志愿提供預測建議。
我們通過網頁設計、編寫算法、建立數據庫來實現高考志愿填報系統的運行。
我們利用Dreamweaver CS以及騰訊云軟件進行了多級頁面設計。例如院校庫、志愿選擇、專業(yè)解讀、咨詢等功能二級頁面的設計,“高校圈”中也嵌入了部分高校首頁的網頁鏈接。還使用騰訊云平臺制作了多個靜態(tài)頁面,以增加app的豐富度。
我們采用改進的K-Means算法,對本項目進行了整體的架構設計,并寫出了算法文檔。我們從對考生志愿分析這一角度考慮并根據平行志愿方式的實際,考生填報志愿時要遵循一定的策略:如采取“沖A、穩(wěn)B、守C、保D”的方法。最終的聚類結果除了希望滿足均方誤差和較小這一目標函數以外,還希望使得各個聚類中心之間的距離能盡量遠一些,從而實現我們想要得到的大數據智能篩選出我們推薦的學校專業(yè)等。
通過書籍、網絡等途徑已獲取部分高校及專業(yè)近年來的高考數據,我們利用Mysql將獲取的這些數據進行整合,得到一個數據庫,從而支持算法的運行。
高考志愿的填報對考生能否被理想大學錄取起著關鍵性作用。本文介紹的“高考志愿輔助填報系統”綜合分析了考生在填報志愿過程中的各方面需求,應用 K-Means算法、MySQL、大數據分析等技術,為考生高考志愿填報提供信息查詢、投檔分析、模擬填報、報考預測等,具有較高的應用價值。