趙天成
(北京傳大信息科技有限公司 北京市 110106)
網絡招聘的不斷發(fā)展,為有效解決我國大學生求職難就業(yè)問題等開辟了新的途徑。由于上網招聘途徑非常便捷,使得網絡求職招聘已經成了目前受到大學生廣泛和受歡迎的一種求職招聘方式。網絡招聘最突出的一個優(yōu)點是招聘信息量大,資源豐富,更新信息速度快,招聘到的職位多等,符合大學生畢業(yè)希望以快捷便利的方式及時獲得最多最有效招聘信息的要求[1]。
國內網上求職并沒有取得良好的預期效果,原因是多方面的,網絡招聘其基本特點和服務趨向,服務廣泛的第三方的企業(yè)和應聘者。鑒于此,其所需要服務的對象十分寬廣,以及在網站建設和論壇管理上,都存在各種缺陷,從而限定了其進一步發(fā)展。如在中介網站中,其所需服務的人流量十分大,而在流程管理上卻比較單一,因而難以給用人單位和應聘者提供個性化服務,從而使其服務方式僵硬,不具備靈活性[2,3]。
從平臺功能上看,大部分人才網站提供的服務歸結起來主要就是人才供求信息的收集與發(fā)布,形式、內容和功能單一,信息量太大,針對性不強,智能化不夠,遠沒有發(fā)揮網絡的互動和交流效果,對大多數有人才需求的企業(yè)和求職的學生來說不能提供足夠的幫助。
隨著社會分工的深入以及現(xiàn)代信息網絡技術的不斷普及,職業(yè)和工作崗位將可能會更加清晰細化。一方面,企業(yè)需要在有限的成本下找到專業(yè)化的人才,另一方面,應聘者也希望能快速搜尋和匹配到合適的工作崗位。人才供需雙方都需要互聯(lián)網招聘平臺提供更專業(yè)、細致的服務,而當前主流的互聯(lián)網招聘平臺都是多行業(yè)甚至全行業(yè)覆蓋,往往很難提供專業(yè)和精細的服務。未來立足于專業(yè)化、細分化服務的招聘平臺將更受歡迎。
因此,有必要開發(fā)面向大學生的智能招聘系統(tǒng),為企業(yè)招聘和大學生就業(yè)牽線搭橋,來彌補招聘網站存在的一些不足。此外,人工智能飛速發(fā)展,并且應用越來越廣泛,在這種條件下,通過與人工智能方法結合開發(fā)招聘系統(tǒng),可為企業(yè)招聘和大學生求職提供一個更有效的途徑。
根據大學生未來求職的行業(yè)特點和不同企業(yè)對各類專業(yè)人才的市場需求情況來進行設計本招聘系統(tǒng)也正是為了更好適應這種市場形勢,一個企業(yè)智能專業(yè)人才招聘網站管理系統(tǒng)將盡可能為企業(yè)招聘者和其他應聘者之間提供一個更安全適合的招聘平臺,通過這個網站平臺企業(yè)就可以及時招聘更多專業(yè)人才和為大學生尋找工作提供方便。
大數據和人工智能等新時代的到來,給我國網絡企業(yè)招聘服務行業(yè)發(fā)展帶來諸多新機遇和新發(fā)展挑戰(zhàn)。眾多傳統(tǒng)互聯(lián)網企業(yè)招聘服務平臺已經積累了大量的招聘數據分析資源,而僅僅依靠這種傳統(tǒng)的專業(yè)人力資源檢索招聘模式顯然不能很好適應當今社會快速穩(wěn)步發(fā)展的人才需求。互聯(lián)網的快速發(fā)展也使數字檢索分析算法技術得到了充分的綜合發(fā)展,從小規(guī)模的文獻檢索到大規(guī)模的億級網頁檢索,檢索的效率和質量都得到不斷提高,因此,基于信息檢索的方法論來處理職位匹配問題,可以提高網絡招聘過程中的職位搜索的效率,提升用戶體驗。人工智能技術的應用將推動網絡招聘行業(yè)升級發(fā)展,使用大數據中的數據挖掘技術,建立特征模型,通過提取簡歷中關鍵信息實現(xiàn)簡歷篩選,可以提高招聘效率。大數據和人工智能技術為后來者提供了彎道超車的機會。
圖1:面向用戶(大學生應聘者)的數據流圖
圖2:職位結構化信息索引建立方法
招聘系統(tǒng)解決的關鍵問題就是針對各類招聘求職信息的收集、分析和管理的過程,需要充分發(fā)揮信息化技術對招聘信息管理所起到的支撐作用和關鍵作用。把領先的信息技術應用到系統(tǒng)設計和軟件開發(fā)過程中,考慮采用先進的軟件開發(fā)框架進行系統(tǒng)實現(xiàn);同時,對基于大數據和人工智能的職位搜索和簡歷篩選的方法進行初步的探索。
針對應聘者,需要的功能包括身份管理、信息管理、消息管理和智能分析等。身份管理功能分為系統(tǒng)注冊和登錄;信息管理模塊包括填寫簡歷和簡歷投遞;消息管理功能包括對感興趣的招聘信息設置關注,收藏某一條重要的招聘信息;智能分析功能包括招聘職位的分類瀏覽、招聘職位按薪資和時間排序,以及進行職位搜索。面向用戶的數據流如圖1所示。
由于招聘網站的招聘信息越來越多,搜索引擎是應聘者發(fā)現(xiàn)職位的主要方式。
圖3:職位搜索流程圖
本系統(tǒng)的職位搜索引擎是簡單而直觀的,只有一個輸入:關鍵字。搜索結果頁面展示了一個匹配的職位列表,并基于相關性進行了排序。
索引是現(xiàn)代搜索引擎的核心,要在大量的文檔中搜索含有某個關鍵詞的文檔,如果不建立索引就需要把這些文檔順序的讀入內存,然后檢查這個文檔中是不是含有要查找的關鍵詞,這樣會耗費非常多的時間。最流行的搜索引擎Lucene 采用的是一種稱為反向索引(inverted index)的機制[4]。反向索引維護了一個詞/短語表,對于這個表中的每個詞/短語,都有一個鏈表描述了有哪些文檔包含了這個詞/短語。在用戶輸入查詢條件的時候,能非??斓牡玫剿阉鹘Y果。
Lucene執(zhí)行索引的關鍵對象類是Document(文檔)和Field(域)。Document對象理解為虛擬文檔,比如文本文件、Web頁面或者E-mail信息,域代表文檔的標題、正文或元數據。Document 對象為一個包含多個Field 對象的容器,各個域按照索引操作順序添加進去。在搜索時,所有域的文本就連接在一起,作為一個文本域來處理。
在本系統(tǒng)中,建立索引的輸入是招聘職位信息表不同字段的內容用不同的 field 存儲。職位結構化信息索引建立方法如圖2所示。
文本文件在被索引之前,要先用Analyzer(分詞器)進行處理。本文采用的分詞器為IK Analyzer,是一個開源的基于java 語言開發(fā)的中文分詞工具包,采用了特有的“正向迭代最細粒度切分算法”,提供了強大的中文分詞能力[5]。
Elasticsearch[6]是一個分布式、RESTful 風格的搜索和數據分析引擎,默認是通過相關度來對結果進行排序的,最相關的文檔在最前面。
為了按照相關性來排序,需要將相關性表示為一個數值。在Elasticsearch 中,相關性得分由一個浮點數進行表示,_score 的評分越高,相關性越高。在搜索結果中通過_score 參數返回。
本搜索相關性算法主要是計算招聘職位信息表中不同字段的值相對于檢索詞相似程度,包括:
(1)檢索詞頻率:檢索詞在該字段出現(xiàn)的頻率越高,相關性也越高。
(2)字段長度準則:檢索詞出現(xiàn)字段的長度越長,相關性越低。一條記錄所有的字段計算得出的評分會被合并到總的相關性評分中。
本系統(tǒng)實現(xiàn)了全文檢索,為用戶提高查詢關鍵字,系統(tǒng)對用戶查詢詞進行分析并檢索出與用戶查詢詞匹配的招聘信息列表并返回給用戶。流程圖見圖3。
招聘職位信息瀏覽是在搜索引擎之外加入多種職位排序作為一個新的交互模式。許多的應聘者會通過網頁瀏覽來查看招聘職位信息,個性化的職位排序可以幫助用戶來發(fā)現(xiàn)額外的未被搜索所涵蓋的職位。
注冊用戶或者非注冊用戶在瀏覽招聘信息對比較感興趣可以點擊職位信息名片進一步查看職位的詳細內容。系統(tǒng)會記錄該招聘職位的點擊次數。
注冊的用戶在使用系統(tǒng)時,如果對于正在瀏覽的招聘信息比較感興趣可以將該招聘職位加入到自己的收藏夾,如同瀏覽器的收藏夾的功能。用戶可以隨時查看收藏夾中的招聘職位列表,也可將收藏夾中的網頁進行刪除。
根據招聘職位的點擊次數和收藏的次數,系統(tǒng)計算招聘職位的熱度。熱門職位網頁就是系統(tǒng)將招聘職位按照熱度進行排序的職位瀏覽網頁。熱門網頁對應聘者、招聘者甚至整個社會都有很大的價值,可以看到目前求職的趨向。
基于行為的方法會遇到所謂的冷啟動問題:如果只有很少的用戶和用戶活動數據,就很難生成高質量的推薦。因此,系統(tǒng)還按薪資和用戶信息進行職位排序,生成了含金量最高職位網頁和感興趣的職位網頁。
含金量最高職位網頁就是系統(tǒng)將招聘職位按照最高薪資進行排序的職位瀏覽網頁。熱門網頁對應聘者、招聘者甚至整個社會也有很大的價值,可以看到目前招聘的趨向。
感興趣的職位推薦針對已經注冊的用戶,系統(tǒng)根據用戶在注冊時提供的用戶學歷信息、專業(yè)信息、求職意向、工作地點和感興趣職位的收藏記錄。當招聘者發(fā)布新的招聘信息,系統(tǒng)通過計算招聘信息與用戶興趣的相關性,如果相關性達到閾值系統(tǒng)自動向用戶推送這個職位的信息。用戶在消息盒子中可以看到系統(tǒng)推薦的職位列表,如果感興趣就點擊瀏覽該職位的詳細信息網頁。
職位排序和推薦將隨著用戶點擊發(fā)生變化,系統(tǒng)的這些智能功能是的系統(tǒng)變得更加得動態(tài)。職位搜索、職位排序和職位模型整合起來使用,使每一個用戶能更快找到自己合適的職位。
數字檢索分析算法技術得到了充分的綜合發(fā)展,從小規(guī)模的文獻檢索到大規(guī)模的億級網頁檢索,檢索的效率和質量都得到不斷提高,因此,基于信息檢索的方法論來處理職位匹配問題,可以提高網絡招聘過程中的職位搜索的效率。人工智能技術的應用將推動網絡招聘行業(yè)升級發(fā)展,使用大數據中的數據挖掘技術,建立特征模型實現(xiàn)職位排序,實現(xiàn)更好的交互模式,提升用戶體驗。