周沭玲
基于卷積神經(jīng)網(wǎng)絡的網(wǎng)頁信息資源定向抽取方法研究
周沭玲
(合肥財經(jīng)職業(yè)學院 人工智能學院,合肥 230601)
為了提高分布式融合集成網(wǎng)絡網(wǎng)頁信息資源定向抽取能力,提出基于卷積神經(jīng)網(wǎng)絡的分布式融合集成網(wǎng)絡網(wǎng)頁信息資源定向抽取方法。構建分布式融合集成網(wǎng)絡網(wǎng)頁信息的自適應聚類處理模型,獲得分布式融合集成網(wǎng)絡網(wǎng)頁信息數(shù)據(jù)集合,采用多重屬性調(diào)度的方法,建立高分布式融合集成網(wǎng)絡網(wǎng)頁信息檢測的模糊度訓練集,實現(xiàn)對網(wǎng)頁信息資源的模糊參數(shù)辨識與融合,采用最優(yōu)策略下均衡控制的方法,得到高分布式融合集成網(wǎng)絡網(wǎng)頁信息的模糊決策特征調(diào)度矩陣,通過自相關檢測識別與參數(shù)尋優(yōu)的方法實現(xiàn)網(wǎng)頁信息資源的定向抽取。仿真結果表明,采用該方法進行網(wǎng)頁信息資源定向抽取的精度較高,自適應性較好,提高了網(wǎng)頁信息資源定向抽取能力。
分布式融合集成網(wǎng)絡;卷積神經(jīng)網(wǎng)絡;網(wǎng)頁信息資源;定向抽取
隨著分布式融合集成網(wǎng)絡網(wǎng)頁信息規(guī)模的增大,需要對該信息進行有效定位檢測,構建分布式融合集成網(wǎng)絡網(wǎng)頁信息融合模型,采用分叉樹決策方法,結合對分布式融合集成網(wǎng)絡網(wǎng)頁信息的特征分布,采用語義信息特征識別和中文標簽定位,實現(xiàn)對分布式融合集成網(wǎng)絡網(wǎng)頁信息定位檢測。結合大數(shù)據(jù)分析技術,構建網(wǎng)頁信息資源定向抽取的信息定位模型[1],通過語義信息分析方法,實現(xiàn)對網(wǎng)頁信息資源定向抽取,研究網(wǎng)頁信息資源定向抽取方法,在網(wǎng)頁大數(shù)據(jù)信息挖掘和特征檢測中具有重要意義[2]。
對分布式融合集成網(wǎng)絡網(wǎng)頁信息的定位是建立在語義特征分析和標簽識別基礎上,構建分布式融合集成網(wǎng)絡網(wǎng)頁信息參數(shù)特征檢測模型,采用關聯(lián)特征挖掘技術,實現(xiàn)對分布式融合集成網(wǎng)絡網(wǎng)頁信息定位[3],傳統(tǒng)方法中,對分布式融合集成網(wǎng)絡網(wǎng)頁信息定位抽取方法主要有基于模糊參數(shù)匹配的分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取方法、基于特征演化和融合聚類分析的網(wǎng)頁信息資源抽取方法、基于最大信息熵特征匹配的分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取方法等[4-6],構建分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取的參數(shù)特征分布模型,結合樣本數(shù)據(jù)融合的方法,實現(xiàn)對分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取,但傳統(tǒng)方法進行分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取的特征聚類性不好,抽取的精度不高。針對上述問題,本文提出基于卷積神經(jīng)網(wǎng)絡的分布式融合集成網(wǎng)絡網(wǎng)頁信息資源定向抽取方法。首先構建高分布式融合集成網(wǎng)絡網(wǎng)頁信息的定向數(shù)據(jù)采集模型,結合頻繁項挖掘方法進行分布式融合集成網(wǎng)絡網(wǎng)頁信息資源融合和模糊定位處理,采用卷積神經(jīng)網(wǎng)絡確定分布式融合集成網(wǎng)絡網(wǎng)頁信息資源的驅(qū)動信息特征量。然后根據(jù)網(wǎng)頁信息資源數(shù)據(jù)樣本的位置分布,結合聚類分析方法,實現(xiàn)對網(wǎng)頁信息資源定向抽取的模糊參數(shù)辨識,通過自適應尋優(yōu)和二乘規(guī)劃算法,利用極大熵原理來確定信息資源的位置參數(shù),建立卷積神經(jīng)網(wǎng)絡的動態(tài)調(diào)節(jié)彈性網(wǎng)絡神經(jīng)元解析控制模型,通過參數(shù)尋優(yōu)和大數(shù)據(jù)挖掘,實現(xiàn)對網(wǎng)頁信息資源定向抽取。最后進行仿真測試分析,展示了本文方法在提高網(wǎng)頁信息資源定向抽取能力方面的優(yōu)越性能。
為了實現(xiàn)分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取,結合標簽識別方法,構建分布式融合集成網(wǎng)絡網(wǎng)頁信息定向數(shù)據(jù)采集模型,將數(shù)據(jù)集中的數(shù)據(jù)點劃分為為多變量分布區(qū)間,通過分區(qū)塊調(diào)度的方法,構建分布式融合集成網(wǎng)絡網(wǎng)頁信息的自適應融合聚類處理模型[7],結合語義關系知識庫和概念庫檢測的方法,實現(xiàn)分布式融合集成網(wǎng)絡網(wǎng)頁信息的中文多標簽識別,通過模糊樣本提取,得到分布式融合集成網(wǎng)絡網(wǎng)頁信息的標簽樣本分布序列,為
圖1 分布式融合集成網(wǎng)絡網(wǎng)頁信息采集的分岔數(shù)模型
在分布式融合集成網(wǎng)絡網(wǎng)頁信息采集的分岔數(shù)模型的基礎上提取數(shù)據(jù)信息,構建高分布式融合集成網(wǎng)絡網(wǎng)頁信息的加權信息參數(shù)融合模型,促進網(wǎng)頁信息資源的參數(shù)融合。
采用卷積神經(jīng)網(wǎng)絡學習方法,獲得分布式融合集成網(wǎng)絡網(wǎng)頁信息資源分布的列表屬性,將哈希表中所有值并入結果集合中[12],得到高分布式融合集成網(wǎng)絡網(wǎng)頁信息抽取的特征權重為
其中,高分布式融合集成網(wǎng)絡網(wǎng)頁特征空間的聚類函數(shù)滿足
采用最優(yōu)策略下均衡控制的方法,建立高分布式融合集成網(wǎng)絡網(wǎng)頁信息的模糊特征調(diào)度矩陣:
將任意概念集空間進行特征分解,構建高分布式融合集成網(wǎng)絡網(wǎng)頁信息定向抽取的目標函數(shù),提高分布式融合集成網(wǎng)絡網(wǎng)頁信息資源定向抽取能力。
引入社會最優(yōu)接入率作為測試集,采用多層次的空間聚類分析方法,構建分布式融合集成網(wǎng)絡網(wǎng)頁信息資源特征信息重組模型[13],得到分布式融合集成網(wǎng)絡網(wǎng)頁信息資源融合的優(yōu)先控制參數(shù)特征集為
綜上分析,采用卷積神經(jīng)網(wǎng)絡學習,得到分布式融合集成網(wǎng)絡網(wǎng)頁信息資源抽取的卷積函數(shù)為
綜上分析,通過自適應尋優(yōu)和二乘規(guī)劃算法,利用極大熵原理來確定信息資源的位置參數(shù),建立卷積神經(jīng)網(wǎng)絡的動態(tài)調(diào)節(jié)彈性網(wǎng)絡神經(jīng)元解析控制模型,通過參數(shù)尋優(yōu)和大數(shù)據(jù)挖掘,實現(xiàn)對網(wǎng)頁信息資源定向抽取。
為了驗證基于卷積神經(jīng)網(wǎng)絡的網(wǎng)頁信息資源定向抽取方法的實際應用性能,設計如下仿真實驗。
實驗環(huán)境:實驗以分布式融合集成網(wǎng)絡為例,網(wǎng)頁信息資源采集的樣本數(shù)為1200,測試集為240,網(wǎng)頁信息資源抽取的訓練集規(guī)模為200,信息分布的頻譜帶寬為15.8dB,相似度系數(shù)為0.14,網(wǎng)頁信息資源分布的關聯(lián)系數(shù)為0.26。根據(jù)上述參數(shù)設定,得到網(wǎng)頁信息資源抽取的節(jié)點定位結果如圖2所示。
圖2 網(wǎng)頁信息資源抽取的節(jié)點定位結果
圖2中顯示了網(wǎng)頁信息資源抽取過程的節(jié)點定位采集結果,可以看出,采集節(jié)點分布較為廣泛,可以提高實驗結果的可靠性。
以圖2結果為基礎抽取網(wǎng)頁信息資源,將本文方法與傳統(tǒng)的基于條件隨機場模型的大數(shù)據(jù)資源定向抽取方法(文獻[2]方法)和基于分段融合調(diào)度的大規(guī)模信息智能定向檢索挖掘方法(文獻[7]方法)進行對比,得到不同方法抽取到的網(wǎng)頁信息資源的收斂值輸出如圖3所示。
圖3 網(wǎng)頁信息資源的收斂值輸出結果
分析圖3所示結果可知,文獻[2]方法的收斂度在最初略高于文獻[7]方法,后期存在明顯的下降。而本文方法的收斂度曲線始終位于文獻[2]方法和文獻[7]方法之上,其最大收斂度接近于0.8,說明應用本文方法抽取網(wǎng)頁信息資源的收斂度較好,可以提高抽取結果的特征聚類性和定向性。
在此基礎上,測試不同方法抽取網(wǎng)頁信息資源抽取的誤差,得到對比結果如表1所示。
分析表1所示結果可知,隨著待抽取樣本數(shù)量的增加,不同方法的誤差率也隨之增加。相比之下,文獻[2]方法和文獻[7]方法進行網(wǎng)頁信息資源抽取時的誤差率更高,而本文方法的誤差率偏低一些,最大的誤差率僅為0.30,證明本文方法的抽取精度較高、具有良好的自適應性。
結合大數(shù)據(jù)分析技術,構建網(wǎng)頁信息資源定向抽取的信息定位模型,通過語義信息分析方法,實現(xiàn)對網(wǎng)頁信息資源定向抽取,本文提出基于卷積神經(jīng)網(wǎng)絡的分布式融合集成網(wǎng)絡網(wǎng)頁信息資源定向抽取方法。構建分布式融合集成網(wǎng)絡網(wǎng)頁信息定向數(shù)據(jù)采集模型,結合語義關系知識庫和概念特征庫檢測的方法,實現(xiàn)分布式融合集成網(wǎng)絡網(wǎng)頁信息的中文多標簽識別和特征分析,根據(jù)網(wǎng)頁信息資源數(shù)據(jù)樣本的位置分布,結合屬性融合聚類分析方法,實現(xiàn)對網(wǎng)頁信息資源定向抽取的模糊參數(shù)辨識與融合,采用卷積神經(jīng)網(wǎng)絡實現(xiàn)對網(wǎng)頁信息資源定向抽取。分析得知,本文方法進行網(wǎng)頁信息資源抽取的精度較高,聚類性較好,誤差較小。
表1 網(wǎng)頁信息資源抽取的誤差率對比結果
[1] 廖彬,張?zhí)?,于炯,? 多MapReduce作業(yè)協(xié)同下的大數(shù)據(jù)挖掘類算法資源效率優(yōu)化[J]. 計算機應用研究,2020, 37(5): 1321-1325.
[2] 程月. 大數(shù)據(jù)資源中用戶需求信息定向提取仿真[J]. 計算機仿真,2018, 35(5): 422-425.
[3] 馬峻巖,張穎,李易,等. HA2:層次化的物聯(lián)網(wǎng)感知設備固件異常分析技術[J]. 計算機工程與應用,2019, 55(22): 60-68.
[4] 李帥,王國胤,楊潔. 基于云綜合方法的三支群決策模型[J]. 計算機應用,2019, 39(11): 3163-3171.
[5] 王亮,冶繼民. 整合DBSCAN和改進SMOTE的過采樣算法[J]. 計算機工程與應用,2020, 56(18): 111-118.
[6] 李孜穎,石振國. 面向大數(shù)據(jù)任務的調(diào)度方法[J]. 計算機應用,2020, 40(10): 2923-2928.
[7] 朱飛燕. 大數(shù)據(jù)資源調(diào)度中多種類復雜信息智能定向檢索[J]. 自動化與儀器儀表,2019, 32(02): 124-127.
[8] 方軍,張璋,張雪峰,等. 基于均衡適應度的云工作流調(diào)度算法[J]. 計算機應用與軟件,2019, 36(5): 255-261.
[9] 張引,陳敏,廖小飛. 大數(shù)據(jù)應用的現(xiàn)狀與展望[J]. 計算機研究與發(fā)展,2013, 50(Z2): 216-233.
[10] 李罡,吳志軍. 基于多QoS約束條件的廣域信息管理系統(tǒng)任務調(diào)度算法[J]. 通信學報,2019, 40(7): 27-37.
[11] Shu W, Qian W, Xie Y, et al. An efficient uncertainty measure-based attribute reduction approach for interval-valued data with missing values[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2019, 27(6): 931-947.
[12] 賈博婷,趙天威,祝志川. 基于熵值修正G2賦權的綜合評價方法及實證[J]. 統(tǒng)計與決策,2019, 35(8): 30-35.
[13] 王楚捷,王好賢. M-CORD下無線接入網(wǎng)絡資源分配研究[J]. 計算機工程與應用,2018, 54(22): 92-98.
[14] 周亮. 基于語義相似性關聯(lián)特征提取的大數(shù)據(jù)挖掘技術[J]. 智能計算機與應用,2018, 8(5): 134-137, 142.
[15] 李宇海,于快快. 基于局部自相關性的特異性光譜譜段選取算法[J]. 光電技術應用,2018, 33(2): 20-23, 31.
Research on directional extraction method of Web information resources based on convolutional neural network
ZHOU Shu-ling
(Institute of Artificial Intelligence, Hefei College of Finance & Economics, Hefei 230601, China)
In order to improve the directional extraction ability of distributed fusion integrated network Web page information resources, a method of directional extraction of distributed fusion integrated network Web page information resources based on convolutional neural network is proposed. Construct a distributed fusion integrated network Web page information adaptive deletion clustering processing model, obtain a discrete set of distributed fusion integrated network Web page information data, adopt multiple attribute scheduling methods, and establish a highly distributed fusion integrated network Web page information detection ambiguity. The training set realizes the identification and fusion of fuzzy parameters of Web page information resources, adopts the method of balanced control under the optimal strategy, and obtains the fuzzy decision feature scheduling matrix of highly distributed fusion integrated network Web page information, and identifies and optimizes parameters through autocorrelation detection. The method achieves the targeted extraction of Web information resources. The simulation results show that this method has higher accuracy and better adaptability for directional extraction of Web information resources, which improves the ability of directional extraction of Web information resources.
distributed converged integrated network;convolution neural network;Web information resources;directional extraction
2020-12-18
周沭玲(1983-),女,江蘇沭陽人,講師,碩士,主要從事軟件工程、管理信息化研究,zhouzhou_508@163.com。
TP391.1;TP183
A
1007-984X(2021)04-0033-05