• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      政策解讀大數(shù)據(jù)分析應(yīng)用的實(shí)踐探究

      2019-04-29 06:06:18譚辛
      中國傳媒科技 2019年3期
      關(guān)鍵詞:多維度分類政策

      文/譚辛

      引言

      每年國家各級政府部門都有大量的政策發(fā)布,政策內(nèi)容涉及到社會發(fā)展和民生的方方面面,因此每項(xiàng)新政發(fā)布都備受關(guān)注。政策發(fā)布的目的是什么,如何詳細(xì)解讀政策,政策發(fā)布后哪些行業(yè)領(lǐng)域受到怎樣的影響,在政策以及解讀已成為媒體界、企業(yè)界、學(xué)術(shù)界,以及普通百姓等社會各方關(guān)注的焦點(diǎn)。如何快速和全面地收集和分析政策及解讀數(shù)據(jù)具有現(xiàn)實(shí)的意義。

      本文介紹通過自動化的網(wǎng)絡(luò)信息抓取技術(shù)、大數(shù)據(jù)技術(shù)和文本智能挖掘技術(shù),快速高效地匯聚最新政策和政策解讀信息,并在此基礎(chǔ)上進(jìn)行政策關(guān)鍵要素信息提取、數(shù)據(jù)多維度分類、數(shù)據(jù)關(guān)聯(lián)等加工處理,從而形成一套政策解讀的數(shù)據(jù)產(chǎn)品,為媒體從業(yè)者、行業(yè)研究人員、企業(yè)界提供多場景和多角色的信息服務(wù),提升信息獲取和數(shù)據(jù)研究的工作效率。

      1.政策信息獲取難點(diǎn)

      各行業(yè)對最新政策信息獲取具有較高的需求和要求。對于媒體行業(yè),需要第一時間獲取到政策發(fā)布信息,并針對新政撰寫宣傳報(bào)道或解讀性文章,稿件發(fā)布的時效性體現(xiàn)并影響著媒體的傳播力和影響力;對于企業(yè)而言,需要及時研究新政對企業(yè)發(fā)展、研發(fā)投入、市場變化、決策分析等方面帶來的影響而制定企業(yè)內(nèi)部策略,很多政策的發(fā)布對企業(yè)發(fā)展方向有著至關(guān)重要的影響。但政策信息來源廣泛、發(fā)布時間不集中、信息有待關(guān)聯(lián)整合等制約了政策信息的獲取。

      1.1 政策數(shù)據(jù)來源廣泛

      政策發(fā)布均來自各級政府部門,對于個人查詢政策信息的難度在于來源廣泛的問題。首先,權(quán)威的政策查詢源頭為政府部門的官方網(wǎng)站、官方新聞客戶端、官方微信公眾號和官方認(rèn)證微博,發(fā)布源頭類型較多;其次,政府部門按級別、按部門類型,數(shù)量較為龐大,即便僅關(guān)注單一領(lǐng)域的政策,也需要關(guān)注多個政府官方信息發(fā)布源頭;再次,對于政策發(fā)布后的政策解讀文章,除了政府官方網(wǎng)站的官方解讀文章外,政府部門官員、領(lǐng)域內(nèi)專家學(xué)者、研究機(jī)構(gòu)的研究人員、媒體業(yè)專家等撰寫的解讀文章也具有非常高的閱讀價(jià)值,但是這些來源更為廣泛,可能來自比如新聞門戶網(wǎng)站、新聞客戶端、報(bào)紙或紙媒電子報(bào)、機(jī)構(gòu)的微信公眾號或微博、領(lǐng)域內(nèi)專家學(xué)者個人的博客、公眾號或微博等??傊?,想要快速瀏覽到各方發(fā)表的政策解讀信息存在一定困難。

      1.2 發(fā)布時間不一

      每年發(fā)布的政策中,只有很少一部分是在固定時間段內(nèi)發(fā)布,另外的大部分都是根據(jù)社會發(fā)展需要而實(shí)時推出的,無法提前準(zhǔn)備政策信息獲取工作。

      綜上所述,在信息過載的當(dāng)下,如何快速高效獲取政策和解讀信息,如何精準(zhǔn)獲取各行業(yè)研究人員需要的數(shù)據(jù),如何借助人工智能和機(jī)器分析能力匯聚分析信息為研究人員服務(wù),成為政策解讀應(yīng)用需要解決的關(guān)鍵問題。

      2.政策解讀大數(shù)據(jù)分析的應(yīng)用實(shí)踐

      政策解讀應(yīng)用借助大數(shù)據(jù)和人工智能技術(shù),實(shí)現(xiàn)了自動化的信息采集、多維度的自動標(biāo)引、文本挖掘和關(guān)聯(lián)分析,通過可視化的展示提升了政策及政策解讀信息的使用效率。

      2.1 自動化監(jiān)測采集

      通過借助成熟的自動化網(wǎng)絡(luò)信息抓取軟件,實(shí)現(xiàn)對政策和解讀信息發(fā)布源頭目標(biāo)網(wǎng)站做實(shí)時監(jiān)控,把最新的網(wǎng)頁及時采集到本地,進(jìn)行內(nèi)容分析和信息過濾等流程,完成政策解讀信息本地存儲。

      數(shù)據(jù)采集過程中,應(yīng)用不僅將網(wǎng)頁的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)變成半結(jié)構(gòu)化數(shù)據(jù),同時自動提取政策名稱、發(fā)布時間、政策文本內(nèi)容,以及發(fā)文單位名稱、發(fā)布網(wǎng)站名稱、頻道名稱、發(fā)文鏈接地址等政策相關(guān)數(shù)據(jù)。后續(xù)進(jìn)行的文本挖掘和加工處理,構(gòu)建了政策元數(shù)據(jù)數(shù)據(jù)庫,為政策解讀應(yīng)用提供基礎(chǔ)數(shù)據(jù)服務(wù)。

      采集源頭主要面向一手發(fā)布數(shù)據(jù)源,而非經(jīng)過轉(zhuǎn)載后的二手?jǐn)?shù)據(jù),以保證信息獲取的及時性、準(zhǔn)確性和可靠性。

      2.2 政策和解讀信息加工處理

      數(shù)據(jù)采集技術(shù),對最新網(wǎng)絡(luò)數(shù)據(jù)實(shí)時監(jiān)控采集,解放個人瀏覽和搜索時間。文本挖掘技術(shù),提供信息自動化分類、自動聚類、智能化信息提取、數(shù)據(jù)關(guān)聯(lián)分析和數(shù)據(jù)自動標(biāo)引等一系列數(shù)據(jù)加工處理,解決政策數(shù)據(jù)孤島問題,讓政策數(shù)據(jù)應(yīng)用更加有效。圖1為政策及解讀數(shù)據(jù)加工處理流程圖。

      圖1 數(shù)據(jù)加工處理流程圖

      2.3 多維度分類標(biāo)引

      采用自動分類和規(guī)則分類技術(shù),對政策做多維度分類標(biāo)引,用以幫助不同身份用戶在不同需求場景下更加快速、有針對性地查找到所需類目和對應(yīng)的政策信息。包括政策所屬行業(yè)領(lǐng)域、所屬地域名稱、發(fā)布單位名稱、所屬主題名稱、發(fā)文形式、所屬年份等分類標(biāo)簽。分類類別舉例如表1所示。

      表1 政策分類名稱和分類值舉例

      在前端應(yīng)用功能中,利用這些政策標(biāo)簽,采用細(xì)分導(dǎo)航的方式,進(jìn)行政策列表展示。通過組合式的檢索功能對政策和解讀文章進(jìn)行搜索,讓用戶可以通過自定義關(guān)鍵詞的方式獲取個性化的檢索結(jié)果,達(dá)到快速、全面了解信息的目的。對政策和解讀文章的標(biāo)題、正文和主題提供全文檢索功能。對政策的發(fā)布單位名稱、發(fā)文形式、所屬行業(yè)領(lǐng)域、所屬地域、發(fā)布年份等字段,提供篩選功能。多維度分類標(biāo)簽,也讓頁面篩選更為靈活,為個性化訂閱提供基礎(chǔ)選項(xiàng)。

      2.4 政策文本挖掘

      對政策文本做數(shù)據(jù)挖掘和關(guān)鍵信息提取,是政策索引和檢索、信息關(guān)聯(lián)分析、多維度分類標(biāo)引等數(shù)據(jù)加工的基礎(chǔ)。采用文本自動分詞和詞性標(biāo)注等自然語言處理技術(shù),基于規(guī)則與統(tǒng)計(jì)相結(jié)合的方式,將政策文本進(jìn)行中文分詞以及政策信息提取,包括政策主題關(guān)鍵詞、相關(guān)人物、機(jī)構(gòu)、地區(qū)名稱等信息的結(jié)構(gòu)化提取,完成政策的關(guān)鍵詞和實(shí)體標(biāo)引。

      在政策信息展示功能中,通過多維度的智能分析與關(guān)聯(lián),幫助用戶快速地發(fā)現(xiàn)該政策中的關(guān)鍵信息以及關(guān)聯(lián)文章。以圖表化形式,展示政策主題詞、政策主體挖掘結(jié)果(相關(guān)人物、相關(guān)機(jī)構(gòu)、相關(guān)地區(qū))、政策解讀文章時間發(fā)布趨勢和數(shù)量;以文章標(biāo)題列表方式,展示相關(guān)政策、相關(guān)解讀文章、相關(guān)媒體報(bào)道文章。展現(xiàn)結(jié)果示意圖如圖2所示。

      圖2 政策挖掘結(jié)果展示圖

      快速挖掘多方觀點(diǎn),對多方觀點(diǎn)進(jìn)行對比展示,可以使用戶更全面地把握政策內(nèi)容。利用語義分析技術(shù),把多文章之間的相關(guān)度超過一定閾值的文章關(guān)聯(lián)到一起,實(shí)現(xiàn)復(fù)雜語義關(guān)系的深度挖掘,從而完成政策與官方解讀文章、媒體解讀文章、相關(guān)報(bào)道文章、往年政策等進(jìn)行相互關(guān)聯(lián)分析。通過數(shù)據(jù)挖掘工具對政策和解讀文章加以處理,抽取各方觀點(diǎn)句與觀點(diǎn)評價(jià)對象,再對抽取結(jié)果進(jìn)行綜合性分析,得到觀點(diǎn)分析的結(jié)果。

      2.5 可視化展示

      良好的數(shù)據(jù)呈現(xiàn)方式,對于用戶體驗(yàn)至關(guān)重要。政策解讀數(shù)據(jù)產(chǎn)品終端服務(wù)界面,采用多種瀏覽方式實(shí)現(xiàn)功能和數(shù)據(jù)的展示,來提升用戶的閱讀興趣和數(shù)據(jù)可讀性。

      采用分類導(dǎo)航和文章列表相結(jié)合的方式,幫助用戶直觀、快速和全面地獲取信息,提升工作效率。政策畫像功能,采用統(tǒng)計(jì)圖形化方式,對個性化制定時間段內(nèi)的政策進(jìn)行多種圖形展示,掌握政策在主題、行業(yè)領(lǐng)域、地區(qū)、發(fā)布機(jī)構(gòu)等全貌。數(shù)據(jù)新聞是一種用圖形化的方式來解讀新聞的創(chuàng)新形式,應(yīng)用在政策的解讀上面也有非常好的效果,可以大大提升用戶瀏覽的興趣度和理解度。圖解政策尤其對難以理解的政策內(nèi)容,或者篇幅較長的政策,更能顯示其優(yōu)勢。

      對于需要長期關(guān)注的政策類型,用戶可以設(shè)置個性化政策專題,可以訂閱所關(guān)注的行業(yè)、區(qū)域和主題的政策,對于沒加入訂閱的政策內(nèi)容不做展示,做到簡化界面和數(shù)據(jù)篩選。

      3.展望

      目前,政策解讀大數(shù)據(jù)分析應(yīng)用已經(jīng)上線為編輯記者提供服務(wù),通過大數(shù)據(jù)聚類和分析、組合檢索、政策畫像、統(tǒng)計(jì)比對的功能,讓用戶快速、全面和高效地獲取所關(guān)注的政策和解讀信息。通過HTML5、統(tǒng)計(jì)圖表、圖解等方式,提升用戶閱讀效率。通過政策專題、個性化訂閱等方式,將用戶關(guān)注的要點(diǎn)進(jìn)行固化,提升效率。政策信息獲取和基礎(chǔ)分析部分工作提效明顯,使用戶擺脫了繁瑣的篩選工作,拓寬記者報(bào)道的維度和視野,以便有更多精力和時間投入到內(nèi)容品質(zhì)提升上面。

      下一步,該服務(wù)將在融媒體技術(shù)和平臺基礎(chǔ)上結(jié)合媒體的優(yōu)勢,在信息精選和數(shù)據(jù)加工上下功夫,在內(nèi)容生產(chǎn)與用戶個性化需求之間實(shí)現(xiàn)智能匹配,探索數(shù)據(jù)增值和基于大數(shù)據(jù)技術(shù)提供數(shù)據(jù)增值服務(wù)的運(yùn)營產(chǎn)品。

      猜你喜歡
      多維度分類政策
      政策
      政策
      分類算一算
      “多維度評改”方法初探
      助企政策
      政策
      華人時刊(2019年21期)2019-11-17 08:25:07
      分類討論求坐標(biāo)
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      多維度市南
      商周刊(2017年7期)2017-08-22 03:36:22
      黎城县| 宿松县| 白河县| 洪江市| 台东县| 河津市| 宾阳县| 探索| 水富县| 湟中县| 沁阳市| 湖北省| 静乐县| 星子县| 台安县| 梁平县| 昌吉市| 泾源县| 龙陵县| 北海市| 竹北市| 宝丰县| 资阳市| 浦县| 巴马| 南部县| 韶山市| 淮滨县| 武陟县| 酒泉市| 竹溪县| 安西县| 彩票| 鹿邑县| 青岛市| 吴桥县| 古蔺县| 巴林右旗| 黔西县| 盐城市| 中江县|