李 明,劉 濱
(1.中共河北省委政法委員會(huì)辦公室,河北石家莊 050021; 2.河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,河北石家莊 050018;3.河北科技大學(xué)大數(shù)據(jù)與社會(huì)計(jì)算研究中心,河北石家莊 050018)
?
基于數(shù)據(jù)驅(qū)動(dòng)的司法公開信息化監(jiān)管系統(tǒng)
李明1,劉濱2,3
(1.中共河北省委政法委員會(huì)辦公室,河北石家莊050021; 2.河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,河北石家莊050018;3.河北科技大學(xué)大數(shù)據(jù)與社會(huì)計(jì)算研究中心,河北石家莊050018)
為了解決司法公開信息化監(jiān)管的4個(gè)突出問題,站在數(shù)據(jù)驅(qū)動(dòng)的角度,以形成價(jià)值數(shù)據(jù)為目標(biāo),將司法公開數(shù)據(jù)進(jìn)行分類,進(jìn)而給出數(shù)據(jù)處理的系統(tǒng)功能架構(gòu)、技術(shù)架構(gòu)和業(yè)務(wù)架構(gòu),涵蓋數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用、數(shù)據(jù)安全等模塊。以該架構(gòu)為基礎(chǔ)推進(jìn)系統(tǒng)建設(shè),能夠有效降低司法公開信息監(jiān)管的工作強(qiáng)度,分析工作狀態(tài),發(fā)現(xiàn)工作中的問題,促進(jìn)司法公開水平的不斷提高。
計(jì)算機(jī)信息管理系統(tǒng);數(shù)據(jù)驅(qū)動(dòng);司法公開;數(shù)據(jù)挖掘;監(jiān)管系統(tǒng)
司法公開是現(xiàn)代社會(huì)普遍遵循的司法原則,是一個(gè)國(guó)家文明程度的重要標(biāo)志,也是公民權(quán)利保障的一項(xiàng)重要內(nèi)容[1]?!吨腥A人民共和國(guó)憲法》第125條明確規(guī)定:“人民法院審理案件,除法律規(guī)定的特別情況外,一律公開進(jìn)行?!薄缎淌略V訟法》、《民事訴訟法》、《行政訴訟法》也分別對(duì)司法公開作了明確規(guī)定[2]。司法公開滿足了人民群眾日益多樣化的司法需求,對(duì)于促進(jìn)司法公正、提升司法公信力具有根本性的推動(dòng)作用[3]。
中國(guó)共產(chǎn)黨第十八屆四中全會(huì)指出:“要讓人民群眾在每一個(gè)司法案件中都感受到公平正義,構(gòu)建開放、動(dòng)態(tài)、透明、便民的陽(yáng)光司法機(jī)制?!币灾疄橹敢骷?jí)法院、檢察院、公安機(jī)關(guān)、司法行政機(jī)關(guān)(以下簡(jiǎn)稱各級(jí)各類政法機(jī)關(guān))分別開展了司法公開信息化的工作。以河北省2014年的司法公開工作為例:1)全省法院系統(tǒng)通過網(wǎng)絡(luò)直播庭審5 843件,三級(jí)法院累計(jì)公開裁判文書361 440份、公開案件流程信息813 454條;2)全省檢察系統(tǒng)共公開各類法律文書3 873份,上傳案件程序性信息27 746條、重要案件信息1 039條;3)全省公安系統(tǒng)總計(jì)發(fā)布交通安全提示信息800余萬(wàn)條、治安防范信息230余萬(wàn)條、警情信息170余萬(wàn)條、其他警務(wù)信息100余萬(wàn)條;4)全省司法行政機(jī)關(guān)共公示“減假暫”案件1.9萬(wàn)余起,上網(wǎng)公示提請(qǐng)減刑、假釋建議書和暫予監(jiān)外執(zhí)行決定書1.1萬(wàn)余份。隨著這些信息化工作的推進(jìn),迅速形成了司法公開的海量基礎(chǔ)數(shù)據(jù)資源;同時(shí),在社會(huì)計(jì)算[4-7](以手機(jī)、平板電腦、個(gè)人電腦(PC)等普及型計(jì)算能力,生成、傳播并廣泛存在于網(wǎng)絡(luò)空間的社會(huì)性內(nèi)容)普遍存在的時(shí)代背景下,微博、博客、論壇等網(wǎng)絡(luò)媒體上也形成了與司法公開工作有關(guān)的大量原文、評(píng)價(jià)和評(píng)論等社會(huì)意見,成為蘊(yùn)民情、含民聲、映民意的司法公開社會(huì)性數(shù)據(jù)資源。如何對(duì)以上兩大類司法公開的數(shù)據(jù)資源進(jìn)行處理,形成司法公開的系統(tǒng)性監(jiān)管能力,解決司法公開推進(jìn)過程中出現(xiàn)的不愿意公開、不會(huì)公開、公開不及時(shí)和不到位等問題,讓公開成為常態(tài),讓被監(jiān)督成為習(xí)慣,是一個(gè)需要迫切解決的難題。
本文站在數(shù)據(jù)驅(qū)動(dòng)[8-11]的角度,面向數(shù)據(jù)的有效利用推進(jìn)司法公開過程中價(jià)值數(shù)據(jù)的形成。首先,將司法公開數(shù)據(jù)資源分為兩類:基礎(chǔ)數(shù)據(jù)資源和社會(huì)性數(shù)據(jù)資源;繼而,以兩類數(shù)據(jù)的采集、整理、分析和應(yīng)用為線索,給出數(shù)據(jù)處理的功能架構(gòu)和技術(shù)架構(gòu),建立多領(lǐng)域、多來源、多類別數(shù)據(jù)間的融合方法,從中發(fā)現(xiàn)問題、挖掘規(guī)律、提取指導(dǎo)性規(guī)則,最終形成服務(wù)于司法公開監(jiān)督管理的決策支持類數(shù)據(jù)。本文研究工作的意義主要在于:1)探索各級(jí)各類政法機(jī)關(guān)司法公開基礎(chǔ)數(shù)據(jù)的信息化融合方法,為建立合理的數(shù)據(jù)整理體系、破除數(shù)據(jù)“條塊分割”提供可參考的思路,為建設(shè)政法系統(tǒng)內(nèi)部監(jiān)管系統(tǒng)提供依據(jù),從而形成司法公開的系統(tǒng)內(nèi)動(dòng)力;2)探索司法公開社會(huì)性數(shù)據(jù)資源的處理架構(gòu),為察民情、聽民聲、聚民智提供基礎(chǔ)性信息化手段,提高司法公開過程中人民群眾的參與程度和滿意度,形成司法公開的系統(tǒng)外動(dòng)力。
當(dāng)前,司法公開信息化監(jiān)管的問題突出表現(xiàn)為以下4點(diǎn)。
1)缺少司法公開數(shù)據(jù)的整體性采集體系。一方面,各級(jí)各類政法機(jī)關(guān)接受各級(jí)政法委指導(dǎo),開展并推進(jìn)司法公開信息化工作,形成基礎(chǔ)數(shù)據(jù)資源;另一方面,各級(jí)各類政法機(jī)關(guān)分別接受本系統(tǒng)內(nèi)的垂直管理,導(dǎo)致司法公開的基礎(chǔ)數(shù)據(jù)資源分別沉淀于各自的直管系統(tǒng)內(nèi),形成數(shù)據(jù)的“條塊分割”,導(dǎo)致缺少整體性采集體系,給司法公開工作的綜合管理帶來挑戰(zhàn)。
2)司法公開數(shù)據(jù)間缺乏深度融合和利用。由于各級(jí)各類政法機(jī)關(guān)的司法公開數(shù)據(jù)獨(dú)立,難于對(duì)其進(jìn)行深入分析和挖掘,尤其是難以梳理清楚本應(yīng)緊密聯(lián)系的法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)的法律文書業(yè)務(wù)鏈,難以形成科學(xué)有效的決策參考依據(jù)。
3) 缺少司法公開社會(huì)評(píng)價(jià)的數(shù)據(jù)分析方法和情報(bào)追蹤體系。缺少對(duì)司法公開社會(huì)性數(shù)據(jù)資源的采集與處理方法,缺少情報(bào)提煉與追蹤體系。公開之后的社會(huì)反饋機(jī)制尚不完善。司法公開本身不是最終目的,以公開促公正是方向,公開后的信息跟蹤、反饋、總結(jié)、改進(jìn)提升是重點(diǎn)。
4)缺少有效可行的信息化監(jiān)管系統(tǒng)。司法公開日常監(jiān)管的數(shù)據(jù)量大、任務(wù)量大[12],但由于配套軟、硬件建設(shè)水平較低,甚至缺少專門的業(yè)務(wù)軟件系統(tǒng),導(dǎo)致難以對(duì)司法公開數(shù)據(jù)進(jìn)行統(tǒng)一協(xié)調(diào)管理,制約了司法公開的相關(guān)工作走向深入。
本系統(tǒng)依托法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)的司法公開基礎(chǔ)數(shù)據(jù)資源,捕獲反映人民群眾對(duì)司法公開意見的社會(huì)性數(shù)據(jù)資源,實(shí)現(xiàn)對(duì)司法公開工作的情況掌握、數(shù)據(jù)分析、宏觀管理、事后監(jiān)督。系統(tǒng)功能模塊主要包括數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用、數(shù)據(jù)安全,如圖1所示。
圖1 系統(tǒng)功能架構(gòu)Fig.1 System function architecture
1)數(shù)據(jù)采集包括:①基礎(chǔ)數(shù)據(jù)資源采集模塊,獲取法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)的司法公開網(wǎng)絡(luò)平臺(tái)上的公開欄目信息;②社會(huì)性數(shù)據(jù)資源采集模塊,通過獲取各類網(wǎng)絡(luò)媒體中涉及司法公開的社會(huì)意見,為司法公開工作的精細(xì)化管理提取高質(zhì)量情報(bào);③數(shù)據(jù)標(biāo)準(zhǔn)化模塊,對(duì)海量異構(gòu)、多源多類的數(shù)據(jù)進(jìn)行清洗、規(guī)范與載入;④數(shù)據(jù)周期一致性保障模塊,實(shí)現(xiàn)不同時(shí)間窗口的數(shù)據(jù)對(duì)齊(相關(guān)數(shù)據(jù)間形成的一致性指向和表達(dá))。
2)數(shù)據(jù)整理包括:①司法公開數(shù)據(jù)的存儲(chǔ)模塊,優(yōu)化數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),整合多源多類數(shù)據(jù);②跨模態(tài)(視、聽、文、圖)數(shù)據(jù)索引模塊,支持?jǐn)?shù)據(jù)的高效更新(增、刪、改);③數(shù)據(jù)質(zhì)量保障模塊,保證內(nèi)容規(guī)范準(zhǔn)確,提高數(shù)據(jù)邏輯一致性,為數(shù)據(jù)分析、管理監(jiān)督等提供高品質(zhì)數(shù)據(jù)。
3)數(shù)據(jù)分析包括:①司法公開信息查詢模塊,支持多源多類數(shù)據(jù)的查詢;②司法公開信息規(guī)范化分析模塊,支持對(duì)于法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)的司法公開網(wǎng)絡(luò)專欄信息的規(guī)范性分析;③法律文書分析模塊,自動(dòng)統(tǒng)計(jì)分析法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)上報(bào)的各類法律文書,查漏排錯(cuò);④司法公開業(yè)務(wù)鏈分析模塊,支持對(duì)各部門在各自辦案階段的司法公開成效分析。
4)數(shù)據(jù)應(yīng)用包括:①監(jiān)測(cè)模塊,一方面監(jiān)測(cè)法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)網(wǎng)上公開情況(各欄目?jī)?nèi)容的發(fā)布和更新情況,公開工作進(jìn)展等),形成數(shù)據(jù)監(jiān)測(cè)報(bào)告,為管理決策服務(wù);另一方面,監(jiān)測(cè)司法公開相關(guān)的社會(huì)意見信息,及時(shí)形成數(shù)據(jù)分析報(bào)告,反饋給相關(guān)部門;②案件司法公開信息呈現(xiàn)模塊,根據(jù)公安機(jī)關(guān)、檢察機(jī)關(guān)、審判機(jī)關(guān)、刑罰執(zhí)行機(jī)關(guān)對(duì)一個(gè)案件分別發(fā)布的案件信息、法律文書,進(jìn)行收集、整理、分析與呈現(xiàn),并支持通過關(guān)鍵詞查詢,查看各部門在各自辦案階段的公開成效;③建設(shè)司法公開監(jiān)管反饋模塊,定期反饋相關(guān)的管理指導(dǎo)意見和監(jiān)督分析結(jié)果數(shù)據(jù)給相關(guān)部門,實(shí)現(xiàn)監(jiān)管結(jié)果在部門間的共享。
5)數(shù)據(jù)安全包括:①以系統(tǒng)使用安全權(quán)限為依據(jù),確保數(shù)據(jù)處理的過程(數(shù)據(jù)采集、整合、分析、呈現(xiàn)等)安全,限定操作人在授權(quán)范圍內(nèi)管控?cái)?shù)據(jù),保證數(shù)據(jù)不被泄露;②確保操作人在授權(quán)范圍內(nèi)使用系統(tǒng)功能,保障功能權(quán)限不被濫用;同時(shí),采用光盤擺渡機(jī)、防火墻、入侵防御系統(tǒng)等必要配置,保障系統(tǒng)運(yùn)行過程中的數(shù)據(jù)和軟硬件安全。
以數(shù)據(jù)為核心,圖2給出了數(shù)據(jù)在系統(tǒng)的流動(dòng)過程中各個(gè)主要階段的處理技術(shù)與相關(guān)硬件。由圖2可知該系統(tǒng)所涉及的主要技術(shù)領(lǐng)域有以下5個(gè)。
圖2 系統(tǒng)技術(shù)架構(gòu)Fig.2 System technical architecture
1)數(shù)據(jù)采集對(duì)于線上數(shù)據(jù)資源,利用網(wǎng)絡(luò)爬蟲[13]、數(shù)據(jù)庫(kù)接口等網(wǎng)絡(luò)信息獲取技術(shù),采集司法公開欄目信息(基礎(chǔ)性數(shù)據(jù))、司法公開社會(huì)意見信息(社會(huì)性數(shù)據(jù)),同時(shí)保證充足的帶寬和服務(wù)器能力支持;而在線下數(shù)據(jù)資源方面,利用U盤和光盤等移動(dòng)存儲(chǔ)介質(zhì),實(shí)現(xiàn)對(duì)各級(jí)各類政法機(jī)關(guān)司法公開業(yè)務(wù)數(shù)據(jù)的有效導(dǎo)入,既包括業(yè)務(wù)關(guān)聯(lián)的周期性數(shù)據(jù),也包括與特定事件相關(guān)的碎片式信息。通過線上線下的雙通道、多渠道采集,實(shí)現(xiàn)對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的海量業(yè)務(wù)數(shù)據(jù)的接入、傳輸、轉(zhuǎn)換、初步處理和管理等。
2)數(shù)據(jù)整理利用網(wǎng)頁(yè)結(jié)構(gòu)分析與清洗、自然語(yǔ)言處理[14]、文本挖掘[15]、語(yǔ)義網(wǎng)[16]等技術(shù),提煉線上線下中的可用數(shù)據(jù),去除冗余、降低噪聲和干擾項(xiàng),并借助領(lǐng)域詞典實(shí)現(xiàn)數(shù)據(jù)對(duì)齊(相關(guān)數(shù)據(jù)間形成的一致性指向和表達(dá))、借助語(yǔ)義詞典實(shí)現(xiàn)語(yǔ)義對(duì)齊[17](文字、圖片等多模態(tài)數(shù)據(jù)間的一致性和表達(dá));對(duì)于多模態(tài)數(shù)據(jù)向量化表達(dá)可能引起的維度災(zāi)難問題,利用主成分分析方法[18],實(shí)現(xiàn)有效降維度;利用索引技術(shù),對(duì)數(shù)據(jù)的主要特征分量建立索引庫(kù),支持后期高效檢索與提取。
3)數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫(kù)分為關(guān)系型數(shù)據(jù)庫(kù)、非關(guān)系型數(shù)據(jù)庫(kù)以及數(shù)據(jù)庫(kù)緩存系統(tǒng)。其中,關(guān)系型數(shù)據(jù)庫(kù)包含了傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)以及NewSQL[19]數(shù)據(jù)庫(kù)。非關(guān)系型數(shù)據(jù)庫(kù)主要指的是NoSQL[20]數(shù)據(jù)庫(kù),可分為鍵值數(shù)據(jù)庫(kù)、列存數(shù)據(jù)庫(kù)、圖存數(shù)據(jù)庫(kù)以及文檔數(shù)據(jù)庫(kù)等類型。改進(jìn)數(shù)據(jù)銷毀、透明加解密、分布式訪問控制、數(shù)據(jù)審計(jì)等技術(shù);突破隱私保護(hù)和推理控制、數(shù)據(jù)真?zhèn)巫R(shí)別和取證、數(shù)據(jù)持有完整性驗(yàn)證等技術(shù)。
4)數(shù)據(jù)分析以主題發(fā)現(xiàn)[21]、趨勢(shì)預(yù)測(cè)、熱點(diǎn)發(fā)現(xiàn)、規(guī)范性檢查等為主要任務(wù),通過采用與改造社會(huì)心理分析、網(wǎng)絡(luò)行為分析、情感語(yǔ)義分析等領(lǐng)域的數(shù)據(jù)挖掘技術(shù)[22-23]、機(jī)器學(xué)習(xí)方法[24-25]、神經(jīng)網(wǎng)絡(luò)方法[26]、遺傳算法[27-29]等等實(shí)用性工具,完成基礎(chǔ)性數(shù)據(jù)資源(司法公開、社會(huì)意見等)到知識(shí)型數(shù)據(jù)資源的轉(zhuǎn)變,形成能夠?yàn)樗痉ü_監(jiān)管業(yè)務(wù)進(jìn)行決策支持的知識(shí)性數(shù)據(jù)結(jié)果。
5)數(shù)據(jù)可視化[30-32]作為人機(jī)交互領(lǐng)域的一項(xiàng)重要工具,將從3方面充分考慮數(shù)據(jù)可視化的實(shí)用性:數(shù)據(jù)的規(guī)模與類別、決策支持所需完成的具體任務(wù)、UI設(shè)計(jì)的實(shí)用性。對(duì)顏色、線段、尺寸、距離等可視化要素予以綜合考慮;開發(fā)或利用既有的可視化引擎,形成對(duì)司法公開監(jiān)督管理的全過程決策支持能力;以平臺(tái)使用者為中心,圍繞司法公開信息化中的管理監(jiān)督需求,設(shè)計(jì)支持用戶高效閱讀、傳遞信息和操作軟件的人機(jī)交互系統(tǒng)。
根據(jù)司法機(jī)關(guān)的司法公開內(nèi)容,結(jié)合監(jiān)管的業(yè)務(wù)需求,采集并分析司法機(jī)關(guān)在互聯(lián)網(wǎng)司法公開服務(wù)工作中發(fā)布的內(nèi)容,及相關(guān)服務(wù)系統(tǒng),實(shí)現(xiàn)對(duì)各部門司法公開的管理監(jiān)督。
1)數(shù)據(jù)采集關(guān)聯(lián)業(yè)務(wù)
數(shù)據(jù)采集系統(tǒng)的關(guān)聯(lián)業(yè)務(wù)架構(gòu)如圖3所示。
圖3 數(shù)據(jù)采集系統(tǒng)關(guān)聯(lián)業(yè)務(wù)架構(gòu)Fig.3 Data acquisition related service architecture of data acquisition system
①首先,建立目標(biāo)網(wǎng)站的URL種子列表,避免過度抓取形成數(shù)據(jù)繁冗和系統(tǒng)過載,而后,以URL種子網(wǎng)址為基礎(chǔ),采用廣度優(yōu)先搜索策略(在抓取過程中,在完成當(dāng)前層次的搜索后,才進(jìn)行下一層次的搜索。為覆蓋盡可能多的網(wǎng)頁(yè),一般使用此方法)、深度優(yōu)先搜索策略(從起始網(wǎng)頁(yè)開始,選擇一個(gè)URL進(jìn)入,分析這個(gè)網(wǎng)頁(yè)中的URL,再選擇一個(gè)進(jìn)入。如此,一個(gè)鏈接一個(gè)鏈接地抓取下去,直到處理完一條路線之后再處理下一條路線)、最佳優(yōu)先搜索策略(按照一定的網(wǎng)頁(yè)分析算法,預(yù)測(cè)候選URL與目標(biāo)網(wǎng)頁(yè)的相似度,或與主題的相關(guān)性,并選取評(píng)價(jià)最好的一個(gè)或幾個(gè)URL進(jìn)行抓取。它只訪問經(jīng)過網(wǎng)頁(yè)分析算法預(yù)測(cè)為“有用”的網(wǎng)頁(yè))。利用網(wǎng)絡(luò)信息獲取技術(shù)(如網(wǎng)絡(luò)爬蟲、文本挖掘、網(wǎng)頁(yè)結(jié)構(gòu)分析等),獲取司法公開網(wǎng)絡(luò)平臺(tái)上的公開欄目信息。
②利用網(wǎng)絡(luò)爬蟲、微博API(applicationprogramminginterface)、論壇信息抽取、基于DOM(documentobjectmodel)樹結(jié)構(gòu)的提取等技術(shù),獲取來自官方媒體、門戶站點(diǎn)、社區(qū)、搜索引擎、電子刊物、微博等涉及司法公開的社會(huì)意見,可以按照不同時(shí)期、不同階段的需求,進(jìn)行周期可變的內(nèi)容抓取,并支持按照不同需求的信息采集服務(wù)組合。抓取的信息經(jīng)過內(nèi)容和格式的統(tǒng)一、規(guī)范化處理后,存入數(shù)據(jù)庫(kù)。
2)數(shù)據(jù)整理關(guān)聯(lián)業(yè)務(wù)
數(shù)據(jù)整理系統(tǒng)的主要功能包括:①司法公開相關(guān)數(shù)據(jù)的常規(guī)維護(hù),即入庫(kù)、備份、訪問控制、修正、分級(jí)、檢查、更新等,音頻、視頻、文本等結(jié)構(gòu)化信息的提取、索引與存儲(chǔ);②面向司法公開移動(dòng)服務(wù)的后臺(tái)數(shù)據(jù)提取與整理;③面向司法公開智能問答的后臺(tái)數(shù)據(jù)提取與整理。
數(shù)據(jù)整理系統(tǒng)部分關(guān)聯(lián)業(yè)務(wù)的系統(tǒng)架構(gòu)如圖4所示。
圖4 數(shù)據(jù)整理系統(tǒng)關(guān)聯(lián)業(yè)務(wù)架構(gòu)Fig.4 Related business architecture of data processing system
3) 數(shù)據(jù)分析關(guān)聯(lián)業(yè)務(wù)
數(shù)據(jù)分析系統(tǒng)的關(guān)聯(lián)業(yè)務(wù)架構(gòu)如圖5所示。
圖5 數(shù)據(jù)分析系統(tǒng)關(guān)聯(lián)業(yè)務(wù)架構(gòu)Fig.5 Data analysis system related service architecture
①司法公開網(wǎng)絡(luò)專欄監(jiān)管分析:a)對(duì)各級(jí)各類政法機(jī)關(guān)的司法公開網(wǎng)絡(luò)專欄中所呈現(xiàn)的信息,從內(nèi)容到形式進(jìn)行規(guī)范性、完整性、正確性監(jiān)管分析,對(duì)司法公開網(wǎng)絡(luò)專欄的現(xiàn)狀和問題進(jìn)行發(fā)現(xiàn)和提煉并形成報(bào)告;b)對(duì)法律文書進(jìn)行規(guī)范性分析。系統(tǒng)自動(dòng)統(tǒng)計(jì)分析法院、檢察院、公安機(jī)關(guān)和司法行政機(jī)關(guān)上報(bào)的各類法律文書,進(jìn)行規(guī)范性分析,查漏排錯(cuò),對(duì)現(xiàn)狀和問題及時(shí)發(fā)現(xiàn)并形成報(bào)告。
②司法公開社會(huì)意見分析:根據(jù)索引調(diào)用網(wǎng)絡(luò)意見數(shù)據(jù),對(duì)來自官方媒體、門戶站點(diǎn)、社區(qū)、搜索引擎、電子刊物、微博等涉及司法公開的社會(huì)意見進(jìn)行分析、分類和處理,例如,對(duì)微博輿情部分的處理流程如圖6所示。
圖6 微博輿情處理流程Fig.6 Processing flow of micro-blog opinion treatment
圖7 一般刑事案件的處理流程Fig.7 Processing flow of general criminal cases
③案件司法公開業(yè)務(wù)鏈分析:以一般刑事案件處理流程(見圖7)為例,根據(jù)公安機(jī)關(guān)、檢察機(jī)關(guān)、法院(審判)機(jī)關(guān)、司法(刑罰執(zhí)行)機(jī)關(guān)對(duì)一個(gè)案件分別發(fā)布的案件信息、法律文書,能夠?qū)⒎稚⒌男畔⑦M(jìn)行收集、整理、匯總、分析,集中完整呈現(xiàn),并通過設(shè)定關(guān)鍵詞,查看各部門在各自辦案階段的公開成效。
④社會(huì)評(píng)價(jià)分析:通過對(duì)第三方問卷發(fā)布與統(tǒng)計(jì)分析系統(tǒng)的研發(fā),支持群眾滿意度測(cè)評(píng)與當(dāng)事人滿意度測(cè)評(píng)的實(shí)現(xiàn),兩類測(cè)評(píng)分別設(shè)定不同的問卷,支持“第三方”機(jī)構(gòu)發(fā)放調(diào)查問卷(司法公開滿意度調(diào)查等)。問卷采取主、客觀相結(jié)合的方法,既可以通過門戶站點(diǎn)發(fā)布電子形式的問卷,也可以進(jìn)入社區(qū)、單位、公共場(chǎng)所等地發(fā)布紙質(zhì)問卷,在一定范圍內(nèi)采集公眾意見、當(dāng)事人/家屬意見等,并實(shí)現(xiàn)自動(dòng)統(tǒng)計(jì)分析。通過綜合兩類測(cè)評(píng),形成司法公開成效的社會(huì)評(píng)價(jià)。
4) 數(shù)據(jù)應(yīng)用關(guān)聯(lián)業(yè)務(wù)
數(shù)據(jù)應(yīng)用系統(tǒng)的關(guān)聯(lián)業(yè)務(wù)架構(gòu)如圖8所示。
圖8 數(shù)據(jù)應(yīng)用系統(tǒng)關(guān)聯(lián)業(yè)務(wù)架構(gòu)Fig.8 Related service architecture of data application system
①對(duì)于司法公開信息化工作的日常監(jiān)管,一方面,對(duì)司法公開網(wǎng)絡(luò)專欄等信息化建設(shè)工作進(jìn)行周期性的監(jiān)查、有效管理、及時(shí)督促。依據(jù)各類司法公開網(wǎng)絡(luò)信息,對(duì)欄目建設(shè)的完整性、內(nèi)容發(fā)布的規(guī)范性、法律文書的一致性、流程信息公開的及時(shí)性等問題進(jìn)行評(píng)價(jià),實(shí)現(xiàn)對(duì)一個(gè)區(qū)域、一個(gè)單位執(zhí)法和司法狀況的宏觀監(jiān)督和定期評(píng)價(jià);另一方面,獲取各類網(wǎng)絡(luò)媒體中涉及司法公開的社會(huì)意見,同時(shí),支持“第三方”機(jī)構(gòu)發(fā)放調(diào)查問卷(司法公開滿意度調(diào)查等),采集公眾意見、當(dāng)事人/家屬意見等,并實(shí)現(xiàn)自動(dòng)統(tǒng)計(jì)分析。為司法公開工作的精細(xì)化管理提取高質(zhì)量情報(bào)。
②對(duì)于系統(tǒng)管理,針對(duì)本系統(tǒng)的運(yùn)維需求(包括:軟件管理、硬件管理、數(shù)據(jù)管理和用戶管理功能)對(duì)系統(tǒng)軟硬件運(yùn)行進(jìn)行監(jiān)測(cè)、發(fā)現(xiàn)異常、更新數(shù)據(jù)、調(diào)試問題、管理日志、分配權(quán)限等。相關(guān)模塊通過部署在專用的系統(tǒng)監(jiān)測(cè)服務(wù)器和統(tǒng)計(jì)服務(wù)器上實(shí)現(xiàn)。
5) 應(yīng)用表示系統(tǒng)
該系統(tǒng)的業(yè)務(wù)架構(gòu)如圖9所示?;贐/S結(jié)構(gòu),該系統(tǒng)提供人機(jī)交互支持,司法公開信息管理的常規(guī)監(jiān)管操作;同時(shí),提供各類網(wǎng)絡(luò)媒體中涉及司法公開的社會(huì)意見分析,采用數(shù)據(jù)可視化、人機(jī)交互技術(shù)設(shè)計(jì),根據(jù)分析結(jié)果,每日自動(dòng)生成報(bào)告。用戶可通過瀏覽器直接查看并交互式調(diào)閱報(bào)告。
圖9 應(yīng)用表示系統(tǒng)業(yè)務(wù)架構(gòu)Fig.9 Business architecture of application representation system
本文針對(duì)司法公開的監(jiān)管需求,從數(shù)據(jù)驅(qū)動(dòng)的角度切入,給出了司法公開信息化監(jiān)管系統(tǒng)的功能架構(gòu),技術(shù)架構(gòu)和業(yè)務(wù)架構(gòu)。目的在于充分利用政法機(jī)關(guān)司法公開信息化形成的基礎(chǔ)性數(shù)據(jù)資源,以及反映社情民意的社會(huì)性數(shù)據(jù)資源,從而達(dá)到提升司法公開監(jiān)管效率,形成系統(tǒng)內(nèi)外的雙向合力,促進(jìn)司法公開水平的不斷提高。本文給出的各類架構(gòu)作為系統(tǒng)建設(shè)的基礎(chǔ),支持?jǐn)?shù)據(jù)規(guī)??蓴U(kuò)充、功能模塊可擴(kuò)展的特點(diǎn),例如:系統(tǒng)建成后,可以引入司法公開數(shù)據(jù)融合和挖掘系統(tǒng)、司法公開效果評(píng)價(jià)系統(tǒng)、司法公開大數(shù)據(jù)開發(fā)系統(tǒng)等,進(jìn)一步拓展系統(tǒng)服務(wù)的深度和廣度;后續(xù)還可以拓展司法公開監(jiān)管類型,探索司法公開監(jiān)管中非信息化結(jié)構(gòu)化的情況,增加司法公開監(jiān)管客戶端類型,引入便攜式終端,從而為充分利用司法公開數(shù)據(jù)推進(jìn)工作提供更方便快捷的科技手段。
/< class="emphasis_italic">References
:
[1]王晨光. 借助司法公開深化司法改革[J].法律適用,2014(3):51-56.
WANGChenguang.Deepenthejudicialreformwiththehelpofthejudicialpublic[J].JournalofLawApplication, 2014(3):51-56.
[2]李靜. 司法公開的功能、體系及保障[J]. 中國(guó)黨政干部論壇,2013(10):39-42.
LIJing.Function,systemandguaranteeofjudicialopenness[J].ChineseCadresTribune, 2013(10):39-42.
[3]李榮珍. 我國(guó)司法信息公開的若干問題探討[J]. 海南大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2014(3):63-70.
LIRongzhen.DiscussiononsomeproblemsofChina’sjudicialinformationdisclosure[J].Humanities&SocialSciencesJournalofHainanUniversity,2014(3):63-70.
[4]MENGR,GEY,CAOZ,etal.Aframeworkforgeneratinggeospatialsocialcomputingenvironments[J].IEEEIntelligentSystems, 2015, 30(1): 44-52.
[5]GAOY,CHENY,LIUKR.Understandingsequentialuserbehaviorinsocialcomputing:Toanswerortovote?[J].IEEETransactionsonNetworkScienceandEngineering, 2015, 2(3):112-126.
[6]KLIMISN,SALEMAM,IBRAHIEME.Socialmediacontentrankingbasedonsocialcomputinganduserinfluence[J].ProcediaComputerScience, 2015, 65: 148-157.
[7]KATIES,JESAK,FLEISCHMANNKR.Howtoseevaluesinsocialcomputing:Methodsforstudyingvaluesdimensions[C]//CSCW’14Proceedingsofthe17thACMConferenceonComputerSupportedCooperativeWork&SocialComputing.NewYork:ACM, 2014: 426-435.
[8]DAIX,GAOZ.Frommodel,signaltoknowledge:Adata-drivenperspectiveoffaultdetectionanddiagnosis[J].IEEETransactionsonIndustrialInformatics, 2013, 9(4): 2226-2238.
[9]LINSY,CHAOKM,LOCC.Service-orienteddynamicdatadrivenapplicationsystemstourbantrafficmanagementinresource-boundedenvironment[J].ACMSIGAPPAppliedComputingReview, 2012, 12(1): 35-49.
[10]YINS,DINGS,XIEX,etal.Areviewonbasicdata-drivenapproachesforindustrialprocessmonitoring[J].IEEETransactionsonIndustrialElectronics, 2014, 61(11): 6418-6428.
[11]LINSY,CHAOKM,LOCC,etal.Distributeddynamicdatadrivenpredictionbasedonreinforcementlearningapproach[C]//SAC’13:Proceedingsofthe28thAnnualACMSymposiumonAppliedComputing.Coimbra:ACM, 2013: 779-784.
[12]孟祥. 信息時(shí)代司法公開的認(rèn)識(shí)與實(shí)踐[J].法律適用,2015(9):117-133.MENGXiang.Understandingandpracticeofthejudicialopennessintheinformationage[J].JournalofLawApplication, 2015(9):117-133.
[13]TSAIC,KUT,CHIENW.Objectarchitecteddesignandefficientdynamicadjustmentmechanismofdistributedwebcrawlers[J].InternationalJournalofInterdisciplinaryTelecommunicationsandNetworking, 2015, 7(1): 57-71.
[14]CAMBRIAE,WHITEB.JumpingNLPCurves:Areviewofnaturallanguageprocessingresearch[J].IEEEComputationalIntelligenceMagazine, 2014, 9(2): 48-57.
[15]LIY,ALGARNIA,ALBATHANM.Relevancefeaturediscoveryfortextmining[J].IEEETransactionsonKnowledgeandDataEngineering, 2015, 27(6):1656-1669.
[16]MACASJA.Enhancinginteractiondesignonthesemanticweb:Acasestudy[J].IEEETransactionsonSystems,Man,andCybernetics(PartC):ApplicationsandReviews, 2012, 42(6): 1365-1373.
[17]ATENCIAM,SCHORLEMMERM.Aninteraction-basedapproachtosemanticalignment[J].WebSemanticsScienceServices&AgentsontheWorldWideWeb, 2012,S12/S13(2):131-147.
[18]CARLOSA,BURCUA,CARLOSE,etal.Dimensionreductioninprincipalcomponentanalysisfortrees[J].ComputationalStatistics&DataAnalysis, 2014, 74:157-179.
[19]DOSHIK,ZHONGT,LUZ,etal.BlendingSQLandNewSQLapproaches:Referencearchitecturesforenterprisebigdatachallenges[C]// 2013InternationalConferenceonCyber-EnabledDistributedComputingandKnowledgeDiscovery.Beijing:CyberC, 2013: 163-170.
[20]PADHYEV,TRIPATHIA.ScalabletransactionmanagementwithsnapshotisolationforNoSQLdatastoragesystems[J].IEEETransactionsonServicesComputing, 2015, 8(1): 121-135.
[21]WANGX,JINX,CHENM,etal.Topicminingoverasynchronoustextsequences[J].IEEETransactionsonKnowledgeandDataEngineering, 2012, 24(1): 156-169.
[22]WUX,ZHUX,WUG,etal.Dataminingwithbigdata[J].IEEETransactionsonKnowledgeandDataEngineering, 2014, 26(1): 97-107.
[23]ORDONEZC,CHENZ.HorizontalaggregationsinSQLtopreparedatasetsfordatamininganalysis[J].IEEETransactionsonKnowledgeandDataEngineering, 2012, 24(4): 678-691.
[24]WANGS,CHAOVALITWONGSEW,BABUSKAR.Machinelearningalgorithmsinbipedalrobotcontrol[J].IEEETransactionsonSystems,Man,andCybernetics(PartC):ApplicationsandReviews, 2012, 42(5): 728-743.
[25]LéONB,REDMOND.Frommachinelearningtomachinereasoning[J].MachineLearning, 2014, 94(2): 133-149.
[26]QINS,XUEX.Atwo-layerrecurrentneuralnetworkfornonsmoothconvexoptimizationproblems[J].IEEETransactionsonNeuralNetworksandLearningSystems, 2015, 26(6): 1149-1160.
[27]HUANGS,JIAUM,LINC.Optimizationofthecarpoolserviceproblemviaafuzzy-controlledgeneticalgorithm[J].IEEETransactionsonFuzzySystems, 2015, 23(5): 1698-1712.
[28]DINGZ,LIUJ,SUNY,etal.AtransactionandQoS-awareserviceselectionapproachbasedongeneticalgorithm[J].IEEETransactionsonSystems,Man,andCybernetics:Systems, 2015, 45(7): 1035-1046.
[29]劉濱.分布式數(shù)據(jù)挖掘綜述[J].河北科技大學(xué)學(xué)報(bào),2014,35(1):80-90.
LIUBin.Surveyondistributeddatamining[J].JournalofHebeiUniversityofScienceandTechnology, 2014, 35(1): 80-90.
[30]楊彥波,劉濱,祁明月.信息可視化研究綜述[J]. 河北科技大學(xué)學(xué)報(bào), 2014,35(1): 91-102.
YANGYanbo,LIUBin,QIMingyue.Reviewofinformationvisualization[J].JournalofHebeiUniversityofScienceandTechnology, 2014, 35(1): 91-102.
[31]ETEMADPOURR,MOTTAR,deSOUZAJGP,etal.Perception-basedevaluationofprojectionmethodsformultidimensionaldatavisualization[J].IEEETransactionsonVisualizationandComputerGraphics, 2015, 21(1): 81-94.
[32]JAVIERF,SILVIAT,JOSéA.Areviewofquantitativeempiricalapproachesinhuman-computerinteraction[C]//Interacción’14:ProceedingsoftheXVInternationalConferenceonHumanComputerInteraction, 2014.Tenerife:PuertodelaCruz, 2014:56.
Datadriveninformationsystemforsupervisionofjudicialopen
LIMing1,LIUBin2,3
(1.PoliticalandLegalCommitteeOffice,CPCHebeiProvincialCommittee,Shijiazhuang,Hebei050021,China; 2.SchoolofEconomicsandManagement,HebeiUniversityofScienceandTechnology,Shijiazhuang,Hebei050018,China;3.ResearchCenterofBigDataandSocialComputing,HebeiUniversityofScienceandTechnology,Shijiazhuang,Hebei050018,China)
Aimingatthefouroutstandingproblemsofinformationizedsupervisionforjudicialpublicity,thejudicialpublicdataisclassifiedbasedondatadriventoformthefinallyvaluabledata.Then,thefunctionalstructure,technicalstructureandbusinessstructureofthedataprocessingsystemareputforward,includingdatacollectionmodule,datareductionmodule,dataanalysismodule,dataapplicationmoduleanddatasecuritymodule,etc.Thedevelopmentofthedataprocessingsystembasedonthesestructurescaneffectivelyreduceworkintensityofjudicialopeniformationmanagement,summarizetheworkstate,findtheproblems,andpromotethelevelofjudicialpublicity.
computerinformationmanagementsystem;datadriven;judicialopen;datamining;supervisionsystem
1008-1542(2016)04-0407-09
10.7535/hbkd.2016yx04014
2015-10-26;
2016-04-28;責(zé)任編輯:王海云
國(guó)家自然科學(xué)基金(71271076)
李明(1972—),男,河北樂亭人,碩士,主要從事政法信息化方面的研究。
劉濱教授。E-mail:liubin@hebust.edu.cn
TP391.1
A
李明,劉濱.基于數(shù)據(jù)驅(qū)動(dòng)的司法公開信息化監(jiān)管系統(tǒng)[J].河北科技大學(xué)學(xué)報(bào),2016,37(4):407-415.
LIMing,LIUBin.Datadriveninformationsystemforsupervisionofjudicialopen[J].JournalofHebeiUniversityofScienceandTechnology,2016,37(4):407-415.