謝玲伶
(中共重慶市萬州區(qū)委黨校,重慶 404100)
大數(shù)據(jù)民法體系研究的最新發(fā)展途徑是關(guān)于民法法律實證研究,大數(shù)據(jù)技術(shù)給民法法律研究帶來了非常明顯的變化,在如今的這項大數(shù)據(jù)技術(shù)研究中存在著很多誤區(qū),如果將大量結(jié)構(gòu)化數(shù)據(jù)對同于大數(shù)據(jù)技術(shù);在怎樣運用大數(shù)據(jù)技術(shù)民法體系拓開研究是,也有著科學(xué)性方式的不充足的問題。在以后,在大數(shù)據(jù)技術(shù)民法體系中需要探討的不僅只有需要考慮怎樣能夠更好地得到大數(shù)據(jù)技術(shù),更加需要思考怎樣能夠真實正確的認識和運用大數(shù)據(jù)技術(shù)。本文通過對民法實證的研究,分析大數(shù)據(jù)技術(shù)下的民法體系發(fā)展趨勢。
典型的結(jié)構(gòu)化數(shù)據(jù)主要來自司法報告和民法法律年度統(tǒng)計,這些數(shù)據(jù)都會以技術(shù)系統(tǒng)自動進行處理,并包含對數(shù)據(jù)主題值的偏好。許多數(shù)據(jù)公布,公眾分享的數(shù)據(jù)不令人滿意。刑事案件中律師的辯護水平、民事案件中律師事務(wù)所的水平等數(shù)據(jù)也難以獲得,數(shù)據(jù)的統(tǒng)計口徑往往不一致,甚至同一機構(gòu)的統(tǒng)計口徑也會在不同年份也會發(fā)生變化,數(shù)據(jù)的一致性較差,大量數(shù)據(jù)具有明顯的結(jié)構(gòu)化或部分結(jié)構(gòu)化特征,雖然對司法訴訟具有一定的參考價值和相當(dāng)?shù)难芯績r值,但由于其產(chǎn)生目的的特殊性,并不完整和全面,特別是由于缺乏極限和微觀層面的數(shù)據(jù),導(dǎo)致其在理論上沒有充分的特征。
同時,解決大數(shù)據(jù)民法體系研究數(shù)據(jù)的標(biāo)準(zhǔn)和倫理問題也同樣重要。委員會重大民法法律研究涉及海量數(shù)據(jù)、收集以及分析,對大數(shù)據(jù)采集分析的專業(yè)水平提出了更高甚至更嚴格的要求,特別地研究標(biāo)準(zhǔn)。大型數(shù)據(jù)研究人員的專業(yè)水平有限,對研究標(biāo)準(zhǔn)關(guān)注度不夠,這很可能導(dǎo)致數(shù)據(jù)采集的中斷和分析結(jié)果的不準(zhǔn)確。他們不僅不能客觀量化民法法律現(xiàn)象,甚至可以形成虛假結(jié)論,從而導(dǎo)致千里迢迢誤解。大數(shù)據(jù)技術(shù)本身有限且相對容易使用的條件,其他學(xué)科可以對研究結(jié)論進行重復(fù)或?qū)嵶C驗證。
從研究現(xiàn)狀來看,雖然我國對大數(shù)據(jù)的民法法律研究已經(jīng)開始使用軟件爬蟲來獲取數(shù)據(jù),但內(nèi)容分析仍然主要是基于數(shù)據(jù)的描述性分析很少有研究者能利用統(tǒng)計軟件和統(tǒng)計分析方法對數(shù)據(jù)。在如何組織和分析大數(shù)據(jù)方面,大多數(shù)法學(xué)研究者不能采用統(tǒng)計學(xué)等方法和分析方法。以科學(xué)、熟練的數(shù)學(xué)方法對問題進行定量統(tǒng)計分析,更不用說在研究中建立數(shù)學(xué)模型,從而與統(tǒng)計學(xué)等其他學(xué)科展開對話,社會學(xué)和經(jīng)濟學(xué)中的定量研究方法是否需要一種科學(xué)的方法。
在民法法律中結(jié)合大數(shù)據(jù)技術(shù),可以更好地進行司法實踐和研究新型實證,可能會給民法體系帶來革命性變化,大數(shù)據(jù)技術(shù)可以通過對以往的民法法律案件進行整合,通過數(shù)據(jù)顯示可以減少傳統(tǒng)的民法案件對比所帶來的誤差,相比傳統(tǒng)方式來說,大數(shù)據(jù)技術(shù)的加入加強了對案件主要研究對象的把握。通過大數(shù)據(jù)技術(shù)分析出來的特定數(shù)據(jù),內(nèi)容全面,數(shù)據(jù)產(chǎn)生迅速,收集面積廣,數(shù)據(jù)分析準(zhǔn)確,案例特點突出。
數(shù)據(jù)是對大數(shù)據(jù)民法法律法規(guī)進行重大法律研究的基礎(chǔ)?!爸挥谐渥阕銐虻臄?shù)據(jù)來源,我們才能挖掘出數(shù)據(jù)的價值。”然而,對于大量民法法律數(shù)據(jù)的來源,政府,特別是法院,過分依賴出官方的主動性,內(nèi)容和渠道單一、有限,中國法治和中國司法的整體面貌無法充分展現(xiàn),決策過程中的司法信息無法在法庭文件中充分報道。司法判決向社會公布了決策過程中的關(guān)鍵行為,如對判決內(nèi)部討論的時間、文字和數(shù)據(jù),“一方面,司法記錄不是公開的民法法律證明文件”,尚未完全數(shù)字化;另一方面,大量的程序過程,比如警方的調(diào)查過程、起訴過程,以及審判前后的過程,都沒有公開、正式或非正式的書面記錄,更不用說在此基礎(chǔ)上進行數(shù)字化。
基于現(xiàn)在,要增寬民法法律大數(shù)據(jù)技術(shù)的領(lǐng)域。收集、生成的符合公布條件的數(shù)據(jù)全部納入公布范圍,支持建立平臺互聯(lián)、信息共享、業(yè)務(wù)互聯(lián)的體制機制,實施公安、公共采購、司法行政,提高民法法律大數(shù)據(jù)整合水平,加強相關(guān)數(shù)據(jù)鏈接,分享權(quán)利和分歧聯(lián)通豐富民法法律大數(shù)據(jù)的種類和內(nèi)容。其他類型的司法文書、材料,如筆錄、筆錄、卷宗等,雖然一些司法文書已經(jīng)由公共機關(guān)公布,但也存在著數(shù)量少的問題。
關(guān)注當(dāng)前大量數(shù)據(jù),包括完整樣本的區(qū)域數(shù)據(jù),并加以適當(dāng)利用,在不同客觀條件下,大量數(shù)據(jù)可能是研究者長期面臨的難題,而不是大數(shù)據(jù)。時間到了,但是大量數(shù)據(jù)也是民法法律研究的重要材料,值得重視和充分利用,因此,一方面要避免數(shù)據(jù)失真,特別是系統(tǒng)失真,了解現(xiàn)有數(shù)據(jù)的偏差是正確利用現(xiàn)有數(shù)據(jù)的前提條件,尤其是司法文書網(wǎng)絡(luò)發(fā)布的司法文書,例如,由于案件比例不同,刑事案件分析的錯誤自然比分析民事案件的錯誤要低,一般刑事案件的分析優(yōu)于對腐敗犯罪的分析;而大量離婚糾紛通過調(diào)解解決,調(diào)解文件通常不公布,
首先,探索獲取和分析大型數(shù)據(jù)的新技術(shù)和特殊技術(shù),并在大規(guī)模民法法律研究中充分利用這些技術(shù)從大數(shù)據(jù)技術(shù)中獲得的數(shù)據(jù)不同于社會科學(xué)研究中常用的隨機數(shù)據(jù),有必要對統(tǒng)計結(jié)論進行調(diào)整。目前,在大型數(shù)據(jù)挖掘、整理和分析領(lǐng)域的研究方式越來越多。成人統(tǒng)計方法和數(shù)據(jù)科學(xué)方法,以及統(tǒng)計相關(guān)但完全不同的機器學(xué)習(xí)方法,也應(yīng)用于大型數(shù)據(jù)分析。怎么確定大數(shù)據(jù)的有效性和真實性,以及如何分析和評估數(shù)據(jù)之間的關(guān)系,要提高二者之間的相關(guān)性和因果關(guān)系,需要更多的方法和技術(shù),在當(dāng)前民法法律領(lǐng)域的大數(shù)據(jù)研究中,數(shù)據(jù)提取的關(guān)鍵是,它主要還是過于正則的表達式來實現(xiàn)的,這種方法在處理非常正則的文檔表達式時有很強的準(zhǔn)確性。
充分利用數(shù)據(jù)進行深度分析。對簡單統(tǒng)計分析方法的描述使得在大量數(shù)據(jù)的情況下很難直接應(yīng)用于任何定量分析,是當(dāng)不適用于定量分析時。但是,針對社會科學(xué)中的小數(shù)據(jù),需要引入應(yīng)用廣泛、比較先進的數(shù)據(jù)分析方法,比如列分析、高維數(shù)據(jù)處理、相關(guān)分析、回歸分析等;統(tǒng)計分析等。統(tǒng)計分析軟件的徹底驗證是隱藏在公共領(lǐng)域的財富。只有輸入信息才能添加復(fù)雜的功能.信息可連續(xù)生產(chǎn)、分銷和集成,可用于新產(chǎn)品的生產(chǎn)和使用。信息。因為全面的數(shù)據(jù)分析很重要,所以我們需要思考,如何提高對中短期大數(shù)據(jù)的透徹分析水平。什么時候考慮到民法中大數(shù)據(jù)的數(shù)量和內(nèi)容迅速增加,特別是考慮到大數(shù)據(jù)源數(shù)量多、粒度小、單位分散、結(jié)構(gòu)更加多樣化,克羅姆已經(jīng)開發(fā)了現(xiàn)有的分析工具和方法。統(tǒng)計手段不必滿足處理需要。我們目前需要人工智能。結(jié)合民法中的大數(shù)據(jù),人工智能提供了一種對海量數(shù)據(jù)進行智能篩選和分析的文檔算法,以提高海量數(shù)據(jù)分析的有效性。
隨著信息源的驚人增長,人們對大數(shù)據(jù)的依賴性逐漸增強,區(qū)分大數(shù)據(jù)和相關(guān)技術(shù)也很有必要。一方面,人工智能算法等大數(shù)據(jù)分析方法面臨許多挑戰(zhàn)。一些研究人員甚至認為,黑匣子運行是一個“技術(shù)陷阱”,因此我們不得不擔(dān)心其潛在的風(fēng)險?!俺蔀橐婚T簡單的技術(shù)”。將人文社會科學(xué)的理論性質(zhì)和價值賦予工作者,進而獲得更有價值的優(yōu)秀成果,支持研究團隊和跨學(xué)科的培訓(xùn),申請跨學(xué)科的達思法專門知識。以往對民法的實證研究主要集中在研究者的專業(yè)知識和人格方面,體現(xiàn)在對獨立數(shù)據(jù)的收集和分析上隨著時代的到來,分析的范圍正在擴大,知識的限度也在擴大,加強社會科學(xué)家之間合作的可能性也使這一點成為必要。應(yīng)用研究中,研究人員應(yīng)該能夠理解它是數(shù)據(jù)的收集和組織,還是數(shù)據(jù)的分析和應(yīng)用。多學(xué)科知識和經(jīng)驗,比如,數(shù)據(jù)挖掘,包括數(shù)據(jù)信息庫技術(shù)、工程、基礎(chǔ)知識工程在神經(jīng)網(wǎng)絡(luò)、數(shù)理統(tǒng)計、信息可視化等領(lǐng)域都有廣泛的應(yīng)用。加強大數(shù)據(jù)民法法律研究人員隊伍建設(shè),更好地開展大規(guī)模民法法律研究,特別是,我們需要加強信息技術(shù)、軟件科學(xué)、統(tǒng)計等相關(guān)領(lǐng)域以及大數(shù)據(jù)和人工智能領(lǐng)域的專家。它可以促進技術(shù)公司之間的合作,更好地解決數(shù)據(jù)領(lǐng)域大規(guī)模民法法律研究所帶來的機遇和挑戰(zhàn)。同時,應(yīng)對數(shù)據(jù)的大型研究者必須克服知識積累本身、學(xué)術(shù)觀念和價值觀以及學(xué)習(xí)、學(xué)習(xí)和應(yīng)用等障礙。
在這種情況下,應(yīng)該培養(yǎng)具有跨學(xué)科可能性的民法法律數(shù)據(jù)研究領(lǐng)域的大型人才。目前,我國部分高校已推出大型數(shù)據(jù)課程,將為今后提供資金和技術(shù)效益。具備技術(shù)條件的高??芍贫ā叭瞬排囵B(yǎng)計劃”,系統(tǒng)培養(yǎng)既懂技術(shù)又懂民法法律的學(xué)生,大數(shù)據(jù)法的跨學(xué)科人才在大規(guī)模民法法律研究和數(shù)據(jù)實踐中仍具有額外的能力。長時間以來,對于小數(shù)據(jù)的民法法律實證研究一直是研究具有重大學(xué)術(shù)價值的主要方式。如何確保數(shù)據(jù)和方法不足的大規(guī)模數(shù)據(jù)和方法研究的科學(xué)能力;小數(shù)據(jù)研究與大數(shù)據(jù)研究相結(jié)合應(yīng)是一個重要的學(xué)習(xí)方式。長時間以來,基于小數(shù)據(jù)的法律實證研究一直是一種普遍的研究方法,具有很高的學(xué)術(shù)價值。如何在數(shù)據(jù)不足、方法缺乏理解的情況下,確保大規(guī)模數(shù)據(jù)研究的科學(xué)能力?應(yīng)該將小數(shù)據(jù)研究與大數(shù)據(jù)研究結(jié)合起來應(yīng)該很重要。在倫理學(xué)上,同一研究對象的大尺度和小尺度數(shù)據(jù)研究應(yīng)同時應(yīng)用于同一研究,以共同驗證研究結(jié)果。在大數(shù)據(jù)研究中,宜采用詳實的小數(shù)據(jù)研究思路和方法,完善大數(shù)據(jù)研究,以提高大數(shù)據(jù)法學(xué)研究的科學(xué)能力。
總而言之,在如今的大數(shù)據(jù)時代,我們時時刻刻受到大數(shù)據(jù)的影響,這樣的影響是廣泛及深刻的。這不只為大數(shù)據(jù)技術(shù)民法體系的發(fā)展提供了機遇,也同樣是民法法律實證研究的一個重要機遇。