• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向中文法律裁判文書的抽取式摘要算法

    2024-01-26 07:47:28溫嘉寶
    集成技術 2024年1期
    關鍵詞:編碼器文書裁判

    溫嘉寶 楊 敏

    1(中國科學院深圳先進技術研究院 深圳 518055)2(中國科學院大學 北京 100049)

    1 引 言

    隨著人民群眾法律意識的提高和案件數(shù)量增長速度的加快,截至 2023 年 1 月,中國裁判文書網已公布超過 1.3 億份的裁判文書,并以每日數(shù)千份的速度繼續(xù)增加。這些文書包括民事、刑事、行政、賠償、執(zhí)行等多種類型,經過篩選和專業(yè)處理后被公布,形成了法律領域中數(shù)據量最大的數(shù)據庫,為司法智能化、信息化提供了強有力的數(shù)據基礎。優(yōu)質裁判文書的不斷增加對司法領域的發(fā)展具有重要意義,如可以為法律從業(yè)者提供更多的案例參考,緩解“同案不同判”的困境。然而,這也帶來了一些新的問題。

    裁判文書是法律從業(yè)者日常工作中接觸的重要資料之一,包括進行類案檢索和撰寫類案檢索報告。隨著裁判文書數(shù)據量的增加,法律從業(yè)者需要從檢索出的大量裁判文書中挑選出最合適的裁判文書。然而,裁判文書通常較長,平均長度可達數(shù)千字,甚至有少數(shù)文件長達上萬字,從中查找出關鍵信息并進行分析無疑變得越來越困難。因此,對裁判文書進行自動摘要,以去除冗余信息、精簡文本內容,能極大程度地減少法律從業(yè)者的工作量,使得他們有更多的精力從事更有價值的工作,從而提升司法行業(yè)的效率。由此可見,裁判文書自動摘要對司法領域有著重要研究價值和現(xiàn)實意義。

    根據摘要方式,自動摘要模型可分為抽取式模型和生成式模型,本文提出的方法屬于抽取式模型。抽取式模型通過從原文中直接選擇若干個重要句子進行排列重組,以形成摘要。根據學習方式的不同,抽取式摘要算法可進一步劃分為無監(jiān)督式抽取和有監(jiān)督式抽取。無監(jiān)督抽取式文本摘要方法因運行速度快,且無須人工標注訓練數(shù)據而廣受應用。相比之下,有監(jiān)督抽取式文本摘要方法的優(yōu)勢在于其具有更高的準確性。

    2 抽取式摘要研究現(xiàn)狀

    抽取式摘要是一種直接從原文中抽取關鍵句的方式,這種方式在句法上錯誤率低。從學習方式上,抽取式摘要算法可以分為無監(jiān)督和有監(jiān)督兩大類。無監(jiān)督抽取式摘要通常采用圖、聚類等方式。而有監(jiān)督抽取式摘要多采用基于神經網絡的方法。

    2.1 無監(jiān)督抽取式摘要算法

    無監(jiān)督抽取式摘要最簡單的實現(xiàn)方式是“Lead-3”法,即從文本前 3 個句子中提取信息,并作為摘要。由于作者通常在文章的標題和開頭部分闡述文章的主題(如新聞報道),因此,這種方式在該類文本中較為有效。然而,法律裁判文書的關鍵信息分布較為均勻,因此,采用 Lead-3法進行法律裁判文書的摘要不能達到理想效果。

    2004 年,Erkan 等[1]提出的 LexRank 是一種基于圖排序的抽取式摘要算法,其以句子為節(jié)點,以句子間相似度為邊的權值,構建無向有權圖。該算法采用詞袋模型表示句子向量,維度是目標語言中單詞的數(shù)量。對于出現(xiàn)在句子中的每個單詞來說,句子向量中相應維數(shù)的值是該單詞的 TF-IDF[2]值。通過計算句子向量與圖中質心之間的相似度,判斷句子是否為重要句子。其中,兩個句子之間的相似性由向量間的余弦相似度定義,而質心是由文檔中 TF-IDF 值超過某一閾值的詞構成的向量。該算法具有簡單和易于實現(xiàn)的優(yōu)點。然而,它在表示句子向量的方式上存在一定的缺陷。其一,維度較大,導致生成的句子向量非常稀疏。其二,句子向量中相應維數(shù)的值是該單詞的 TF-IDF 值。由于 TF-IDF 基于詞頻統(tǒng)計,無法考慮語義信息,因此,LexRank 在判斷句子相似性時無法充分考慮語義層面的相似度。

    2004 年,Mihalcea 等[3]提出的 TextRank 算法是一種基于圖的排序算法,其設計靈感源自于 PageRank[4]網絡排序算法。該算法將文檔表示為圖模型,將文檔中的每個句子作為圖中的一個節(jié)點,節(jié)點之間的連邊表示句子之間的相關性。然后,通過 PageRank 算法計算每個節(jié)點的TextRank 值,以確定文檔中最重要的句子,并選擇其中得分最高的幾個句子作為摘要。然而,TextRank 的句子相似度衡量方式采用了兩個句子之間的共現(xiàn)詞數(shù)量,即采用了詞袋模型,無法考慮同義詞、詞序等其他信息。這使得 TextRank算法的表現(xiàn)會受到一定的限制。

    2016 年,Padmakumar 等[5]提出了一種基于聚類的抽取算法。首先,利用 Skip Thought Vectors 進行無監(jiān)督學習,得到句子的嵌入向量。然后,通過聚類算法對生成的句子嵌入向量進行聚類。最后,將距離簇質心最近的向量所對應的句子作為文本摘要。Skip Thought Vectors 的思想是通過一個句子預測它上下文的句子,具體做法是通過 LSTM[6]編碼器將中間句子編碼為向量,再用兩個獨立的 LSTM 解碼器將句子向量解碼出前后句子。這種方式與 2013 年 Mikolov 等[7]提出的 Word2Vec 中的 Skip-gram 訓練策略相似,依據的原則是一個句子與其前后相鄰句子之間存在語義聯(lián)系。在該論文中,Padmakumar 等[5]嘗試了 K-means 和 Mean-shift 兩種聚類方法。然而,該算法的不足之處在于 LSTM 無法實現(xiàn)并行訓練,以及在處理長序列時可能面臨梯度消失和梯度爆炸的風險。

    2021 年,Padmakumar 等[8]提出了一種基于點互信息的摘要算法。該算法利用 GPT-2[9]計算給定兩個句子之間的點互信息,而點互信息定義為在給定前句的情況下,得到后句的概率。通過對摘要與原文檔中所有句子對的點互信息進行求和,可以得到摘要與原文檔的相關性。同時,通過對摘要內部所有句子對的點互信息進行求和,可以確定摘要的冗余性。最終,摘要由一個句子集合組成,該集合能最大化相關性減去冗余性的值。該算法的優(yōu)點在于利用預訓練語言模型計算句子間的點互信息,從而實現(xiàn)無監(jiān)督抽取式摘要。然而,缺點在于其時間復雜度較高,需要計算所有句子之間的點互信息。當文檔句子數(shù)量較大時,推理時間將會較長。

    2.2 有監(jiān)督抽取式摘要算法

    2017 年,Nallapati 等[10]提出了一種名為SummaRuNNer 的方法,將文本摘要任務轉化為序列標注問題。對文本中的每個句子都進行二分類(0 或 1):0 表示不納入摘要,1 表示納入摘要。最終的文本摘要由標記為 1 的句子組成。該模型包含兩個雙向門控循環(huán)單元[11]:第一個雙向門控循環(huán)單元對句子進行詞級建模,以獲得詞級表示,接著,對句子中各詞的詞級表示求平均,得到句子嵌入;第二個雙向門控循環(huán)單元則對句子嵌入進行句級建模,以獲取句級表示。最后,通過一個分類器對句級表示進行二分類,得到最終的摘要結果。該模型的優(yōu)點在于,它不僅雙向考慮了句子的局部和全局信息,還充分考慮了句子與文檔的關系、句子與前后句子的關系、絕對位置和相對位置等因素。然而,該模型的缺陷在于采用循環(huán)神經網絡(recurrent neural network,RNN)進行特征提取,導致無法進行并行訓練。此外,在處理長序列時,模型可能會面臨梯度消失和梯度爆炸的風險。

    2017 年,Isonuma 等[12]將文本分類任務與摘要任務相結合,以提升摘要效果。該方法首先采用卷積神經網絡對句子進行編碼,獲取句子向量;然后使用基于 RNN 的編碼器-解碼器框架為每個句子生成摘要概率。具體而言,在編碼器中,為每個句子生成隱藏狀態(tài);在解碼器中,利用前一個句子的摘要概率、句子向量和隱藏狀態(tài)生成當前句子的隱藏狀態(tài),并根據該隱藏狀態(tài)計算當前句子的摘要概率。接著,以摘要概率為權重,對句子向量進行加權平均,得到文本向量。最后,利用文本向量預測文本的類別。Isonuma等[12]認為,文本的類別可以被視為文本的粗糙摘要。若模型能根據文本向量準確預測文本類別,則說明模型具有抽取關鍵信息的能力。因此,可以將摘要概率較高的句子作為文本的摘要。該方法的優(yōu)點在于利用文本分類任務增強模型的摘要能力。然而,該方法也存在一些缺點:(1)卷積神經網絡主要通過局部卷積操作捕捉文本中的局部特征,對長距離依賴關系的捕捉能力較弱;(2)卷積神經網絡的卷積操作對輸入的順序不敏感,在捕捉文本中的詞序信息方面存在局限;(3)基于 RNN 的編碼器-解碼器架構無法并行計算,且存在梯度消失和梯度爆炸的風險;(4)計算過程為單向操作,在計算當前句子摘要概率時,無法考慮后續(xù)句子的信息。

    2019 年,Liu[13]首次將 BERT[14]應用于抽取式摘要任務,提出了名為 BERTSUM 的方法。即在每個句子前插入[CLS]詞元,句子后添加[SEP]詞元,最終將每個[CLS]對應的輸出視為每個句子的句子向量。Liu[13]采用了 3 種方式對句子進行分類:(1)連接線性層和 Sigmoid 函數(shù),計算句子的重要性得分;(2)句子向量表示單獨接入 Transformer[15]進行分類;(3)將句子向量表示單獨接入 LSTM 進行分類。BERTSUM 的優(yōu)勢在于充分利用了預訓練語言模型的強大特征提取能力。通過對輸入數(shù)據進行簡單的預處理和微調預訓練語言模型,便可完成抽取式摘要任務。此方法具有實現(xiàn)相對簡單、訓練代價較低等優(yōu)點。然而,BERTSUM 也存在一定的缺陷,即需要將整篇文本一次性輸入到 BERT 中,當文本長度超出模型輸入限制時,則難以完成摘要任務。

    2020 年,Zhong 等[16]提出了 MatchSum 模型,將摘要任務轉化為文本匹配任務。該模型利用預訓練語言模型對文本進行編碼,通過比較文檔上下文表示與真實摘要及候選摘要的上下文表示,計算相似度并更新參數(shù)。模型認為目標摘要與原文檔之間的相似度應最為接近,因此,當存在比目標摘要更接近原文檔的摘要時,計算損失并更新參數(shù)。文檔的候選集由多個句子的所有組合構成。為防止文檔句子過多導致組合爆炸,Zhong 等[16]采用 BERTSUM 進行粗略摘要,將部分不重要的句子剔除。在推理階段,選擇與原文檔語義相似度最高的候選摘要作為摘要結果。該算法的優(yōu)點在于將摘要任務轉換為文本匹配任務,僅需將匹配得分最高的候選結果作為摘要答案。然而,該算法也存在一些缺點:(1)使用BERTSUM 進行粗略摘要,在處理長文本時,可能會截斷文本,導致信息丟失;(2)不適用于處理句子較多的文本,當文本句子數(shù)量較大時,候選摘要集規(guī)模也會很大,將增加計算成本。

    2022 年,Shi 等[17]提出了一個基于星形架構的抽取式摘要模型 StarSum:首先,通過BERTSUM 生成每個句子的句子表示;其次,將句子表示與位置嵌入相加;再次,輸入星形 Transformer 進行文檔級編碼;最后,利用Sigmoid 函數(shù)對最后一層每個句子的輸出進行分類,從而得到文本摘要。星形 Transformer 由多個衛(wèi)星節(jié)點和一個星節(jié)點組成,構成一個全連接的星形結構。在此結構中,文本序列中第i個句子的特征由第i個衛(wèi)星節(jié)點的狀態(tài)表示。星形Transformer 包括環(huán)連接和基本連接兩種連接方式。衛(wèi)星節(jié)點通過類似雙向 RNN 的環(huán)狀連接從其鄰居節(jié)點收集信息(其中,第一個和最后一個衛(wèi)星節(jié)點相互連接),而星節(jié)點則通過基本連接從所有衛(wèi)星節(jié)點獲取信息。衛(wèi)星節(jié)點可以通過星節(jié)點以兩跳的方式實現(xiàn)信息的相互傳播。這種架構的優(yōu)點在于提高了計算效率和處理長期依賴關系的能力。然而,其缺點在于利用 BERTSUM生成句子向量表示,在處理長文本摘要時,BERTSUM 可能會截斷文本,從而導致信息丟失。

    3 基于 Transformer 編碼器的抽取式摘要算法

    本文所提抽取式摘要模型由一個基于RoBERTa-Large[18]的句子向量生成模型和一個基于 Transformer 編碼器的句分類模型組成,最后接入全連接層進行二分類,得到句子重要性,文本摘要則由重要句子組成,如圖1~2 所示。

    圖1 句向量生成模型Fig.1 Sentence vector generative model

    圖2 抽取式摘要模型結構Fig.2 Extractive summarization model

    3.1 基于預訓練語言模型的句子向量生成模型

    抽取式摘要實際上可以建模為序列標注任務,核心思想是對文本中每個句子進行二分類,0 表示不重要,1 表示重要,所有標簽為 1 的句子組成文本摘要。使用預訓練語言模型處理文本分類問題常見的方式是在文本前插入[CLS]詞元,并使用該詞元所對應的輸出進行全連接分類。但裁判文書屬于長文本,其長度普遍超過常見預訓練語言模型的單次輸入長度,如BERT(512 個 token),甚至會超過一些可以處理長文本的預訓練語言模型的單次輸入最大長度,如 Longformer[19](4 096 個 token),因此無法使用在每個句子前插入[CLS]詞元,并以[CLS]詞元作為句子分類特征的方式。本文所用方法將抽取式摘要分解為句向量生成模型和句分類模型。

    基于預訓練語言模型的句向量生成模型單次處理一個句子,將預訓練語言模型最后一層的輸出進行平均池化,得到句向量,最終裁判文書的表示為 。這種方式可以有效增加模型可處理文本長度,并減少內存需要,但無法對句向量生成模型進行微調。

    3.2 基于 Transformer 編碼器的句分類模型

    第 3.1 小節(jié)中用句子向量生成模型對每個句子單獨編碼,并不包含句子的上下文信息,而抽取式摘要需要考慮到上下文,因此不能直接對所生成的句向量進行分類。

    對于一個給定的句子來說,它的輸入表示由句子向量、位置嵌入及長度嵌入求和得到。句子向量代表句子所包含的基本語義信息。位置嵌入代表句子在裁判文書中的位置,其中,每個位置對應一個可訓練向量。長度嵌入表示當前句子所包含的長度信息,將句子長度按區(qū)間劃分,每一個長度區(qū)間對應同一個可訓練向量,計算方式如公式(1)所示。其中, 為句子長度;interval為區(qū)間間隔,一般取 5 或 10;idx為區(qū)間下標,對應長度嵌入中具體的一個可訓練向量。

    模型訓練過程分為 5 步:(1)將一個裁判文書中每個句子的句子向量、位置嵌入及長度嵌入求和,得到每個句子的輸入特征;(2)將裁判文書中所有句子輸入特征按順序拼接輸入由 Transformer 編碼器組成的文本級編碼器中;(3)通過多頭自注意力機制,從多維度融合句子上下文信息,生成句子的文本級表示;(4)通過全連接層對句子文本級表示進行二分類,得到句子重要性,0 表示不重要,1 表示重要;(5)計算損失,更新模型。句子輸入特征計算過程如公式(2)所示。

    4 實驗分析與評估

    4.1 數(shù)據集與評價指標

    本文使用 CAIL2020 摘要數(shù)據集作為實驗數(shù)據,該數(shù)據集共收錄 13 531 份一審民事判決書,涵蓋了侵權責任、借款合同、繼承合同、勞動合同、租賃合同等多種民事糾紛類別。樣本中的裁判文書預先以多個句子劃分,每個句子均有是否重要的標簽,同時提供與之對應的全文參考摘要。文書字數(shù)平均為 2 586 個,其中,最長的一篇達 14 413 個字,所有文本長度超過 512 個字,99.7% 的文書長度超過 1 024 個字,63.4% 的文書長度超過 2 048 個字。平均每個文書包含 57 個句子,最多的一份達 496 個句子。每篇文書平均抽取 12 個句子作為摘要,最多抽取 69 個句子。每個句子平均包含 44 個字,最長的一個句子長達 640 個字。文書摘要字數(shù)平均為 791 個字,最長的一個摘要長達 3 790 個字。數(shù)據集中共包含782 879 個句子,其中,171 745 個句子為重要句子,611 134 個句子為非重要句子,即正負樣本的比例為 1∶3.55。該數(shù)據集屬于長文本摘要數(shù)據集。

    數(shù)據集格式如表1 所示。其中,id 表示案例唯一標識;summary 字段表示人工總結的與文檔對應的全文參考摘要;text 字段是一個列表,按順序包含案例中每個句子,text 中的一個元素表示文本的一個帶標簽的句子,帶標簽的句子中包含 sentence 和 label;sentence 表示句子具體內容;label 表示這個句子是否重要,0 表示不重要,1 表示重要。本文所研究的方法為抽取式摘要算法,只用到 text 字段,summary 字段屬于生成式摘要所需標注的數(shù)據,對本文所研究方法作用不大,因此舍棄。

    表1 司法摘要數(shù)據集格式Table 1 Legal summarization dataset format

    鑒于將抽取任務轉化為對句子的分類任務,將F1作為評估指標,比精確率(Precision)和召回率(Recall)更能準確評價一個模型的好壞。F1指標如公式(10)所示。為了更好地與基線模型對比,本實驗還使用 ROUGE[20]指標,該指標包含多種度量摘要之間相似性的自動評估方法,是一種常用的文本摘要評價指標。ROUGE-N的召回率如公式(6)所示。

    其中,PredSums 為預測摘要。ROUGE-L 的計算公式如公式(8)和公式(9)所示。

    其中,LCS用于計算兩個字符串最長公共子串的長度;m為目標摘要長度;n為預測摘要長度。

    本實驗的實驗超參數(shù)說明如表2 所示。Max_sent_len 表示句子向量生成模型所能處理的最大句子長度。Seq_len 表示句子分類模型能處理的最大句子數(shù)量。Pos_weight 和 Neg_weight表示正例和負例的權重,由于數(shù)據集中摘要句子的正負例失衡,負例數(shù)量是正例的 3.55 倍,因此,設置正負例權重糾正偏差。Interval 表示長度間隔,模型通過長度間隔引入句子的長度信息,具體做法是將處于相同長度區(qū)間內的句子映射到同一個可訓練的長度嵌入,具體如公式(1)所示。Layer 表示句子分類模型中 Transformer 編碼器的層數(shù)。

    表2 實驗超參數(shù)Table 2 Hyperparameters in experiment

    4.2 實驗結果

    本文提出的模型將 RoBERTa-Large 作為句子編碼器,將多層 Transformer 編碼器結構作為句子分類模型,將抽取任務轉化為句子的分類任務,并且與無監(jiān)督 TextRank 基線模型進行了對比,證明了該模型的有效性。此外,本文在抽取式摘要模型中引入了與長度相關的特征,進一步提升了模型效果。實驗結果如表3~5 所示,與基線模型相比,本文提出的抽取式摘要模型在ROUGE-1、ROUGE-2 和 ROUGE-L 指標上均有明顯提升。

    表3 模型在不同長度間隔上實驗的結果Table 3 Experimental results of the model on differentlength intervals

    4.3 討論與分析

    經過數(shù)據分析發(fā)現(xiàn),句子長度信息對句子重要程度有一定影響,因此,本實驗引入了句子長度信息。具體方式是將文本長度位于相同區(qū)間的文本共享同一個可訓練向量,并在文本輸入階段與句子嵌入、句子位置融合,得到句子向量。實驗結果如表3 所示,表中結果為 Transformer 編碼器為 4 層的實驗結果。由表3 可知,加入長度信息后,F(xiàn)1指標有一定提升。長度間隔為 5時,F(xiàn)1提升 2.586%;長度間隔為 10 時,F(xiàn)1提升2.706%??梢钥闯?,句子長度信息是抽取句子所需的重要信息之一。

    為了選擇最優(yōu)的 Transformer 編碼器層數(shù),本研究進行了一系列實驗,針對 1~6 層分別計算了 Recall、Precision 和F1指標,結果如表4 所示。從表4 可以看出,隨著編碼器層數(shù)的增加,Precision 指標逐漸提高,而 Recall 指標則呈逐漸下降的趨勢。然而,F(xiàn)1指標與層數(shù)之間并沒有太大的相關性,這表明層數(shù)對模型的整體性能影響有限。在本實驗中,當編碼器層數(shù)為 4 時,模型在F1指標上取得了最佳效果。

    表4 模型在不同 Transformer 編碼器層數(shù)上實驗的結果Table 4 Experimental results of the model on differentTransformer encoder layers

    在與基線模型進行對比的實驗中,采用了ROUGE-1、ROUGE-2、ROUGE-L 指標,實驗結果詳見表5。其中,RoBERTa-Large-Transformer編碼器的 Transformer 層數(shù)為 4。

    表5 模型與基準模型的指標對比Table 5 Comparison of metrics between the model and the baseline model

    Lead-3 模型直接將文檔前 3 句話作為摘要,這種方式并不適用于重要信息比較均勻的法律文本,因此其指標并不高。

    TextRank 在選擇召回分數(shù)最高的 15 個句子時表現(xiàn)最佳。由表5 可知,與無監(jiān)督的 TextRank模型相比,RoBERTa-Large-Transformer 編碼器在3 個指標上均有較大提升。其中,ROUGE-1 的F1指標提升 16.44%;ROUGE-2 的F1指標提升21.87%;ROUGE-L 的F1指標提升 18.05%,3 個指標平均提升 18.79%。

    BERTSUM 模型是 BERT 在抽取式摘要中的首次應用。其具體做法是在句子之前插入[CLS]詞元,在句子之后插入[SEP]詞元,通過預訓練語言模型提取特征,根據[CLS]詞元對應的輸出預測句子的重要性。然而,這種方法的缺點是輸入長度受到預訓練語言模型的限制。例如,BERT 僅能輸入 512 個詞元,而即使 Longformer和 Lawformer 極大程度地增加了模型的可輸入長度,數(shù)據集中依舊有超過一半的數(shù)據超出其長度限制。本實驗采用了截斷的方式來處理超出長度限制的部分。

    基于 BERT 的 BERTSUM 模型在精確率方面具有較高的表現(xiàn),但由于信息截斷的影響,其召回率較低,因此,F(xiàn)1值相對較低。相反,基于 Longformer 的 BERTSUM 模型具有較高的召回率,但精確率偏低,同樣導致F1值較低。與基于 Longformer 的 BERTSUM 模型相比,RoBERTa-Large-Transformer 編碼器在 ROUGE-1的F1指標上提升了 22.58%;在 ROUGE-2 的F1指標上提升了 26.42%;在 ROUGE-L 的F1指標上提升了 23.08%,3 個指標的平均提升為24.03%。

    5 結 論

    本文針對中文裁判文書摘要任務提出一種基于 Transformer 編碼器的抽取式摘要模型。該模型首先通過預訓練語言模型采用平均池化的方式為每個句子生成句嵌入;然后通過 Transformer編碼器將句子嵌入、句子位置嵌入及句子長度嵌入融合;最后通過全連接網絡對句子表示進行分類,從而完成抽取式摘要任務。本文所提出模型避免了直接將長文本輸入模型導致超出預訓練語言模型的最大輸入長度的問題,從而極大程度地擴大了摘要模型可處理的文本長度。此外,抽取式摘要算法將句子長度以區(qū)間劃分,并進行映射,從而使模型可以考慮句子的長度信息,提升模型效果。本文所提出的抽取式摘要算法在ROUGE-1、ROUGE-2、ROUGE-L 指標上均遠超過基線模型。

    中文法律裁判文書的抽取式摘要任務仍處于早期探索階段,由于缺乏公開數(shù)據集,或是數(shù)據集中裁判文書種類不全,裁判文書屬于長文本,而常見的預訓練語言模型并不支持長文本等原因,該任務依然面臨著巨大挑戰(zhàn)。而從模型層面,長文本抽取式摘要仍有許多待解決的問題,例如:根據現(xiàn)在的分句標準,句子長度極其不均衡,一些句子長度過長,進行句子嵌入生成時,信息可能會被過度壓縮,導致語義信息丟失。而如果對句子進行更細致的分割,則又可能導致少部分文本句子數(shù)量過多,從而使得處于末尾部分的位置嵌入無法得到充分訓練,并會出現(xiàn)模型抽取少句子的文本效果好,而抽取多句子的文本效果差的情況。這些問題亟待進一步研究解決。

    猜你喜歡
    編碼器文書裁判
    太行山文書精品選(17)
    法官如此裁判
    法官如此裁判
    監(jiān)獄執(zhí)法文書規(guī)范探討
    法律裁判中的比較推理
    法律方法(2019年4期)2019-11-16 01:07:10
    黑水城出土《宋西北邊境軍政文書》中“砲”類文書再討論
    西夏學(2019年1期)2019-02-10 06:22:40
    清代刑事裁判中的“從重”
    法律史評論(2018年0期)2018-12-06 09:22:28
    基于FPGA的同步機軸角編碼器
    基于PRBS檢測的8B/IOB編碼器設計
    JESD204B接口協(xié)議中的8B10B編碼器設計
    電子器件(2015年5期)2015-12-29 08:42:24
    亚洲成人免费电影在线观看| 国产免费福利视频在线观看| 免费少妇av软件| 欧美精品啪啪一区二区三区| 亚洲色图综合在线观看| 精品国产乱子伦一区二区三区| 午夜成年电影在线免费观看| 日本wwww免费看| av网站免费在线观看视频| 国产精品.久久久| 十八禁高潮呻吟视频| 侵犯人妻中文字幕一二三四区| 精品卡一卡二卡四卡免费| 亚洲avbb在线观看| 亚洲第一欧美日韩一区二区三区 | 狂野欧美激情性xxxx| 制服诱惑二区| 肉色欧美久久久久久久蜜桃| 亚洲熟妇熟女久久| 亚洲男人天堂网一区| 国产主播在线观看一区二区| 亚洲专区中文字幕在线| 亚洲欧美激情在线| 一边摸一边抽搐一进一出视频| 超碰成人久久| 免费一级毛片在线播放高清视频 | 啦啦啦中文免费视频观看日本| 亚洲精品国产精品久久久不卡| 亚洲国产看品久久| 国产一区二区三区在线臀色熟女 | 欧美日韩av久久| 亚洲国产成人一精品久久久| 日韩一区二区三区影片| 一区二区三区激情视频| 国产极品粉嫩免费观看在线| 男女免费视频国产| 黄频高清免费视频| 亚洲中文av在线| 男女免费视频国产| 日韩欧美免费精品| 大香蕉久久网| 国产精品久久久久久人妻精品电影 | 一个人免费在线观看的高清视频| 久久免费观看电影| 成人国产av品久久久| 中文亚洲av片在线观看爽 | 黄片播放在线免费| 无遮挡黄片免费观看| 亚洲欧美激情在线| 亚洲中文字幕日韩| 在线永久观看黄色视频| 午夜福利影视在线免费观看| 亚洲精品av麻豆狂野| 国精品久久久久久国模美| 精品国产乱子伦一区二区三区| 中文字幕av电影在线播放| 99精品在免费线老司机午夜| 正在播放国产对白刺激| 亚洲国产中文字幕在线视频| 精品久久蜜臀av无| 大码成人一级视频| 777米奇影视久久| 夜夜夜夜夜久久久久| 可以免费在线观看a视频的电影网站| 国产精品亚洲av一区麻豆| 国产97色在线日韩免费| 久久久久久亚洲精品国产蜜桃av| 少妇的丰满在线观看| 欧美成人免费av一区二区三区 | 精品亚洲乱码少妇综合久久| 国产欧美日韩一区二区三区在线| 精品一区二区三区视频在线观看免费 | 一区二区三区乱码不卡18| 人人澡人人妻人| 亚洲 欧美一区二区三区| 亚洲精品久久午夜乱码| 99国产精品99久久久久| 亚洲情色 制服丝袜| 成人18禁高潮啪啪吃奶动态图| 亚洲精品国产色婷婷电影| 在线播放国产精品三级| 免费av中文字幕在线| 免费av中文字幕在线| av天堂久久9| 国产人伦9x9x在线观看| 男女高潮啪啪啪动态图| 色视频在线一区二区三区| 久久人人爽av亚洲精品天堂| 淫妇啪啪啪对白视频| 50天的宝宝边吃奶边哭怎么回事| 久久热在线av| 精品少妇久久久久久888优播| 日日摸夜夜添夜夜添小说| 色播在线永久视频| 亚洲午夜理论影院| 老熟妇乱子伦视频在线观看| 国产精品1区2区在线观看. | 老司机午夜福利在线观看视频 | 香蕉久久夜色| 欧美日韩国产mv在线观看视频| 中文字幕精品免费在线观看视频| 国产亚洲精品一区二区www | 王馨瑶露胸无遮挡在线观看| 免费在线观看视频国产中文字幕亚洲| 国产成+人综合+亚洲专区| 两性午夜刺激爽爽歪歪视频在线观看 | 黄色怎么调成土黄色| 国产成人精品久久二区二区免费| 91九色精品人成在线观看| 女人爽到高潮嗷嗷叫在线视频| 亚洲一区二区三区欧美精品| 久久精品亚洲av国产电影网| 大型av网站在线播放| 99国产精品一区二区蜜桃av | a级毛片在线看网站| 成年人黄色毛片网站| 性少妇av在线| 久久久久久久久免费视频了| 丝袜美足系列| 一边摸一边抽搐一进一出视频| 亚洲欧美日韩另类电影网站| 一边摸一边做爽爽视频免费| 超碰成人久久| 国产亚洲av高清不卡| 在线亚洲精品国产二区图片欧美| 无遮挡黄片免费观看| 国产精品免费一区二区三区在线 | 亚洲精品中文字幕在线视频| 午夜视频精品福利| 国产又色又爽无遮挡免费看| 亚洲精品一二三| 在线天堂中文资源库| 天天添夜夜摸| 欧美日韩亚洲综合一区二区三区_| 色精品久久人妻99蜜桃| 亚洲五月婷婷丁香| 国产国语露脸激情在线看| 中国美女看黄片| 亚洲五月婷婷丁香| 国产精品二区激情视频| 黄片小视频在线播放| 久久久水蜜桃国产精品网| 日韩视频一区二区在线观看| 精品国产一区二区三区久久久樱花| 99re6热这里在线精品视频| 国产男女超爽视频在线观看| 欧美在线一区亚洲| 国产色视频综合| 国产精品美女特级片免费视频播放器 | 黄色a级毛片大全视频| av国产精品久久久久影院| 午夜91福利影院| 黑人巨大精品欧美一区二区mp4| 欧美 日韩 精品 国产| 日韩制服丝袜自拍偷拍| 少妇精品久久久久久久| 精品一区二区三卡| 91麻豆精品激情在线观看国产 | 咕卡用的链子| 变态另类成人亚洲欧美熟女 | 大型黄色视频在线免费观看| 精品亚洲成a人片在线观看| 久久毛片免费看一区二区三区| 国产男女超爽视频在线观看| 久久精品91无色码中文字幕| 国产精品偷伦视频观看了| 久久午夜亚洲精品久久| 91麻豆av在线| 亚洲欧美日韩高清在线视频 | 日韩熟女老妇一区二区性免费视频| 久久人妻福利社区极品人妻图片| 十八禁人妻一区二区| 一级片'在线观看视频| 麻豆乱淫一区二区| 国产区一区二久久| 欧美日韩福利视频一区二区| 欧美乱码精品一区二区三区| 极品人妻少妇av视频| 欧美激情极品国产一区二区三区| 女人爽到高潮嗷嗷叫在线视频| 亚洲免费av在线视频| 欧美精品人与动牲交sv欧美| 欧美老熟妇乱子伦牲交| 考比视频在线观看| videos熟女内射| 999精品在线视频| 欧美精品亚洲一区二区| 欧美激情久久久久久爽电影 | 欧美黄色片欧美黄色片| 搡老岳熟女国产| 在线观看人妻少妇| 一边摸一边做爽爽视频免费| 免费看a级黄色片| 国产成+人综合+亚洲专区| 美女扒开内裤让男人捅视频| 国产黄频视频在线观看| 纵有疾风起免费观看全集完整版| 俄罗斯特黄特色一大片| 亚洲成av片中文字幕在线观看| 国产真人三级小视频在线观看| 自线自在国产av| 亚洲色图av天堂| 精品国产国语对白av| 高潮久久久久久久久久久不卡| 丰满人妻熟妇乱又伦精品不卡| 久久久国产一区二区| 国产成人啪精品午夜网站| av片东京热男人的天堂| av福利片在线| 一区在线观看完整版| 久久久久久久精品吃奶| 俄罗斯特黄特色一大片| 天天操日日干夜夜撸| 国产亚洲精品久久久久5区| www.999成人在线观看| 一二三四社区在线视频社区8| 久久精品熟女亚洲av麻豆精品| 在线观看www视频免费| 久久精品亚洲熟妇少妇任你| 9热在线视频观看99| 色婷婷久久久亚洲欧美| 美国免费a级毛片| 啦啦啦视频在线资源免费观看| 亚洲欧洲精品一区二区精品久久久| 亚洲第一欧美日韩一区二区三区 | 亚洲成国产人片在线观看| 亚洲天堂av无毛| 成人黄色视频免费在线看| 国产色视频综合| 一边摸一边抽搐一进一小说 | 日本精品一区二区三区蜜桃| 一本一本久久a久久精品综合妖精| 久久久欧美国产精品| 91精品三级在线观看| 欧美黑人欧美精品刺激| 男女床上黄色一级片免费看| 人妻一区二区av| 亚洲精品一二三| 亚洲视频免费观看视频| 日本精品一区二区三区蜜桃| 国产精品免费一区二区三区在线 | 午夜福利影视在线免费观看| 国产精品久久久久久精品电影小说| 美女国产高潮福利片在线看| 欧美日韩精品网址| 午夜两性在线视频| 久久婷婷成人综合色麻豆| 少妇粗大呻吟视频| 曰老女人黄片| 岛国在线观看网站| 一边摸一边抽搐一进一出视频| 老司机亚洲免费影院| 高清欧美精品videossex| 亚洲自偷自拍图片 自拍| 精品国产国语对白av| 亚洲专区国产一区二区| 黄网站色视频无遮挡免费观看| 黄色视频在线播放观看不卡| 建设人人有责人人尽责人人享有的| 在线观看www视频免费| 久久久久久人人人人人| 欧美+亚洲+日韩+国产| 天天躁夜夜躁狠狠躁躁| 色在线成人网| 国产不卡一卡二| av欧美777| 国产主播在线观看一区二区| 91精品三级在线观看| 一个人免费在线观看的高清视频| 日韩视频一区二区在线观看| 国产成人精品久久二区二区91| 一夜夜www| 母亲3免费完整高清在线观看| av超薄肉色丝袜交足视频| 99国产精品一区二区蜜桃av | 极品教师在线免费播放| a在线观看视频网站| 午夜激情久久久久久久| 精品国产国语对白av| 热re99久久精品国产66热6| 啦啦啦免费观看视频1| 国产欧美日韩精品亚洲av| 一夜夜www| 免费在线观看黄色视频的| 亚洲精品国产一区二区精华液| 大片免费播放器 马上看| 妹子高潮喷水视频| 成人永久免费在线观看视频 | 操出白浆在线播放| 成人影院久久| 久热爱精品视频在线9| 亚洲成人国产一区在线观看| 视频在线观看一区二区三区| 国产高清国产精品国产三级| 亚洲欧美精品综合一区二区三区| 搡老岳熟女国产| 欧美在线一区亚洲| svipshipincom国产片| 女性被躁到高潮视频| 一区二区日韩欧美中文字幕| 日韩大码丰满熟妇| 天堂8中文在线网| 大型黄色视频在线免费观看| 91成年电影在线观看| 一本色道久久久久久精品综合| 中文字幕精品免费在线观看视频| 国产又爽黄色视频| 电影成人av| 天堂8中文在线网| 乱人伦中国视频| 黄频高清免费视频| svipshipincom国产片| 欧美亚洲日本最大视频资源| 国产在线视频一区二区| 中文欧美无线码| 少妇裸体淫交视频免费看高清 | 亚洲精品在线美女| a级片在线免费高清观看视频| 老司机影院毛片| 最近最新免费中文字幕在线| 制服人妻中文乱码| 老司机靠b影院| 男女床上黄色一级片免费看| 久久久国产一区二区| 纯流量卡能插随身wifi吗| 欧美精品一区二区大全| 制服人妻中文乱码| 新久久久久国产一级毛片| 嫁个100分男人电影在线观看| 国产精品熟女久久久久浪| 人人妻人人爽人人添夜夜欢视频| 国产国语露脸激情在线看| 又紧又爽又黄一区二区| 岛国毛片在线播放| 自拍欧美九色日韩亚洲蝌蚪91| 午夜精品国产一区二区电影| 中国美女看黄片| 99国产精品一区二区三区| 精品人妻熟女毛片av久久网站| 国产精品亚洲av一区麻豆| 亚洲熟女毛片儿| 国产有黄有色有爽视频| 人人澡人人妻人| 国产成人系列免费观看| 如日韩欧美国产精品一区二区三区| 欧美 亚洲 国产 日韩一| 美女高潮喷水抽搐中文字幕| 精品欧美一区二区三区在线| 12—13女人毛片做爰片一| 亚洲av日韩在线播放| 国产精品电影一区二区三区 | 十八禁网站网址无遮挡| 日韩中文字幕视频在线看片| 老司机靠b影院| av网站免费在线观看视频| 一区二区三区国产精品乱码| 国产精品久久久人人做人人爽| 一区二区av电影网| 欧美成人午夜精品| 极品教师在线免费播放| 91老司机精品| 91成人精品电影| 男人操女人黄网站| 亚洲一区中文字幕在线| 日韩三级视频一区二区三区| 久久午夜综合久久蜜桃| 免费黄频网站在线观看国产| 后天国语完整版免费观看| 欧美日韩精品网址| 视频区欧美日本亚洲| 成人18禁高潮啪啪吃奶动态图| 国产又爽黄色视频| 女人精品久久久久毛片| 女人被躁到高潮嗷嗷叫费观| a级毛片在线看网站| 超碰成人久久| 久久国产精品大桥未久av| 看免费av毛片| 国产不卡av网站在线观看| 国产一区二区在线观看av| 国产日韩欧美视频二区| av有码第一页| 精品久久蜜臀av无| 亚洲 国产 在线| 99国产综合亚洲精品| 欧美国产精品一级二级三级| 999久久久国产精品视频| 久久精品国产亚洲av高清一级| 精品久久久精品久久久| 国产成人精品无人区| 欧美激情久久久久久爽电影 | 激情视频va一区二区三区| 国产精品成人在线| 三上悠亚av全集在线观看| av福利片在线| 男女午夜视频在线观看| 中文字幕色久视频| 一区二区日韩欧美中文字幕| 丰满迷人的少妇在线观看| 人人妻人人爽人人添夜夜欢视频| 中文字幕av电影在线播放| 亚洲中文av在线| 9191精品国产免费久久| 天堂中文最新版在线下载| 美女国产高潮福利片在线看| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美日韩另类电影网站| 欧美精品一区二区免费开放| 嫩草影视91久久| 夜夜夜夜夜久久久久| tube8黄色片| 高清av免费在线| 久久精品aⅴ一区二区三区四区| 久久久久精品国产欧美久久久| 1024香蕉在线观看| 免费在线观看日本一区| 黄色视频,在线免费观看| 日韩免费高清中文字幕av| 免费观看人在逋| 欧美激情久久久久久爽电影 | av线在线观看网站| 日韩大片免费观看网站| 免费在线观看完整版高清| 淫妇啪啪啪对白视频| 国产一区二区激情短视频| netflix在线观看网站| 国产亚洲精品久久久久5区| 美女国产高潮福利片在线看| netflix在线观看网站| 久久人妻福利社区极品人妻图片| 老司机在亚洲福利影院| 桃红色精品国产亚洲av| 伊人久久大香线蕉亚洲五| 国产区一区二久久| 精品人妻在线不人妻| 中文字幕最新亚洲高清| 国产一区二区激情短视频| 91九色精品人成在线观看| 国产一区二区三区在线臀色熟女 | 日日摸夜夜添夜夜添小说| 成在线人永久免费视频| 免费日韩欧美在线观看| 中亚洲国语对白在线视频| 国产精品亚洲一级av第二区| 免费在线观看黄色视频的| 国产亚洲精品第一综合不卡| 高清av免费在线| 宅男免费午夜| 亚洲中文日韩欧美视频| 国产av精品麻豆| 五月天丁香电影| 国产黄色免费在线视频| 飞空精品影院首页| 一本色道久久久久久精品综合| 精品一品国产午夜福利视频| 精品少妇久久久久久888优播| 一个人免费在线观看的高清视频| 国产精品国产高清国产av | 精品第一国产精品| 露出奶头的视频| 岛国在线观看网站| 久久九九热精品免费| 老熟妇仑乱视频hdxx| 日韩大片免费观看网站| 国产欧美日韩一区二区三| 精品少妇久久久久久888优播| 国产男女超爽视频在线观看| 色老头精品视频在线观看| 国产成人影院久久av| 黄色 视频免费看| 夜夜夜夜夜久久久久| 国产高清激情床上av| 成人18禁高潮啪啪吃奶动态图| 女人久久www免费人成看片| 美国免费a级毛片| 一级,二级,三级黄色视频| 丝袜在线中文字幕| 国产成人欧美在线观看 | 国产成人影院久久av| 999久久久国产精品视频| 成年女人毛片免费观看观看9 | 久久国产精品大桥未久av| 曰老女人黄片| 69精品国产乱码久久久| 天天影视国产精品| 久久国产精品人妻蜜桃| 国产精品自产拍在线观看55亚洲 | 99re在线观看精品视频| 我的亚洲天堂| 91av网站免费观看| 建设人人有责人人尽责人人享有的| 国产成人一区二区三区免费视频网站| avwww免费| 午夜免费鲁丝| 狠狠婷婷综合久久久久久88av| 亚洲专区国产一区二区| 国产成人av教育| 精品视频人人做人人爽| 亚洲 欧美一区二区三区| 亚洲九九香蕉| 精品少妇一区二区三区视频日本电影| 一区二区av电影网| 久久精品aⅴ一区二区三区四区| 国产99久久九九免费精品| 性色av乱码一区二区三区2| 一边摸一边做爽爽视频免费| 日韩一卡2卡3卡4卡2021年| 午夜福利一区二区在线看| 啦啦啦视频在线资源免费观看| 亚洲七黄色美女视频| 黄网站色视频无遮挡免费观看| 极品人妻少妇av视频| 考比视频在线观看| 亚洲成人手机| 视频在线观看一区二区三区| 国产在线一区二区三区精| 国产男女内射视频| 美女高潮到喷水免费观看| 老司机亚洲免费影院| 后天国语完整版免费观看| tube8黄色片| 国产在线精品亚洲第一网站| 中文字幕人妻丝袜制服| 精品国产亚洲在线| 日韩大片免费观看网站| 欧美黑人欧美精品刺激| 不卡av一区二区三区| 青草久久国产| 搡老岳熟女国产| 日本av手机在线免费观看| 中文字幕人妻丝袜制服| 国产一区二区三区视频了| 日韩中文字幕视频在线看片| 十八禁网站网址无遮挡| 欧美精品啪啪一区二区三区| 后天国语完整版免费观看| 天天影视国产精品| 亚洲色图综合在线观看| 亚洲黑人精品在线| 亚洲国产成人一精品久久久| 欧美另类亚洲清纯唯美| 成年人免费黄色播放视频| 亚洲一区中文字幕在线| 18禁黄网站禁片午夜丰满| 两个人免费观看高清视频| 国产1区2区3区精品| 国产精品 国内视频| 亚洲av成人不卡在线观看播放网| www.熟女人妻精品国产| 国产精品一区二区在线观看99| 女同久久另类99精品国产91| 两人在一起打扑克的视频| 欧美黄色片欧美黄色片| 亚洲专区字幕在线| 久久性视频一级片| www.自偷自拍.com| 性少妇av在线| 日韩 欧美 亚洲 中文字幕| 人妻久久中文字幕网| 欧美精品高潮呻吟av久久| 大码成人一级视频| 亚洲精品久久成人aⅴ小说| 搡老乐熟女国产| 日本黄色日本黄色录像| 欧美乱码精品一区二区三区| 狠狠狠狠99中文字幕| 麻豆乱淫一区二区| 免费观看a级毛片全部| 女人高潮潮喷娇喘18禁视频| 午夜久久久在线观看| 欧美黑人欧美精品刺激| 王馨瑶露胸无遮挡在线观看| 51午夜福利影视在线观看| 久热爱精品视频在线9| 69精品国产乱码久久久| 亚洲美女黄片视频| √禁漫天堂资源中文www| 十八禁网站免费在线| 大片免费播放器 马上看| 欧美精品一区二区大全| 老汉色∧v一级毛片| 桃花免费在线播放| 国产精品国产av在线观看| 中文字幕av电影在线播放| 亚洲国产精品一区二区三区在线| 黄网站色视频无遮挡免费观看| 一进一出抽搐动态| 国产在线观看jvid| 9色porny在线观看| 90打野战视频偷拍视频| 精品福利观看| 国产精品美女特级片免费视频播放器 | 国产在线精品亚洲第一网站| 亚洲av电影在线进入| 欧美精品啪啪一区二区三区| 成年人黄色毛片网站| videos熟女内射| 欧美精品av麻豆av| 女性生殖器流出的白浆| 久久久久网色| 亚洲一卡2卡3卡4卡5卡精品中文| 无遮挡黄片免费观看| 最近最新中文字幕大全电影3 | 欧美性长视频在线观看| 欧美亚洲 丝袜 人妻 在线| 男人舔女人的私密视频| 亚洲精品乱久久久久久| 80岁老熟妇乱子伦牲交| 我的亚洲天堂| 人人妻人人澡人人爽人人夜夜| 久久99热这里只频精品6学生| 国产av一区二区精品久久| 国产成人av激情在线播放| 中文字幕另类日韩欧美亚洲嫩草| 黑人操中国人逼视频|