• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向中文法律裁判文書的抽取式摘要算法

    2024-01-26 07:47:28溫嘉寶
    集成技術 2024年1期
    關鍵詞:編碼器文書裁判

    溫嘉寶 楊 敏

    1(中國科學院深圳先進技術研究院 深圳 518055)2(中國科學院大學 北京 100049)

    1 引 言

    隨著人民群眾法律意識的提高和案件數(shù)量增長速度的加快,截至 2023 年 1 月,中國裁判文書網已公布超過 1.3 億份的裁判文書,并以每日數(shù)千份的速度繼續(xù)增加。這些文書包括民事、刑事、行政、賠償、執(zhí)行等多種類型,經過篩選和專業(yè)處理后被公布,形成了法律領域中數(shù)據量最大的數(shù)據庫,為司法智能化、信息化提供了強有力的數(shù)據基礎。優(yōu)質裁判文書的不斷增加對司法領域的發(fā)展具有重要意義,如可以為法律從業(yè)者提供更多的案例參考,緩解“同案不同判”的困境。然而,這也帶來了一些新的問題。

    裁判文書是法律從業(yè)者日常工作中接觸的重要資料之一,包括進行類案檢索和撰寫類案檢索報告。隨著裁判文書數(shù)據量的增加,法律從業(yè)者需要從檢索出的大量裁判文書中挑選出最合適的裁判文書。然而,裁判文書通常較長,平均長度可達數(shù)千字,甚至有少數(shù)文件長達上萬字,從中查找出關鍵信息并進行分析無疑變得越來越困難。因此,對裁判文書進行自動摘要,以去除冗余信息、精簡文本內容,能極大程度地減少法律從業(yè)者的工作量,使得他們有更多的精力從事更有價值的工作,從而提升司法行業(yè)的效率。由此可見,裁判文書自動摘要對司法領域有著重要研究價值和現(xiàn)實意義。

    根據摘要方式,自動摘要模型可分為抽取式模型和生成式模型,本文提出的方法屬于抽取式模型。抽取式模型通過從原文中直接選擇若干個重要句子進行排列重組,以形成摘要。根據學習方式的不同,抽取式摘要算法可進一步劃分為無監(jiān)督式抽取和有監(jiān)督式抽取。無監(jiān)督抽取式文本摘要方法因運行速度快,且無須人工標注訓練數(shù)據而廣受應用。相比之下,有監(jiān)督抽取式文本摘要方法的優(yōu)勢在于其具有更高的準確性。

    2 抽取式摘要研究現(xiàn)狀

    抽取式摘要是一種直接從原文中抽取關鍵句的方式,這種方式在句法上錯誤率低。從學習方式上,抽取式摘要算法可以分為無監(jiān)督和有監(jiān)督兩大類。無監(jiān)督抽取式摘要通常采用圖、聚類等方式。而有監(jiān)督抽取式摘要多采用基于神經網絡的方法。

    2.1 無監(jiān)督抽取式摘要算法

    無監(jiān)督抽取式摘要最簡單的實現(xiàn)方式是“Lead-3”法,即從文本前 3 個句子中提取信息,并作為摘要。由于作者通常在文章的標題和開頭部分闡述文章的主題(如新聞報道),因此,這種方式在該類文本中較為有效。然而,法律裁判文書的關鍵信息分布較為均勻,因此,采用 Lead-3法進行法律裁判文書的摘要不能達到理想效果。

    2004 年,Erkan 等[1]提出的 LexRank 是一種基于圖排序的抽取式摘要算法,其以句子為節(jié)點,以句子間相似度為邊的權值,構建無向有權圖。該算法采用詞袋模型表示句子向量,維度是目標語言中單詞的數(shù)量。對于出現(xiàn)在句子中的每個單詞來說,句子向量中相應維數(shù)的值是該單詞的 TF-IDF[2]值。通過計算句子向量與圖中質心之間的相似度,判斷句子是否為重要句子。其中,兩個句子之間的相似性由向量間的余弦相似度定義,而質心是由文檔中 TF-IDF 值超過某一閾值的詞構成的向量。該算法具有簡單和易于實現(xiàn)的優(yōu)點。然而,它在表示句子向量的方式上存在一定的缺陷。其一,維度較大,導致生成的句子向量非常稀疏。其二,句子向量中相應維數(shù)的值是該單詞的 TF-IDF 值。由于 TF-IDF 基于詞頻統(tǒng)計,無法考慮語義信息,因此,LexRank 在判斷句子相似性時無法充分考慮語義層面的相似度。

    2004 年,Mihalcea 等[3]提出的 TextRank 算法是一種基于圖的排序算法,其設計靈感源自于 PageRank[4]網絡排序算法。該算法將文檔表示為圖模型,將文檔中的每個句子作為圖中的一個節(jié)點,節(jié)點之間的連邊表示句子之間的相關性。然后,通過 PageRank 算法計算每個節(jié)點的TextRank 值,以確定文檔中最重要的句子,并選擇其中得分最高的幾個句子作為摘要。然而,TextRank 的句子相似度衡量方式采用了兩個句子之間的共現(xiàn)詞數(shù)量,即采用了詞袋模型,無法考慮同義詞、詞序等其他信息。這使得 TextRank算法的表現(xiàn)會受到一定的限制。

    2016 年,Padmakumar 等[5]提出了一種基于聚類的抽取算法。首先,利用 Skip Thought Vectors 進行無監(jiān)督學習,得到句子的嵌入向量。然后,通過聚類算法對生成的句子嵌入向量進行聚類。最后,將距離簇質心最近的向量所對應的句子作為文本摘要。Skip Thought Vectors 的思想是通過一個句子預測它上下文的句子,具體做法是通過 LSTM[6]編碼器將中間句子編碼為向量,再用兩個獨立的 LSTM 解碼器將句子向量解碼出前后句子。這種方式與 2013 年 Mikolov 等[7]提出的 Word2Vec 中的 Skip-gram 訓練策略相似,依據的原則是一個句子與其前后相鄰句子之間存在語義聯(lián)系。在該論文中,Padmakumar 等[5]嘗試了 K-means 和 Mean-shift 兩種聚類方法。然而,該算法的不足之處在于 LSTM 無法實現(xiàn)并行訓練,以及在處理長序列時可能面臨梯度消失和梯度爆炸的風險。

    2021 年,Padmakumar 等[8]提出了一種基于點互信息的摘要算法。該算法利用 GPT-2[9]計算給定兩個句子之間的點互信息,而點互信息定義為在給定前句的情況下,得到后句的概率。通過對摘要與原文檔中所有句子對的點互信息進行求和,可以得到摘要與原文檔的相關性。同時,通過對摘要內部所有句子對的點互信息進行求和,可以確定摘要的冗余性。最終,摘要由一個句子集合組成,該集合能最大化相關性減去冗余性的值。該算法的優(yōu)點在于利用預訓練語言模型計算句子間的點互信息,從而實現(xiàn)無監(jiān)督抽取式摘要。然而,缺點在于其時間復雜度較高,需要計算所有句子之間的點互信息。當文檔句子數(shù)量較大時,推理時間將會較長。

    2.2 有監(jiān)督抽取式摘要算法

    2017 年,Nallapati 等[10]提出了一種名為SummaRuNNer 的方法,將文本摘要任務轉化為序列標注問題。對文本中的每個句子都進行二分類(0 或 1):0 表示不納入摘要,1 表示納入摘要。最終的文本摘要由標記為 1 的句子組成。該模型包含兩個雙向門控循環(huán)單元[11]:第一個雙向門控循環(huán)單元對句子進行詞級建模,以獲得詞級表示,接著,對句子中各詞的詞級表示求平均,得到句子嵌入;第二個雙向門控循環(huán)單元則對句子嵌入進行句級建模,以獲取句級表示。最后,通過一個分類器對句級表示進行二分類,得到最終的摘要結果。該模型的優(yōu)點在于,它不僅雙向考慮了句子的局部和全局信息,還充分考慮了句子與文檔的關系、句子與前后句子的關系、絕對位置和相對位置等因素。然而,該模型的缺陷在于采用循環(huán)神經網絡(recurrent neural network,RNN)進行特征提取,導致無法進行并行訓練。此外,在處理長序列時,模型可能會面臨梯度消失和梯度爆炸的風險。

    2017 年,Isonuma 等[12]將文本分類任務與摘要任務相結合,以提升摘要效果。該方法首先采用卷積神經網絡對句子進行編碼,獲取句子向量;然后使用基于 RNN 的編碼器-解碼器框架為每個句子生成摘要概率。具體而言,在編碼器中,為每個句子生成隱藏狀態(tài);在解碼器中,利用前一個句子的摘要概率、句子向量和隱藏狀態(tài)生成當前句子的隱藏狀態(tài),并根據該隱藏狀態(tài)計算當前句子的摘要概率。接著,以摘要概率為權重,對句子向量進行加權平均,得到文本向量。最后,利用文本向量預測文本的類別。Isonuma等[12]認為,文本的類別可以被視為文本的粗糙摘要。若模型能根據文本向量準確預測文本類別,則說明模型具有抽取關鍵信息的能力。因此,可以將摘要概率較高的句子作為文本的摘要。該方法的優(yōu)點在于利用文本分類任務增強模型的摘要能力。然而,該方法也存在一些缺點:(1)卷積神經網絡主要通過局部卷積操作捕捉文本中的局部特征,對長距離依賴關系的捕捉能力較弱;(2)卷積神經網絡的卷積操作對輸入的順序不敏感,在捕捉文本中的詞序信息方面存在局限;(3)基于 RNN 的編碼器-解碼器架構無法并行計算,且存在梯度消失和梯度爆炸的風險;(4)計算過程為單向操作,在計算當前句子摘要概率時,無法考慮后續(xù)句子的信息。

    2019 年,Liu[13]首次將 BERT[14]應用于抽取式摘要任務,提出了名為 BERTSUM 的方法。即在每個句子前插入[CLS]詞元,句子后添加[SEP]詞元,最終將每個[CLS]對應的輸出視為每個句子的句子向量。Liu[13]采用了 3 種方式對句子進行分類:(1)連接線性層和 Sigmoid 函數(shù),計算句子的重要性得分;(2)句子向量表示單獨接入 Transformer[15]進行分類;(3)將句子向量表示單獨接入 LSTM 進行分類。BERTSUM 的優(yōu)勢在于充分利用了預訓練語言模型的強大特征提取能力。通過對輸入數(shù)據進行簡單的預處理和微調預訓練語言模型,便可完成抽取式摘要任務。此方法具有實現(xiàn)相對簡單、訓練代價較低等優(yōu)點。然而,BERTSUM 也存在一定的缺陷,即需要將整篇文本一次性輸入到 BERT 中,當文本長度超出模型輸入限制時,則難以完成摘要任務。

    2020 年,Zhong 等[16]提出了 MatchSum 模型,將摘要任務轉化為文本匹配任務。該模型利用預訓練語言模型對文本進行編碼,通過比較文檔上下文表示與真實摘要及候選摘要的上下文表示,計算相似度并更新參數(shù)。模型認為目標摘要與原文檔之間的相似度應最為接近,因此,當存在比目標摘要更接近原文檔的摘要時,計算損失并更新參數(shù)。文檔的候選集由多個句子的所有組合構成。為防止文檔句子過多導致組合爆炸,Zhong 等[16]采用 BERTSUM 進行粗略摘要,將部分不重要的句子剔除。在推理階段,選擇與原文檔語義相似度最高的候選摘要作為摘要結果。該算法的優(yōu)點在于將摘要任務轉換為文本匹配任務,僅需將匹配得分最高的候選結果作為摘要答案。然而,該算法也存在一些缺點:(1)使用BERTSUM 進行粗略摘要,在處理長文本時,可能會截斷文本,導致信息丟失;(2)不適用于處理句子較多的文本,當文本句子數(shù)量較大時,候選摘要集規(guī)模也會很大,將增加計算成本。

    2022 年,Shi 等[17]提出了一個基于星形架構的抽取式摘要模型 StarSum:首先,通過BERTSUM 生成每個句子的句子表示;其次,將句子表示與位置嵌入相加;再次,輸入星形 Transformer 進行文檔級編碼;最后,利用Sigmoid 函數(shù)對最后一層每個句子的輸出進行分類,從而得到文本摘要。星形 Transformer 由多個衛(wèi)星節(jié)點和一個星節(jié)點組成,構成一個全連接的星形結構。在此結構中,文本序列中第i個句子的特征由第i個衛(wèi)星節(jié)點的狀態(tài)表示。星形Transformer 包括環(huán)連接和基本連接兩種連接方式。衛(wèi)星節(jié)點通過類似雙向 RNN 的環(huán)狀連接從其鄰居節(jié)點收集信息(其中,第一個和最后一個衛(wèi)星節(jié)點相互連接),而星節(jié)點則通過基本連接從所有衛(wèi)星節(jié)點獲取信息。衛(wèi)星節(jié)點可以通過星節(jié)點以兩跳的方式實現(xiàn)信息的相互傳播。這種架構的優(yōu)點在于提高了計算效率和處理長期依賴關系的能力。然而,其缺點在于利用 BERTSUM生成句子向量表示,在處理長文本摘要時,BERTSUM 可能會截斷文本,從而導致信息丟失。

    3 基于 Transformer 編碼器的抽取式摘要算法

    本文所提抽取式摘要模型由一個基于RoBERTa-Large[18]的句子向量生成模型和一個基于 Transformer 編碼器的句分類模型組成,最后接入全連接層進行二分類,得到句子重要性,文本摘要則由重要句子組成,如圖1~2 所示。

    圖1 句向量生成模型Fig.1 Sentence vector generative model

    圖2 抽取式摘要模型結構Fig.2 Extractive summarization model

    3.1 基于預訓練語言模型的句子向量生成模型

    抽取式摘要實際上可以建模為序列標注任務,核心思想是對文本中每個句子進行二分類,0 表示不重要,1 表示重要,所有標簽為 1 的句子組成文本摘要。使用預訓練語言模型處理文本分類問題常見的方式是在文本前插入[CLS]詞元,并使用該詞元所對應的輸出進行全連接分類。但裁判文書屬于長文本,其長度普遍超過常見預訓練語言模型的單次輸入長度,如BERT(512 個 token),甚至會超過一些可以處理長文本的預訓練語言模型的單次輸入最大長度,如 Longformer[19](4 096 個 token),因此無法使用在每個句子前插入[CLS]詞元,并以[CLS]詞元作為句子分類特征的方式。本文所用方法將抽取式摘要分解為句向量生成模型和句分類模型。

    基于預訓練語言模型的句向量生成模型單次處理一個句子,將預訓練語言模型最后一層的輸出進行平均池化,得到句向量,最終裁判文書的表示為 。這種方式可以有效增加模型可處理文本長度,并減少內存需要,但無法對句向量生成模型進行微調。

    3.2 基于 Transformer 編碼器的句分類模型

    第 3.1 小節(jié)中用句子向量生成模型對每個句子單獨編碼,并不包含句子的上下文信息,而抽取式摘要需要考慮到上下文,因此不能直接對所生成的句向量進行分類。

    對于一個給定的句子來說,它的輸入表示由句子向量、位置嵌入及長度嵌入求和得到。句子向量代表句子所包含的基本語義信息。位置嵌入代表句子在裁判文書中的位置,其中,每個位置對應一個可訓練向量。長度嵌入表示當前句子所包含的長度信息,將句子長度按區(qū)間劃分,每一個長度區(qū)間對應同一個可訓練向量,計算方式如公式(1)所示。其中, 為句子長度;interval為區(qū)間間隔,一般取 5 或 10;idx為區(qū)間下標,對應長度嵌入中具體的一個可訓練向量。

    模型訓練過程分為 5 步:(1)將一個裁判文書中每個句子的句子向量、位置嵌入及長度嵌入求和,得到每個句子的輸入特征;(2)將裁判文書中所有句子輸入特征按順序拼接輸入由 Transformer 編碼器組成的文本級編碼器中;(3)通過多頭自注意力機制,從多維度融合句子上下文信息,生成句子的文本級表示;(4)通過全連接層對句子文本級表示進行二分類,得到句子重要性,0 表示不重要,1 表示重要;(5)計算損失,更新模型。句子輸入特征計算過程如公式(2)所示。

    4 實驗分析與評估

    4.1 數(shù)據集與評價指標

    本文使用 CAIL2020 摘要數(shù)據集作為實驗數(shù)據,該數(shù)據集共收錄 13 531 份一審民事判決書,涵蓋了侵權責任、借款合同、繼承合同、勞動合同、租賃合同等多種民事糾紛類別。樣本中的裁判文書預先以多個句子劃分,每個句子均有是否重要的標簽,同時提供與之對應的全文參考摘要。文書字數(shù)平均為 2 586 個,其中,最長的一篇達 14 413 個字,所有文本長度超過 512 個字,99.7% 的文書長度超過 1 024 個字,63.4% 的文書長度超過 2 048 個字。平均每個文書包含 57 個句子,最多的一份達 496 個句子。每篇文書平均抽取 12 個句子作為摘要,最多抽取 69 個句子。每個句子平均包含 44 個字,最長的一個句子長達 640 個字。文書摘要字數(shù)平均為 791 個字,最長的一個摘要長達 3 790 個字。數(shù)據集中共包含782 879 個句子,其中,171 745 個句子為重要句子,611 134 個句子為非重要句子,即正負樣本的比例為 1∶3.55。該數(shù)據集屬于長文本摘要數(shù)據集。

    數(shù)據集格式如表1 所示。其中,id 表示案例唯一標識;summary 字段表示人工總結的與文檔對應的全文參考摘要;text 字段是一個列表,按順序包含案例中每個句子,text 中的一個元素表示文本的一個帶標簽的句子,帶標簽的句子中包含 sentence 和 label;sentence 表示句子具體內容;label 表示這個句子是否重要,0 表示不重要,1 表示重要。本文所研究的方法為抽取式摘要算法,只用到 text 字段,summary 字段屬于生成式摘要所需標注的數(shù)據,對本文所研究方法作用不大,因此舍棄。

    表1 司法摘要數(shù)據集格式Table 1 Legal summarization dataset format

    鑒于將抽取任務轉化為對句子的分類任務,將F1作為評估指標,比精確率(Precision)和召回率(Recall)更能準確評價一個模型的好壞。F1指標如公式(10)所示。為了更好地與基線模型對比,本實驗還使用 ROUGE[20]指標,該指標包含多種度量摘要之間相似性的自動評估方法,是一種常用的文本摘要評價指標。ROUGE-N的召回率如公式(6)所示。

    其中,PredSums 為預測摘要。ROUGE-L 的計算公式如公式(8)和公式(9)所示。

    其中,LCS用于計算兩個字符串最長公共子串的長度;m為目標摘要長度;n為預測摘要長度。

    本實驗的實驗超參數(shù)說明如表2 所示。Max_sent_len 表示句子向量生成模型所能處理的最大句子長度。Seq_len 表示句子分類模型能處理的最大句子數(shù)量。Pos_weight 和 Neg_weight表示正例和負例的權重,由于數(shù)據集中摘要句子的正負例失衡,負例數(shù)量是正例的 3.55 倍,因此,設置正負例權重糾正偏差。Interval 表示長度間隔,模型通過長度間隔引入句子的長度信息,具體做法是將處于相同長度區(qū)間內的句子映射到同一個可訓練的長度嵌入,具體如公式(1)所示。Layer 表示句子分類模型中 Transformer 編碼器的層數(shù)。

    表2 實驗超參數(shù)Table 2 Hyperparameters in experiment

    4.2 實驗結果

    本文提出的模型將 RoBERTa-Large 作為句子編碼器,將多層 Transformer 編碼器結構作為句子分類模型,將抽取任務轉化為句子的分類任務,并且與無監(jiān)督 TextRank 基線模型進行了對比,證明了該模型的有效性。此外,本文在抽取式摘要模型中引入了與長度相關的特征,進一步提升了模型效果。實驗結果如表3~5 所示,與基線模型相比,本文提出的抽取式摘要模型在ROUGE-1、ROUGE-2 和 ROUGE-L 指標上均有明顯提升。

    表3 模型在不同長度間隔上實驗的結果Table 3 Experimental results of the model on differentlength intervals

    4.3 討論與分析

    經過數(shù)據分析發(fā)現(xiàn),句子長度信息對句子重要程度有一定影響,因此,本實驗引入了句子長度信息。具體方式是將文本長度位于相同區(qū)間的文本共享同一個可訓練向量,并在文本輸入階段與句子嵌入、句子位置融合,得到句子向量。實驗結果如表3 所示,表中結果為 Transformer 編碼器為 4 層的實驗結果。由表3 可知,加入長度信息后,F(xiàn)1指標有一定提升。長度間隔為 5時,F(xiàn)1提升 2.586%;長度間隔為 10 時,F(xiàn)1提升2.706%??梢钥闯?,句子長度信息是抽取句子所需的重要信息之一。

    為了選擇最優(yōu)的 Transformer 編碼器層數(shù),本研究進行了一系列實驗,針對 1~6 層分別計算了 Recall、Precision 和F1指標,結果如表4 所示。從表4 可以看出,隨著編碼器層數(shù)的增加,Precision 指標逐漸提高,而 Recall 指標則呈逐漸下降的趨勢。然而,F(xiàn)1指標與層數(shù)之間并沒有太大的相關性,這表明層數(shù)對模型的整體性能影響有限。在本實驗中,當編碼器層數(shù)為 4 時,模型在F1指標上取得了最佳效果。

    表4 模型在不同 Transformer 編碼器層數(shù)上實驗的結果Table 4 Experimental results of the model on differentTransformer encoder layers

    在與基線模型進行對比的實驗中,采用了ROUGE-1、ROUGE-2、ROUGE-L 指標,實驗結果詳見表5。其中,RoBERTa-Large-Transformer編碼器的 Transformer 層數(shù)為 4。

    表5 模型與基準模型的指標對比Table 5 Comparison of metrics between the model and the baseline model

    Lead-3 模型直接將文檔前 3 句話作為摘要,這種方式并不適用于重要信息比較均勻的法律文本,因此其指標并不高。

    TextRank 在選擇召回分數(shù)最高的 15 個句子時表現(xiàn)最佳。由表5 可知,與無監(jiān)督的 TextRank模型相比,RoBERTa-Large-Transformer 編碼器在3 個指標上均有較大提升。其中,ROUGE-1 的F1指標提升 16.44%;ROUGE-2 的F1指標提升21.87%;ROUGE-L 的F1指標提升 18.05%,3 個指標平均提升 18.79%。

    BERTSUM 模型是 BERT 在抽取式摘要中的首次應用。其具體做法是在句子之前插入[CLS]詞元,在句子之后插入[SEP]詞元,通過預訓練語言模型提取特征,根據[CLS]詞元對應的輸出預測句子的重要性。然而,這種方法的缺點是輸入長度受到預訓練語言模型的限制。例如,BERT 僅能輸入 512 個詞元,而即使 Longformer和 Lawformer 極大程度地增加了模型的可輸入長度,數(shù)據集中依舊有超過一半的數(shù)據超出其長度限制。本實驗采用了截斷的方式來處理超出長度限制的部分。

    基于 BERT 的 BERTSUM 模型在精確率方面具有較高的表現(xiàn),但由于信息截斷的影響,其召回率較低,因此,F(xiàn)1值相對較低。相反,基于 Longformer 的 BERTSUM 模型具有較高的召回率,但精確率偏低,同樣導致F1值較低。與基于 Longformer 的 BERTSUM 模型相比,RoBERTa-Large-Transformer 編碼器在 ROUGE-1的F1指標上提升了 22.58%;在 ROUGE-2 的F1指標上提升了 26.42%;在 ROUGE-L 的F1指標上提升了 23.08%,3 個指標的平均提升為24.03%。

    5 結 論

    本文針對中文裁判文書摘要任務提出一種基于 Transformer 編碼器的抽取式摘要模型。該模型首先通過預訓練語言模型采用平均池化的方式為每個句子生成句嵌入;然后通過 Transformer編碼器將句子嵌入、句子位置嵌入及句子長度嵌入融合;最后通過全連接網絡對句子表示進行分類,從而完成抽取式摘要任務。本文所提出模型避免了直接將長文本輸入模型導致超出預訓練語言模型的最大輸入長度的問題,從而極大程度地擴大了摘要模型可處理的文本長度。此外,抽取式摘要算法將句子長度以區(qū)間劃分,并進行映射,從而使模型可以考慮句子的長度信息,提升模型效果。本文所提出的抽取式摘要算法在ROUGE-1、ROUGE-2、ROUGE-L 指標上均遠超過基線模型。

    中文法律裁判文書的抽取式摘要任務仍處于早期探索階段,由于缺乏公開數(shù)據集,或是數(shù)據集中裁判文書種類不全,裁判文書屬于長文本,而常見的預訓練語言模型并不支持長文本等原因,該任務依然面臨著巨大挑戰(zhàn)。而從模型層面,長文本抽取式摘要仍有許多待解決的問題,例如:根據現(xiàn)在的分句標準,句子長度極其不均衡,一些句子長度過長,進行句子嵌入生成時,信息可能會被過度壓縮,導致語義信息丟失。而如果對句子進行更細致的分割,則又可能導致少部分文本句子數(shù)量過多,從而使得處于末尾部分的位置嵌入無法得到充分訓練,并會出現(xiàn)模型抽取少句子的文本效果好,而抽取多句子的文本效果差的情況。這些問題亟待進一步研究解決。

    猜你喜歡
    編碼器文書裁判
    太行山文書精品選(17)
    法官如此裁判
    法官如此裁判
    監(jiān)獄執(zhí)法文書規(guī)范探討
    法律裁判中的比較推理
    法律方法(2019年4期)2019-11-16 01:07:10
    黑水城出土《宋西北邊境軍政文書》中“砲”類文書再討論
    西夏學(2019年1期)2019-02-10 06:22:40
    清代刑事裁判中的“從重”
    法律史評論(2018年0期)2018-12-06 09:22:28
    基于FPGA的同步機軸角編碼器
    基于PRBS檢測的8B/IOB編碼器設計
    JESD204B接口協(xié)議中的8B10B編碼器設計
    電子器件(2015年5期)2015-12-29 08:42:24
    蜜臀久久99精品久久宅男| 九草在线视频观看| 男女啪啪激烈高潮av片| 国产国拍精品亚洲av在线观看| 久久韩国三级中文字幕| 精品99又大又爽又粗少妇毛片| 日韩在线高清观看一区二区三区| 久久久久久九九精品二区国产| 日本与韩国留学比较| 免费播放大片免费观看视频在线观看| 欧美日韩视频精品一区| 只有这里有精品99| 亚洲天堂av无毛| 亚洲欧美精品专区久久| 天堂中文最新版在线下载 | 亚洲熟女精品中文字幕| 婷婷色麻豆天堂久久| 亚洲av中文av极速乱| 纵有疾风起免费观看全集完整版| 在线看a的网站| 91精品一卡2卡3卡4卡| a级一级毛片免费在线观看| 午夜免费男女啪啪视频观看| 大话2 男鬼变身卡| 久久人人爽人人爽人人片va| 成年人午夜在线观看视频| 在线观看人妻少妇| 永久网站在线| 久久久久久国产a免费观看| 亚洲四区av| 国产亚洲av片在线观看秒播厂| 国产白丝娇喘喷水9色精品| 国产午夜精品久久久久久一区二区三区| 色哟哟·www| 热99国产精品久久久久久7| 中文在线观看免费www的网站| .国产精品久久| 99热国产这里只有精品6| 天美传媒精品一区二区| 99热这里只有精品一区| 亚洲成人av在线免费| 免费播放大片免费观看视频在线观看| 最近手机中文字幕大全| videos熟女内射| 成人亚洲欧美一区二区av| 国内揄拍国产精品人妻在线| 婷婷色综合www| 国产大屁股一区二区在线视频| 网址你懂的国产日韩在线| 五月伊人婷婷丁香| 国产免费视频播放在线视频| 久久久久久久久久久丰满| 亚洲av二区三区四区| 欧美日韩精品成人综合77777| 一级毛片久久久久久久久女| 久热久热在线精品观看| 夫妻性生交免费视频一级片| 亚洲av免费在线观看| 国产在视频线精品| 最近最新中文字幕大全电影3| 在线天堂最新版资源| 我的女老师完整版在线观看| 国产片特级美女逼逼视频| 国产成人a区在线观看| 高清午夜精品一区二区三区| 久久久国产一区二区| 国产老妇伦熟女老妇高清| 大又大粗又爽又黄少妇毛片口| 亚洲av日韩在线播放| 国产一区亚洲一区在线观看| 国产精品嫩草影院av在线观看| 伊人久久国产一区二区| 国产高清不卡午夜福利| 国产黄色免费在线视频| 少妇的逼好多水| 在线免费十八禁| 日韩电影二区| 免费高清在线观看视频在线观看| 99九九线精品视频在线观看视频| 国产91av在线免费观看| av.在线天堂| 国产欧美另类精品又又久久亚洲欧美| 国产人妻一区二区三区在| 国产伦精品一区二区三区四那| 22中文网久久字幕| 精品久久久久久久久亚洲| av黄色大香蕉| 在线免费十八禁| 国产淫片久久久久久久久| 99热6这里只有精品| 好男人视频免费观看在线| 人妻系列 视频| 人妻一区二区av| 2021天堂中文幕一二区在线观| 男女国产视频网站| 香蕉精品网在线| 九草在线视频观看| 亚洲自偷自拍三级| 建设人人有责人人尽责人人享有的 | 中文欧美无线码| 人妻制服诱惑在线中文字幕| 国产一级毛片在线| 亚洲美女搞黄在线观看| 亚洲精品aⅴ在线观看| 亚洲国产欧美人成| 嘟嘟电影网在线观看| 看十八女毛片水多多多| 自拍欧美九色日韩亚洲蝌蚪91 | 一级片'在线观看视频| 国产精品99久久99久久久不卡 | 欧美性猛交╳xxx乱大交人| 热re99久久精品国产66热6| 十八禁网站网址无遮挡 | 身体一侧抽搐| 一级二级三级毛片免费看| 嘟嘟电影网在线观看| 人人妻人人澡人人爽人人夜夜| 亚洲av男天堂| 97精品久久久久久久久久精品| av在线亚洲专区| 精华霜和精华液先用哪个| 男男h啪啪无遮挡| 中文字幕人妻熟人妻熟丝袜美| 天堂中文最新版在线下载 | 国产久久久一区二区三区| 成人一区二区视频在线观看| 18禁在线无遮挡免费观看视频| 精品一区在线观看国产| 亚洲自偷自拍三级| 麻豆国产97在线/欧美| 久久人人爽av亚洲精品天堂 | 日韩三级伦理在线观看| 国产视频首页在线观看| 亚洲国产最新在线播放| 国产亚洲av嫩草精品影院| 51国产日韩欧美| 老师上课跳d突然被开到最大视频| 人人妻人人爽人人添夜夜欢视频 | 婷婷色综合www| 涩涩av久久男人的天堂| 日本与韩国留学比较| 在线观看免费高清a一片| 新久久久久国产一级毛片| 天堂中文最新版在线下载 | 99热这里只有是精品在线观看| 亚洲国产日韩一区二区| 久久人人爽人人爽人人片va| 久久久久久久大尺度免费视频| 三级男女做爰猛烈吃奶摸视频| xxx大片免费视频| 秋霞在线观看毛片| 国产亚洲最大av| 亚洲综合精品二区| 免费av观看视频| 日韩中字成人| 下体分泌物呈黄色| 色综合色国产| 啦啦啦在线观看免费高清www| 久久久久性生活片| 99视频精品全部免费 在线| 国产亚洲91精品色在线| 国产精品蜜桃在线观看| 亚洲精品aⅴ在线观看| 国产高清国产精品国产三级 | 久久久久久久久久久免费av| 精品久久国产蜜桃| 亚洲美女搞黄在线观看| 2022亚洲国产成人精品| 高清欧美精品videossex| 亚洲人成网站在线观看播放| 少妇被粗大猛烈的视频| 五月天丁香电影| 午夜免费男女啪啪视频观看| 99久久精品热视频| 成年免费大片在线观看| 亚洲第一区二区三区不卡| av一本久久久久| 内地一区二区视频在线| 亚洲av国产av综合av卡| 国产亚洲精品久久久com| 中国美白少妇内射xxxbb| 日韩中字成人| 97精品久久久久久久久久精品| 国产一区二区三区综合在线观看 | 亚洲三级黄色毛片| 深夜a级毛片| 亚洲国产最新在线播放| 国精品久久久久久国模美| 一级爰片在线观看| 久久精品国产自在天天线| 日本欧美国产在线视频| 色综合色国产| 成人漫画全彩无遮挡| 亚洲图色成人| av播播在线观看一区| videossex国产| 午夜视频国产福利| 国产伦精品一区二区三区视频9| 男人爽女人下面视频在线观看| 人妻一区二区av| 亚洲精品乱久久久久久| 婷婷色av中文字幕| 免费观看av网站的网址| 亚洲欧美日韩卡通动漫| 欧美变态另类bdsm刘玥| 成人国产麻豆网| 乱系列少妇在线播放| 国产精品一区二区三区四区免费观看| 91久久精品国产一区二区三区| 高清毛片免费看| 国产爱豆传媒在线观看| 国产成人免费无遮挡视频| 国产免费又黄又爽又色| 成人国产麻豆网| 狂野欧美激情性bbbbbb| h日本视频在线播放| 欧美国产精品一级二级三级 | 久久99热6这里只有精品| 成人亚洲欧美一区二区av| 搡老乐熟女国产| 尤物成人国产欧美一区二区三区| 精品人妻视频免费看| 免费观看的影片在线观看| 国产精品99久久久久久久久| 久久精品综合一区二区三区| tube8黄色片| 只有这里有精品99| 国产人妻一区二区三区在| 国产黄片美女视频| 观看美女的网站| 中文字幕久久专区| 一级毛片 在线播放| 欧美3d第一页| 亚洲欧美一区二区三区黑人 | 久久久久久久午夜电影| 亚洲在线观看片| 精华霜和精华液先用哪个| 久久久久精品性色| av福利片在线观看| 日日摸夜夜添夜夜爱| 日韩欧美一区视频在线观看 | 2021天堂中文幕一二区在线观| 春色校园在线视频观看| 久久女婷五月综合色啪小说 | 一级毛片aaaaaa免费看小| 亚洲av成人精品一二三区| 秋霞在线观看毛片| 国内少妇人妻偷人精品xxx网站| 在线观看免费高清a一片| 国产又色又爽无遮挡免| 久久久国产一区二区| 欧美成人午夜免费资源| 国产 一区精品| 国产片特级美女逼逼视频| 成人免费观看视频高清| 日本av手机在线免费观看| 在线观看一区二区三区激情| 亚洲第一区二区三区不卡| 亚洲av福利一区| 一二三四中文在线观看免费高清| 超碰97精品在线观看| 80岁老熟妇乱子伦牲交| 国产女主播在线喷水免费视频网站| 国产精品三级大全| 国产乱来视频区| 白带黄色成豆腐渣| 丰满人妻一区二区三区视频av| 亚洲国产色片| 国产午夜精品一二区理论片| 亚洲av中文av极速乱| 啦啦啦中文免费视频观看日本| 狠狠精品人妻久久久久久综合| 国产男女超爽视频在线观看| 我的女老师完整版在线观看| 老司机影院成人| 国产又色又爽无遮挡免| 亚洲精品成人久久久久久| 成人无遮挡网站| 男女无遮挡免费网站观看| 精品久久久久久久久亚洲| 在线免费观看不下载黄p国产| 插逼视频在线观看| 欧美zozozo另类| 小蜜桃在线观看免费完整版高清| 国产成人福利小说| 精品久久久噜噜| 亚洲欧洲国产日韩| 超碰97精品在线观看| 日韩人妻高清精品专区| 精品久久久精品久久久| 黄色日韩在线| 日本av手机在线免费观看| 可以在线观看毛片的网站| 成人国产av品久久久| 亚洲av日韩在线播放| 91久久精品国产一区二区成人| 在线播放无遮挡| 国产成人福利小说| 免费人成在线观看视频色| av免费在线看不卡| 日本三级黄在线观看| 97人妻精品一区二区三区麻豆| 久久人人爽人人片av| av在线蜜桃| 欧美日韩国产mv在线观看视频 | 日韩av在线免费看完整版不卡| 精品久久久精品久久久| 欧美区成人在线视频| 69av精品久久久久久| 麻豆成人av视频| 国产av不卡久久| 超碰97精品在线观看| 中文字幕亚洲精品专区| 麻豆成人午夜福利视频| 老师上课跳d突然被开到最大视频| 三级国产精品欧美在线观看| 777米奇影视久久| 性色av一级| 久久久久久久久久人人人人人人| 自拍欧美九色日韩亚洲蝌蚪91 | 啦啦啦啦在线视频资源| 亚洲av成人精品一区久久| 男女啪啪激烈高潮av片| 欧美激情在线99| 亚洲三级黄色毛片| 国产 一区精品| 国产亚洲精品久久久com| 中国美白少妇内射xxxbb| 国产成人免费观看mmmm| 性插视频无遮挡在线免费观看| 天堂网av新在线| 亚洲av欧美aⅴ国产| 国产成年人精品一区二区| 亚洲伊人久久精品综合| 日韩亚洲欧美综合| 久久精品国产亚洲av涩爱| 少妇人妻久久综合中文| 日韩 亚洲 欧美在线| 亚洲欧美日韩东京热| 啦啦啦在线观看免费高清www| 亚洲精品456在线播放app| 亚洲国产高清在线一区二区三| 国产精品精品国产色婷婷| 涩涩av久久男人的天堂| 欧美亚洲 丝袜 人妻 在线| 六月丁香七月| 久久这里有精品视频免费| 99热国产这里只有精品6| 人妻少妇偷人精品九色| 国产欧美亚洲国产| 午夜福利在线观看免费完整高清在| 人妻夜夜爽99麻豆av| 国产高清国产精品国产三级 | 国产欧美另类精品又又久久亚洲欧美| 嫩草影院精品99| a级毛色黄片| 一级毛片黄色毛片免费观看视频| 成人漫画全彩无遮挡| 免费黄频网站在线观看国产| 久久99精品国语久久久| videossex国产| 日韩成人伦理影院| 国产精品一及| 超碰97精品在线观看| av.在线天堂| 黄色怎么调成土黄色| 在线观看一区二区三区激情| 91aial.com中文字幕在线观看| 禁无遮挡网站| 日韩,欧美,国产一区二区三区| av又黄又爽大尺度在线免费看| 国产一级毛片在线| 欧美精品人与动牲交sv欧美| 王馨瑶露胸无遮挡在线观看| 熟女av电影| 啦啦啦在线观看免费高清www| 亚洲在线观看片| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 全区人妻精品视频| 好男人在线观看高清免费视频| 亚洲av日韩在线播放| 在线观看免费高清a一片| 另类亚洲欧美激情| 菩萨蛮人人尽说江南好唐韦庄| 亚洲最大成人手机在线| 80岁老熟妇乱子伦牲交| 国产精品久久久久久久电影| 亚洲综合色惰| 日韩亚洲欧美综合| 色综合色国产| av一本久久久久| 免费黄频网站在线观看国产| 国产精品无大码| 少妇 在线观看| 国产熟女欧美一区二区| 天美传媒精品一区二区| 欧美潮喷喷水| 九九久久精品国产亚洲av麻豆| 少妇熟女欧美另类| 成年女人看的毛片在线观看| 久久99热这里只频精品6学生| 国产淫语在线视频| 日本wwww免费看| a级毛色黄片| 欧美精品一区二区大全| 18禁裸乳无遮挡免费网站照片| 免费看光身美女| 2018国产大陆天天弄谢| 美女高潮的动态| 看免费成人av毛片| 人人妻人人看人人澡| 最新中文字幕久久久久| 亚洲高清免费不卡视频| 国产精品人妻久久久久久| 黑人高潮一二区| 中文字幕制服av| 亚洲av欧美aⅴ国产| 成人无遮挡网站| 久久鲁丝午夜福利片| 成人特级av手机在线观看| 国产 一区 欧美 日韩| 国产真实伦视频高清在线观看| 熟女人妻精品中文字幕| 在线天堂最新版资源| 亚洲aⅴ乱码一区二区在线播放| 免费看不卡的av| 国产欧美另类精品又又久久亚洲欧美| 狠狠精品人妻久久久久久综合| 一区二区三区精品91| 久久久久精品性色| 亚洲电影在线观看av| 免费观看无遮挡的男女| 最近中文字幕2019免费版| 色婷婷久久久亚洲欧美| 午夜福利在线在线| 亚洲国产成人一精品久久久| 免费电影在线观看免费观看| 99久久精品一区二区三区| 99九九线精品视频在线观看视频| 成年版毛片免费区| 国内精品宾馆在线| 国产黄色免费在线视频| 在线亚洲精品国产二区图片欧美 | 免费看日本二区| 草草在线视频免费看| 又黄又爽又刺激的免费视频.| 国产成人福利小说| 在线精品无人区一区二区三 | 亚洲精品一区蜜桃| 国产男女内射视频| 人妻一区二区av| 91精品伊人久久大香线蕉| 欧美日韩一区二区视频在线观看视频在线 | 精品人妻一区二区三区麻豆| 亚洲内射少妇av| 亚洲无线观看免费| 性插视频无遮挡在线免费观看| 成年女人看的毛片在线观看| 18禁在线播放成人免费| .国产精品久久| 国产精品嫩草影院av在线观看| 亚洲精品日韩在线中文字幕| 国产精品蜜桃在线观看| 18禁裸乳无遮挡动漫免费视频 | av国产精品久久久久影院| 在线a可以看的网站| 国产淫片久久久久久久久| 久久99精品国语久久久| 别揉我奶头 嗯啊视频| 大码成人一级视频| 久久亚洲国产成人精品v| 91久久精品国产一区二区成人| 免费观看av网站的网址| 午夜爱爱视频在线播放| 成人黄色视频免费在线看| 高清在线视频一区二区三区| 久久精品综合一区二区三区| 黄色一级大片看看| 色婷婷久久久亚洲欧美| 欧美日韩在线观看h| 亚洲av在线观看美女高潮| 777米奇影视久久| 久久亚洲国产成人精品v| 少妇猛男粗大的猛烈进出视频 | 狂野欧美白嫩少妇大欣赏| 深夜a级毛片| av在线app专区| 一级a做视频免费观看| 十八禁网站网址无遮挡 | 亚洲色图综合在线观看| 制服丝袜香蕉在线| 国产亚洲一区二区精品| 七月丁香在线播放| kizo精华| 欧美成人一区二区免费高清观看| 91久久精品电影网| 国产精品蜜桃在线观看| 国产男人的电影天堂91| 久久精品国产亚洲av涩爱| 亚洲综合精品二区| av在线观看视频网站免费| 直男gayav资源| 日本猛色少妇xxxxx猛交久久| 国产探花极品一区二区| 亚洲综合精品二区| 国产精品偷伦视频观看了| 如何舔出高潮| 99热国产这里只有精品6| 99热这里只有精品一区| 在线观看一区二区三区| 国产精品久久久久久久久免| 国产 一区精品| 极品教师在线视频| 少妇丰满av| 久久精品国产亚洲av天美| 亚洲伊人久久精品综合| 尤物成人国产欧美一区二区三区| 少妇人妻久久综合中文| 国产大屁股一区二区在线视频| 18禁裸乳无遮挡动漫免费视频 | 777米奇影视久久| 男人添女人高潮全过程视频| 九色成人免费人妻av| 国产在线男女| av一本久久久久| 日日摸夜夜添夜夜添av毛片| 美女xxoo啪啪120秒动态图| 内射极品少妇av片p| 日日摸夜夜添夜夜爱| 亚洲av二区三区四区| 午夜老司机福利剧场| 日本免费在线观看一区| 一区二区三区免费毛片| 日本免费在线观看一区| 在线 av 中文字幕| 国产永久视频网站| 人妻系列 视频| 亚洲精品日韩av片在线观看| 亚洲精品国产av蜜桃| 精品久久久久久电影网| 在线观看人妻少妇| 2018国产大陆天天弄谢| 男人添女人高潮全过程视频| 日本猛色少妇xxxxx猛交久久| 可以在线观看毛片的网站| 久久久久久久午夜电影| 久久久欧美国产精品| 舔av片在线| 久久精品国产亚洲av涩爱| 一二三四中文在线观看免费高清| 亚洲av二区三区四区| 一本久久精品| 三级国产精品欧美在线观看| 国产精品99久久99久久久不卡 | 22中文网久久字幕| 一级黄片播放器| 日韩欧美精品v在线| 国产欧美日韩一区二区三区在线 | 舔av片在线| 久久精品国产亚洲av涩爱| 欧美成人a在线观看| 国产高潮美女av| 亚洲美女搞黄在线观看| 亚洲最大成人av| 熟女电影av网| 免费看日本二区| 亚洲内射少妇av| 一个人看的www免费观看视频| 亚洲欧美日韩另类电影网站 | 一级毛片电影观看| 精品国产一区二区三区久久久樱花 | 亚洲最大成人av| 亚洲欧美日韩东京热| 色播亚洲综合网| 成人亚洲欧美一区二区av| 色婷婷久久久亚洲欧美| 欧美精品人与动牲交sv欧美| 狂野欧美激情性bbbbbb| 国产午夜精品久久久久久一区二区三区| 亚洲美女搞黄在线观看| 亚洲最大成人av| 欧美三级亚洲精品| 嘟嘟电影网在线观看| 精品久久国产蜜桃| 欧美日韩综合久久久久久| 亚洲成人一二三区av| 久久久国产一区二区| 波野结衣二区三区在线| 性色av一级| 国产av不卡久久| 久久女婷五月综合色啪小说 | 我的老师免费观看完整版| 欧美成人午夜免费资源| 99九九线精品视频在线观看视频| 国内精品美女久久久久久| 熟妇人妻不卡中文字幕| 国产精品精品国产色婷婷| 日本黄大片高清| 国产爽快片一区二区三区| 舔av片在线| 麻豆久久精品国产亚洲av| 九九爱精品视频在线观看| 国产高清国产精品国产三级 | 啦啦啦在线观看免费高清www| 国产白丝娇喘喷水9色精品| a级毛色黄片| 2018国产大陆天天弄谢| 亚洲成人av在线免费| 美女视频免费永久观看网站| 97在线视频观看| 免费观看在线日韩| 熟妇人妻不卡中文字幕| 国产精品女同一区二区软件| 亚洲av欧美aⅴ国产| 国产大屁股一区二区在线视频|