• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    古漢語大語言模型的構(gòu)建及應(yīng)用研究

    2024-01-01 00:00:00李紳胡韌奮王立軍
    語言戰(zhàn)略研究 2024年5期
    關(guān)鍵詞:人工智能

    關(guān)鍵詞 大語言模型;古漢語信息處理;人工智能

    中圖分類號H002 文獻(xiàn)標(biāo)識碼A 文章編號2096-1014(2024)05-0022-12

    DOI 10.19689/j.cnki.cn10-1361/h.20240502

    一、引言

    近年來,以GPT?4(OpenAI 2023)、LLAMA2(Touvron et al. 2023)為代表的通用大語言模型受到學(xué)界和公眾的廣泛關(guān)注(Zhao et al. 2023)。然而,通用大語言模型主要面向大眾用戶設(shè)計和研發(fā),其訓(xùn)練語料多來自互聯(lián)網(wǎng)公開數(shù)據(jù),其中包含的專業(yè)知識相對有限。例如,互聯(lián)網(wǎng)中的中文數(shù)據(jù),主要來自新聞網(wǎng)站、論壇等,這些數(shù)據(jù)幾乎均為現(xiàn)代漢語表述,這無疑限制了模型對古漢語的理解和處理能力。

    古漢語作為中華文化的傳承載體,其文本蘊含著豐富的語言文化知識。由于文言表達(dá)綿延千年,其文字、詞匯、語法、語音系統(tǒng)不斷發(fā)展,每個時期都產(chǎn)生了復(fù)雜的語言現(xiàn)象,給后人的閱讀理解帶來了諸多障礙。除了語言層面的問題,對古漢語文本的理解還需依賴文本之外的歷史文化常識——古人對人、事的指稱常有多種變體,且表述追求含蓄蘊藉,?;玫涔时磉_(dá)情感或思想。語言與文化的雙重挑戰(zhàn),不僅給現(xiàn)代人學(xué)習(xí)和閱讀文言文帶來了困難,也是當(dāng)前我國古籍整理工作和古漢語信息處理研究中的重難點所在。

    為了更好地輔助古籍整理、文言文教學(xué)和數(shù)字人文研究工作,我們構(gòu)建了一個專門適用于古漢語信息處理的大語言模型“AI 太炎”。本文將從模型設(shè)計、數(shù)據(jù)處理、基座訓(xùn)練及微調(diào)等方面介紹該模型的構(gòu)建方法,并結(jié)合案例探討其在古籍整理、辭書編纂、語言研究等領(lǐng)域的應(yīng)用。

    二、相關(guān)研究進展

    (一)古漢語信息處理技術(shù)研究

    近年來,面向古籍整理出版、文言文教學(xué)及數(shù)字人文研究的現(xiàn)實需求,古漢語信息處理技術(shù)研究日趨深入,涉及句讀標(biāo)點、分詞與詞性標(biāo)注、命名實體識別與關(guān)系抽取、詞義識別、文白翻譯等眾多任務(wù)。

    由于古籍文本一般不使用標(biāo)點符號,因此古籍整理過程中的一項重要工作是句讀標(biāo)點。據(jù)胡韌奮等(2021)統(tǒng)計,現(xiàn)有的古籍?dāng)?shù)據(jù)中,大部分尚未實現(xiàn)句讀,如殆知閣古代文獻(xiàn)藏書2.0版語料庫規(guī)模約33 億字,其中僅25% 左右的數(shù)據(jù)包含標(biāo)點,可見古籍整理是一項浩大的工程,自動句讀技術(shù)有強烈的現(xiàn)實需求。為了解決這一問題,研究者采用傳統(tǒng)機器學(xué)習(xí)模型(張開旭,等2009)、神經(jīng)網(wǎng)絡(luò)模型(王博立,等2017)、預(yù)訓(xùn)練語言模型(俞敬松,等2019 ;胡韌奮,等2021 ;袁義國,等2022)等方法取得了較好效果。

    如需利用計算機技術(shù)對大規(guī)模古籍文獻(xiàn)進行詞匯粒度研究,往往涉及古漢語分詞、詞性標(biāo)注、命名實體識別、詞義消歧等基礎(chǔ)性的中文信息處理任務(wù)。古漢語分詞經(jīng)歷了基于規(guī)則匹配的方法(邱冰,皇甫娟2008)、基于統(tǒng)計的方法(梁社會,陳小荷2013)以及基于機器學(xué)習(xí)與深度學(xué)習(xí)模型的方法(黃水清,等2015 ;程寧,等2020 ;Tang amp; Su 2022)3 個發(fā)展階段。詞性標(biāo)注和命名實體識別與其研究范式相近。為了實現(xiàn)詞義層面分析,舒蕾等(2022)構(gòu)建了百萬字規(guī)模的古漢語詞義標(biāo)注語料庫,并利用預(yù)訓(xùn)練古漢語語言模型構(gòu)建了詞義消歧算法。

    文白翻譯(文言文?白話文翻譯)是結(jié)合了古漢語諸多理解難點的綜合性任務(wù),同時具有輔助現(xiàn)代人閱讀和學(xué)習(xí)文言文的突出現(xiàn)實需求。Liu et al.(2019)構(gòu)建了基于Transformer 模型的文白翻譯系統(tǒng)。Guo et al.(2023)進一步提出利用雙音節(jié)詞對齊和雙掩碼Transformer 的文白翻譯模型,實現(xiàn)了超過Liu et al.(2019)模型的效果。

    綜上可以看出,神經(jīng)網(wǎng)絡(luò)模型及預(yù)訓(xùn)練語言模型方法在古漢語信息處理領(lǐng)域得到了較為廣泛的應(yīng)用。然而,這些方法對訓(xùn)練數(shù)據(jù)規(guī)模和質(zhì)量的要求較高。在古漢語信息處理場景中,很多任務(wù)具有“低資源”“富知識”的特點,這為相應(yīng)的語言資源建設(shè)和模型研究帶來了很大挑戰(zhàn)。已有研究發(fā)現(xiàn),采用數(shù)據(jù)增廣、聯(lián)合學(xué)習(xí)等機制能夠較好地緩解上述問題(李紳,等2023),而大語言模型的多任務(wù)、小樣本學(xué)習(xí)等能力十分突出,因此,構(gòu)建專門的古漢語大語言模型具有提升古漢語信息處理綜合能力的潛力。

    (二)專門領(lǐng)域大語言模型構(gòu)建研究

    為增強大語言模型的領(lǐng)域知識理解能力,檢索增強生成(Retrieval-augmented Generation,RAG)和領(lǐng)域模型構(gòu)建等方法應(yīng)運而生。其中,檢索增強生成無須調(diào)整模型參數(shù),主要采用向量檢索匹配的方法從外部知識庫或數(shù)據(jù)庫中獲取與當(dāng)前問題有關(guān)的領(lǐng)域知識,然后將當(dāng)前問題與檢索得到的結(jié)果組合后輸入大語言模型,令其在參考外部知識的前提下回答問題(Gao et al. 2023)。與檢索增強生成相比,構(gòu)建專門領(lǐng)域的大語言模型能夠更為系統(tǒng)地學(xué)習(xí)領(lǐng)域知識,從而為垂直領(lǐng)域應(yīng)用提供服務(wù),例如司法領(lǐng)域大語言模型ChatLaw(Cui et al. 2023)、醫(yī)療領(lǐng)域大語言模型medGPTa、科技文獻(xiàn)領(lǐng)域大語言模型“墨子”等。在古漢語領(lǐng)域,也有“荀子”、“九思”等大語言模型,旨在實現(xiàn)古籍文獻(xiàn)的分析處理。然而,上述專業(yè)領(lǐng)域大語言模型主要是通過對LLaMA、Qwen、Baichuan 等開源的通用領(lǐng)域大語言模型繼續(xù)訓(xùn)練或微調(diào)得到。Taylor et al.(2022)和Lehman et al.(2023)指出,對于專業(yè)領(lǐng)域的任務(wù)來說,使用專業(yè)領(lǐng)域數(shù)據(jù)訓(xùn)練的模型通常表現(xiàn)更好。因此,本研究旨在從頭構(gòu)建專門的古漢語大語言模型“AI 太炎”,使其可以較為充分地編碼古代漢語和文化知識。

    三、“AI 太炎”的設(shè)計

    (一)模型結(jié)構(gòu)

    參考最新的大語言模型架構(gòu),我們以Transformer 模型為基礎(chǔ),使用SwiGLU 激活函數(shù)(Shazeer2020),并采用ALiBi 位置編碼(Press et al. 2021)以應(yīng)對長文本的處理。為加速訓(xùn)練過程,我們引入了Flash Attention 機制(Dao 2022)。

    在模型參數(shù)量方面,主流開源的大語言模型多采用6 ~ 7B、13 ~ 14B、70B等設(shè)定??紤]到古漢語大語言模型旨在編碼專門領(lǐng)域知識,相應(yīng)的訓(xùn)練數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)小于通用的英文和現(xiàn)代漢語任務(wù),模型大小需要和數(shù)據(jù)規(guī)模相匹配,我們參照Hoff mann et al.(2022)提出的模型最優(yōu)結(jié)構(gòu)組合曲線,將模型設(shè)計為52 層(blocks),共1.8B(18 億)參數(shù)。近期,多項研究工作表明,經(jīng)過合理的設(shè)計和訓(xùn)練,小型大語言模型能夠兼顧效率和效果的平衡,如Gemma(2B)、MiniCPM(2.4B)等。

    (二)預(yù)訓(xùn)練任務(wù)與數(shù)據(jù)

    大語言模型的訓(xùn)練通常包括兩個階段:一是預(yù)訓(xùn)練階段,主要利用大規(guī)模無標(biāo)注文本訓(xùn)練基座語言模型,使模型具有較好的基礎(chǔ)語言能力;二是有監(jiān)督微調(diào)階段,需基于大量有標(biāo)注數(shù)據(jù)引導(dǎo)模型學(xué)習(xí)特定領(lǐng)域知識,完成多項具體任務(wù)。

    在預(yù)訓(xùn)練階段,模型主要通過預(yù)測下一個詞的任務(wù)來學(xué)習(xí)基礎(chǔ)語言知識。大語言模型屬于機器學(xué)習(xí)模型,即模型的參數(shù)權(quán)重大小是基于對訓(xùn)練數(shù)據(jù)的擬合而得到的,訓(xùn)練數(shù)據(jù)的規(guī)模、質(zhì)量和多樣性對模型的語言能力具有決定性影響。雖然古漢語大語言模型重在對古代漢語的理解和生成,但是其輸出結(jié)果多服務(wù)于當(dāng)代人的閱讀,比如文白翻譯任務(wù)需將古代文言文翻譯成現(xiàn)代白話文,因此基座語言模型需要兼具古代和現(xiàn)代漢語表達(dá)能力。此外,在古漢語信息處理技術(shù)的現(xiàn)實應(yīng)用中,簡體字和繁體字文本均有相應(yīng)需求。為此,在“AI太炎”的預(yù)訓(xùn)練階段,我們采集了約250億字的高質(zhì)量現(xiàn)代漢語文本和35億字的古代漢語文本作為預(yù)訓(xùn)練語料,簡體字和繁體字文本均占有一定比例。其中,現(xiàn)代漢語文本包括互聯(lián)網(wǎng)上的新聞、百科、論壇等數(shù)據(jù),古代漢語文本涵蓋了古詩詞、散文、小說等眾多體裁。

    (三)有監(jiān)督微調(diào)任務(wù)與數(shù)據(jù)

    在有監(jiān)督微調(diào)階段,我們希望“AI 太炎”能夠聚焦領(lǐng)域知識,解決領(lǐng)域問題,因此其不必在通用大語言模型擅長的聊天會話、開放域問答等任務(wù)上進行專門學(xué)習(xí),而應(yīng)該重點關(guān)注古漢語理解的難點。因此,在設(shè)計有監(jiān)督微調(diào)任務(wù)時,主要遵循以下兩條原則:第一,所選擇的任務(wù)應(yīng)能夠覆蓋字、詞、句、段等不同層級的語言知識,且能夠引導(dǎo)模型學(xué)習(xí)古代典籍中的經(jīng)典文化常識;第二,針對各任務(wù),能夠采集到高質(zhì)量且較大規(guī)模的標(biāo)注數(shù)據(jù)。據(jù)此,我們設(shè)計了4項微調(diào)任務(wù):句讀標(biāo)點、典故識別、詞語釋義和文白翻譯。具體示例見表1。

    通過搜集并改寫原始數(shù)據(jù),我們共采集到約30億字可供有監(jiān)督微調(diào)的訓(xùn)練數(shù)據(jù),其中句讀標(biāo)點任務(wù)約15億字,詞語釋義任務(wù)約6 億字,典故識別任務(wù)約0.5億字,文白翻譯任務(wù)約8億字。

    (四)模型訓(xùn)練

    Tang et al.(2024)指出,對數(shù)據(jù)的重復(fù)使用有助于提升語言模型的訓(xùn)練效果,因此,我們在訓(xùn)練“AI 太炎”時對數(shù)據(jù)進行了一定的重復(fù)采樣。依據(jù)Hoff mann et al.(2022)的經(jīng)驗曲線,給定1.8B參數(shù)量的模型,我們將其在預(yù)訓(xùn)練數(shù)據(jù)上訓(xùn)練了1000億字符,然后在有監(jiān)督數(shù)據(jù)上繼續(xù)微調(diào)訓(xùn)練了250億字符。模型的最大學(xué)習(xí)速率設(shè)為1e-4,之后以余弦的方式衰減(Loshchilov amp; Hutter 2016)。

    四、“AI 太炎”的評測結(jié)果

    本文針對4 項古漢語信息處理關(guān)鍵任務(wù)展開了開放評測。為了確保評測結(jié)果公平、客觀,所有評測集數(shù)據(jù)均采自中華經(jīng)典古籍庫等互聯(lián)網(wǎng)未開源的資源庫,以確保模型在預(yù)訓(xùn)練和微調(diào)階段均未見過測試數(shù)據(jù)。除了評測“AI 太炎”外,針對各項任務(wù),我們還分別引入多個已有模型及文史專業(yè)研究生作答結(jié)果作為對比基線。在通用大語言模型方面,我們選擇在各項通用評測中均表現(xiàn)優(yōu)秀的GPT–4模型,在4項任務(wù)上均對其進行了測試。在領(lǐng)域模型方面,我們引入基于通用開源模型微調(diào)得到的古漢語大語言模型“荀子”(Xunzi-Qwen-7B-CHAT),根據(jù)其說明文檔,在句讀標(biāo)點和文白翻譯任務(wù)上對其進行了評測。此外,在文白翻譯任務(wù)上,還引入百度翻譯中的“中文(文言文)?中文(簡體)”文白機器翻譯系統(tǒng)作為對比。最后,我們邀請多位文史專業(yè)研究生參與典故識別、詞語釋義和文白翻譯的人工評測。接下來,本節(jié)將對各項任務(wù)的具體評測方式和結(jié)果進行介紹。

    (一)句讀標(biāo)點任務(wù)

    對于句讀標(biāo)點任務(wù),我們從中華經(jīng)典古籍庫中隨機選取200段經(jīng)點校的古籍文本作為測試數(shù)據(jù),并用F1 值來評測各模型的表現(xiàn),結(jié)果如表2 所示。值得注意的是,現(xiàn)有大語言模型的一個突出問題是添加標(biāo)點時無法根據(jù)原文準(zhǔn)確輸出,常見改字、丟字和增字現(xiàn)象,無論如何編寫提示詞,依然存在此問題。在“荀子”的輸出結(jié)果中,20.5% 的樣本會出現(xiàn)原文錯誤,而GPT?4 輸出的樣本也有11% 會出現(xiàn)原文錯誤。與之相較,“AI 太炎”在解碼過程中針對句讀標(biāo)點任務(wù)進行了優(yōu)化,即限制模型輸出結(jié)果僅包括原文詞表和標(biāo)點符號,因此完全避免了輸出錯誤原文的問題。

    為了更好地評測標(biāo)點效果,我們在計算“荀子”和GPT?4的標(biāo)點效果時排除了輸出有誤的樣本,僅看其正常標(biāo)點的效果e。如表2 所示,在斷句和標(biāo)點任務(wù)上,“AI 太炎”具有明顯優(yōu)勢,尤其是斷句任務(wù)的F1 值接近97%,達(dá)到了較為實用的水平。

    (二)典故識別任務(wù)

    本文采用莫凱潔等(2024)構(gòu)建的數(shù)據(jù)集和評測方法,對各模型進行了用典判斷和具體典故識別評測。其中,用典判斷為二分類任務(wù),即判斷給定文本是否用典,以準(zhǔn)確率為評價指標(biāo);具體典故識別為多標(biāo)簽、多分類任務(wù),即判斷給定文本使用了哪些典故,以F1值為評價指標(biāo)。對比基線中,“人類基線”指的是專業(yè)標(biāo)注員在測試集中的平均分?jǐn)?shù),“"RAG”指引入基于外部典故知識庫的檢索增強生成機制。實驗結(jié)果如表3 所示,可見典故識別是一項挑戰(zhàn)性極高的任務(wù),不僅涉及文本語義理解,也需考查文化常識儲備,即使是中文專業(yè)的標(biāo)注人員也無法達(dá)到很高的精度。GPT?4 作為通用領(lǐng)域的大語言模型,在解決該類問題時表現(xiàn)欠佳,其中具體典故識別F1 不到10% ;引入外部知識庫做檢索增強后,效果得到顯著提升,但也僅有47%。與之相較,“AI 太炎”在用典判斷準(zhǔn)確率上超過了專業(yè)標(biāo)注員的平均水平,在具體典故識別任務(wù)上的表現(xiàn)接近人類基線。

    (三)詞語釋義任務(wù)

    考慮到詞語釋義任務(wù)在輔助古籍整理和文言文教學(xué)中的現(xiàn)實需求,我們從兩種來源采集該任務(wù)的測試集:(1)在中華經(jīng)典古籍庫中按照時間順序選取多個最新出版c 的古籍整理本,并隨機抽取出100條注釋數(shù)據(jù);(2)選取中學(xué)階段課外閱讀和考試相關(guān)文本d 中100條注釋數(shù)據(jù)。測試集數(shù)據(jù)共計200條,以下為兩則示例,需要解釋的詞語以【】標(biāo)記。

    (1)若鉛山諸邑所造柬紙,則全用細(xì)竹料厚質(zhì)蕩成,以【射】重價。最上者曰官柬,富貴之家,通刺用之,其紙敦厚而無筋膜。

    (2)其汞海、草汞之說,無端狂妄,【耳食】者信之。若水銀已升朱,則不可復(fù)還為汞,所謂造化之巧已盡也。

    實驗中,除了“AI 太炎”外,我們還引入GPT?4 和文史專業(yè)碩博研究生作答結(jié)果作為對比基線。研究生作答時不能查閱資料,僅依據(jù)對上下文的理解和自身語言知識儲備進行釋義??紤]到釋義可以有多樣化的表達(dá)方式,無法直接通過字符匹配計算準(zhǔn)確率,且古籍整理本和課外閱讀文本中的注釋參考答案不一定完全準(zhǔn)確,我們邀請兩名古代漢語專業(yè)研究生對模型和人的作答結(jié)果進行人工評估。為確保評估的公正性和可靠性,對于每條注釋,我們均提供3 組匿名且隨機排序的作答結(jié)果,以確保評估員不知道哪條結(jié)果出自哪個模型/ 人。同時,評估時會提供參考答案,并允許評估員查閱各種資料,對每條作答結(jié)果進行準(zhǔn)確評分:1 分,正確、精準(zhǔn),能夠幫助人的理解;0.5 分,接近,有部分問題或者不清楚之處;0 分,錯誤、離譜,會誤導(dǎo)他人。我們首先開展試評估與討論,以確保評估員對評分標(biāo)準(zhǔn)的理解一致,然后再進行正式評估。經(jīng)實驗,兩位評估員的整體評分一致性(Spearman 相關(guān)系數(shù))達(dá)到0.8842。

    詞語釋義的測試結(jié)果如表4 所示,其中“嚴(yán)格準(zhǔn)確率”指完全正確(得1 分)的比例,“準(zhǔn)確率”指完全正確與部分正確(得0.5 分)的比例之和。由表中結(jié)果可見,詞語釋義任務(wù)對于文史專業(yè)的碩博研究生來說仍然十分困難,而“AI 太炎”不僅遠(yuǎn)遠(yuǎn)超過GPT?4 和人類基線,而且準(zhǔn)確率達(dá)到80%以上,這意味著我們可以利用模型對文本中的重難點詞義進行初步判斷,以輔助人閱讀或整理古籍。同時,相關(guān)技術(shù)對于輔助辭書編纂和古漢語詞義研究也有一定應(yīng)用潛力。

    (四)文白翻譯任務(wù)

    文白翻譯作為綜合性的任務(wù),不僅需正確理解古漢語文本中的字、詞、句、段含義,還需要結(jié)合一定的背景文化知識,將文本的意義用合理、通順的現(xiàn)代漢語表達(dá)出來??紤]到文白翻譯的復(fù)雜性,我們除了采用傳統(tǒng)機器翻譯自動評測方法外,還引入了人工評估的方式。

    在自動評測階段,我們從中華經(jīng)典古籍庫中采樣了100 段帶有人工翻譯結(jié)果的文言文?白話文對照文本,每段長度從幾十到數(shù)百字不等,希望同時考查模型對短文本和長文本的翻譯水平。評測指標(biāo)為機器翻譯領(lǐng)域常見的BLEU 和CHRF 值,二者反映機器譯文和參考譯文的字符相似程度,數(shù)值越高表示翻譯效果越好。測試結(jié)果如表5 所示,在這兩項指標(biāo)上,“AI 太炎”均具有非常明顯的優(yōu)勢。

    在分析模型輸出結(jié)果時,我們發(fā)現(xiàn),雖然百度翻譯和GPT?4 的自動評測分值接近,但其翻譯策略有較大差別:百度翻譯常常出現(xiàn)照抄原文的現(xiàn)象,而GPT?4 傾向于給出比較詳細(xì)的解釋和譯文,但BLEU 和CHRF 的計算卻無法反映這種差異。為了更嚴(yán)謹(jǐn)、更準(zhǔn)確地評估翻譯質(zhì)量,我們采用與詞語釋義類似的方法開展人工評估。

    在人工評估階段,測試集同樣包括兩種來源:(1)在中華經(jīng)典古籍庫中按照時間順序選取多個最新出版的古籍整理本,抽取其中100 段文本作為測試集的一部分;(2)選取中學(xué)階段課外閱讀和考試相關(guān)文本中的100 段文本加入測試集。測試集數(shù)據(jù)共計200條,以下為兩則示例。

    (3)晉陵張公治信之明年,皇祐二年也,姦彊帖柔,隱詘發(fā)舒,既政大行,民以寧息。夏六月乙亥,大水。公徙囚於高獄,命百隸戒,不共有常誅。夜漏半,水破城,滅府寺,苞民廬居。公趨譙門,坐其下,敕吏士以桴收民,鰥孤老癃與所徙之囚,咸得不死。

    (4)順治二年乙酉四月,江都圍急。督相史忠烈公知勢不可為,集諸將而語之曰:“吾誓與城為殉,然倉皇中不可落于敵人之手以死,誰為我臨期成此大節(jié)者?”副將軍史德威慨然任之。忠烈喜曰:“吾尚未有子,汝當(dāng)以同姓為吾后。吾上書太夫人,譜汝諸孫中?!?/p>

    人工評估實驗中,我們選擇自動評測中表現(xiàn)較優(yōu)的百度翻譯和GPT?4 作為模型基線,并邀請9 位文史專業(yè)碩博研究生閉卷作答,將其結(jié)果列為人類基線。評估員為4 名古代漢語、古典文獻(xiàn)學(xué)和歷史學(xué)專業(yè)的博士研究生,評估方式和流程同詞義解釋任務(wù)。翻譯評分采用5 分制:5 分,錯誤極少,無關(guān)鍵性理解錯誤(包括關(guān)鍵實詞、名物、銜接、語法錯誤等),語義通順連貫,貼近原文,能夠很好地幫助人理解;4 分,錯誤很少,有1~2個關(guān)鍵錯誤,語義通順連貫,貼近原文,能夠輔助人的理解;3 分,錯誤較少,語義基本通順,連貫性有所欠缺,能夠在一定程度上輔助人的理解;2 分,錯誤較多,文意不通順,讓人產(chǎn)生理解困惑;1分,大片錯誤,語言基本不通,或完全誤導(dǎo)人的理解(有害的胡說八道)。經(jīng)實驗,4位評分員的整體評分一致性(Spearman 相關(guān)系數(shù))達(dá)到0.7548。

    人工評估實驗以大語言模型匿名對戰(zhàn)評測常用的“勝率”(Zhao et al. 2023)作為指標(biāo)報告結(jié)果,此處的“勝率”指各翻譯方法排名第一所占比例,評分相同則排名相同。從圖1 可以看出,與自動評測結(jié)果差異較大的是百度翻譯,雖然其自動評測結(jié)果與GPT?4 接近,但其真實譯文質(zhì)量與其他模型有很大差距,可見文白翻譯任務(wù)如果僅僅關(guān)注機器自動評測指標(biāo)不一定能得到可靠結(jié)果。綜合來看,在人工評估環(huán)節(jié)中,“AI 太炎”仍然具有明顯優(yōu)勢。

    五、“AI 太炎”的應(yīng)用探討

    由上節(jié)評測結(jié)果可見,“AI 太炎”在多項任務(wù)上較現(xiàn)有模型有明顯優(yōu)勢,且達(dá)到了接近或超過人類基線的水平??紤]到該模型具有較好的古籍文本分析能力,本節(jié)將進一步探討其在古籍整理、辭書編纂和語言研究等領(lǐng)域的應(yīng)用潛力。

    (一)輔助古籍整理

    古籍整理和出版過程中,往往需要專家根據(jù)出版需求開展標(biāo)點、注解、翻譯等工作,每項任務(wù)對于專家的知識和經(jīng)驗都有極高要求,因此,人力和時間成本極高。“AI 太炎”可以在各個流程中起到相應(yīng)的輔助作用,以提升古籍整理和出版的效率。此外,該模型還可接入數(shù)字化古籍應(yīng)用平臺,由用戶按需分析,獲取個性化注解內(nèi)容。

    在傳統(tǒng)的古籍整理出版流程中,對于句讀標(biāo)點環(huán)節(jié)來說,我們一方面可以運用“AI 太炎”的自動標(biāo)點技術(shù)進行文本預(yù)處理,再交由專家校對修改,以確保文本的可讀性和準(zhǔn)確性;另一方面,還可在修訂文稿的過程中由該模型進行文本后處理,找出文稿中可能存在的句讀標(biāo)點錯誤,提醒專家重點審訂。在古籍文本的注釋環(huán)節(jié),“AI 太炎”的詞語釋義功能可提供較高質(zhì)量的詞語解釋,即便自動生成的釋義有時不能完全滿足需求,編纂者也可借助其生成的文白翻譯結(jié)果作為參考。如此,編纂者便可快速采納或修改該模型提供的結(jié)果,以完成對關(guān)鍵詞語的注解。一般來說,整理本古籍很少給出白話文翻譯,這一方面是由于出版社默認(rèn)書籍受眾為專業(yè)人士,無須進行詳細(xì)注譯;另一方面是由于文白翻譯難度大,需要投入大量的人力和時間成本才能完成。如果利用“AI 太炎”的文白翻譯功能,只需由專家對譯文進行修改即可,就可大大降低工作量,讓不少整理本古籍有機會變成全譯本,從而服務(wù)于更多讀者。

    在數(shù)字化古籍的應(yīng)用中,不同讀者對文本內(nèi)容的困惑點各不相同,因此,提供個性化注解顯得尤為重要。此時,“AI 太炎”即時反饋的能力便凸顯出來,它可以根據(jù)讀者的需求實時提供字、詞、句、篇的白話文解釋,大大降低古籍文本閱讀難度,提升閱讀體驗。

    (二)輔助辭書編纂

    辭書編纂工作涉及古漢語詞匯的釋義和例句選擇,挑戰(zhàn)性極高且工作量巨大。利用“AI 太炎”對大規(guī)模數(shù)據(jù)進行詞義分析,對于辭書的編纂和修訂工作來說均有明顯助益。

    首先,給定關(guān)鍵詞之后,我們可以采集大規(guī)模包含關(guān)鍵詞的語料,利用“AI 太炎”對該詞在上下文中的含義進行標(biāo)注。由于結(jié)合上下文語境的詞義解釋具有較高的多樣性,我們可以進一步利用Jaro-Winkler(Winkler 1990)距離等方法對釋義進行聚類,并根據(jù)不同需求來調(diào)整聚類的精細(xì)程度。由此,聚類結(jié)果可以幫助專家確定詞義的使用頻率及其精確用例,從而更好地設(shè)置詞典中的義項及其順序。

    其次,現(xiàn)有辭書中時有因編纂者理解偏差而造成注解錯誤的情況,為辭書修訂工作帶來了較大困難。如以下兩則示例?!稘h語大詞典》中詞條“進利”,釋義為“仕進順利”,例句為:

    (5)曄少時,兄晏常云:“此兒進利,終破門戶?!苯K如晏言。

    此處對“進利”的解釋并不正確,依例句,應(yīng)為“貪利”。

    《漢語大詞典》的詞條“進資”,解釋為“給予費用”,例句為:

    (6)爾令行百里,運不絶道,使軍不乏而士益振,以迄有成,賞可後哉!進資一等,以示褒嘉。此處對“進資”的解釋同樣發(fā)生錯誤,依例句,應(yīng)表示官職提升,而非給予費用。

    “AI 太炎”將例(5)中的“此兒進利”注釋為“謂謀利求進”,將例(6)中的“進資一等”注釋為“謂官員再得升遷”,對兩句的翻譯如下:

    (5′)范曄小的時候,他哥哥范晏常說:“這孩子貪圖名利,終究會敗壞我們家族?!弊钺峁幌穹蛾趟f的那樣。

    (6′)你能使軍隊行軍百里而不斷絕運輸,保證軍隊供給不發(fā)生困難,士氣越來越振奮,終於獲得成功,這是值得慶賀的??!現(xiàn)在進升官階一級,以表示我的褒獎之意。

    可見,“AI 太炎”的注譯可以幫助編纂者疏通上下文的含義,避免理解偏誤。在辭書修訂的具體應(yīng)用過程中,我們可以利用該模型對辭書各條目的詞語結(jié)合其例句上下文進行解釋,或?qū)溥M行翻譯,然后將注譯結(jié)果與辭書給出的釋義進行自動比對,從而挖掘出不一致的地方,為修訂工作提供線索。

    (三)輔助語言研究

    與人相較,大語言模型的一個重要能力是可以快速對大量數(shù)據(jù)進行處理。除了標(biāo)記的速度和精度外,由于是同一個模型標(biāo)注,一致性也可以得到很好的保證。以詞義的大規(guī)模標(biāo)注為例,其標(biāo)注結(jié)果一方面可以輔助上文提及的辭書編纂,另一方面也可以輔助探究漢語的詞義演變問題。

    為開展相關(guān)研究,我們構(gòu)建了超過1 億字的古漢語歷時語料庫,按照時間先后順序分為:先秦、兩漢、魏晉南北朝、唐、宋、元、明、清。如前文所述,給定關(guān)鍵詞,我們可以從庫中獲取所有相關(guān)語料,要求該模型對關(guān)鍵詞的含義進行注釋,進而通過聚類獲取義項及其歷時頻率信息。圖2 給出“文章”和“消息”的示例,聚類后分別取每個詞語的兩個最高頻義項,呈現(xiàn)其歷時頻率變化情況。由圖中統(tǒng)計結(jié)果可見,“文章”始指花紋,從魏晉南北朝開始主要用于文學(xué)相關(guān)的含義;“消息”本指“消”和“息”,表示消散和生長,常用于指變化,自魏晉南北朝開始,“消息”主要指音訊。與現(xiàn)有的人工分析和自動分析方法(如舒蕾,等2022)相比,這種方法無須人工設(shè)計義項和標(biāo)注數(shù)據(jù),可以很方便地拓展到其他詞語上。如果我們據(jù)此對大批量詞語進行自動標(biāo)注分析,無疑將有助于系統(tǒng)地研究漢語詞義演變規(guī)律。

    六、總結(jié)與展望

    本研究針對古漢語信息處理任務(wù)“低資源”“富知識”的特點,提出從頭構(gòu)建古漢語大語言模型的方法。首先,從領(lǐng)域知識學(xué)習(xí)需求和數(shù)據(jù)現(xiàn)狀出發(fā),設(shè)計小型大語言模型結(jié)構(gòu)(52層、1.8B參數(shù)量);進一步,經(jīng)數(shù)據(jù)處理、基座訓(xùn)練及微調(diào),構(gòu)建“AI 太炎”古漢語大語言模型。該模型具有較強的古典文獻(xiàn)釋讀能力,支持句讀標(biāo)點、典故辨識、詞義解釋及文白翻譯等多種具有挑戰(zhàn)性的文言文理解任務(wù),兼容簡體字和繁體字文本。實驗顯示,與大型通用模型和其他領(lǐng)域模型相比,“AI 太炎”在多項評測任務(wù)上表現(xiàn)出明顯優(yōu)勢,且達(dá)到了接近或超過人類基線的水平。此外,本文還探討了該模型在輔助古籍整理、辭書編纂修訂和語言研究等工作上的應(yīng)用潛力。

    值得一提的是,本研究為高效構(gòu)建專門領(lǐng)域大語言模型提供了參考。由于通用領(lǐng)域大模型在垂直領(lǐng)域的任務(wù)上缺乏對專業(yè)知識的理解,構(gòu)建專門領(lǐng)域的大語言模型能夠更為系統(tǒng)地學(xué)習(xí)領(lǐng)域知識,從而為垂直領(lǐng)域應(yīng)用提供服務(wù)。在具體構(gòu)建專門領(lǐng)域模型時,并非簡單使用領(lǐng)域數(shù)據(jù)微調(diào)通用開源模型即可取得理想效果,而需特別注意如下幾方面的問題:第一,模型研發(fā)人員需和領(lǐng)域?qū)<彝f(xié)作以明確該領(lǐng)域的實際需求,并開展相應(yīng)任務(wù)設(shè)計,進而從實際問題出發(fā)來采集訓(xùn)練數(shù)據(jù)并標(biāo)注特定領(lǐng)域微調(diào)數(shù)據(jù),數(shù)據(jù)的規(guī)模、質(zhì)量和多樣性對模型的語言能力有重要影響;第二,需針對不同的專業(yè)任務(wù)估算出訓(xùn)練數(shù)據(jù)量和對應(yīng)的模型參數(shù)量,以提升訓(xùn)練效率和資源利用率;第三,在完成訓(xùn)練后需對模型的專業(yè)能力進行多輪測試評估,評測不僅是在事先劃定的測試集上報告實驗結(jié)果,還有必要邀請該領(lǐng)域?qū)I(yè)人員開展人工評估,專業(yè)人員對模型的評測和反饋是模型迭代中最有價值的信息源,因此評測工作有賴于模型研發(fā)人員和領(lǐng)域?qū)I(yè)人員的有效配合;第四,在應(yīng)用方面,專門領(lǐng)域大語言模型的應(yīng)用有別于通用大語言模型的對話聊天場景,將其集成到專門領(lǐng)域的平臺或工具中或能夠為該領(lǐng)域工作人員提供更為高效的服務(wù)。

    需要指出的是,當(dāng)前大語言模型處理的任務(wù)仍然有限,同時也會在一些問題上犯錯誤,給人帶來誤解。因此,現(xiàn)階段的模型應(yīng)用主要還是定位在輔助性角色上。未來,古漢語大語言模型仍有必要引入更多具有現(xiàn)實需求的任務(wù),并借助高質(zhì)量數(shù)據(jù)和改進的訓(xùn)練微調(diào)機制引導(dǎo)模型提升學(xué)習(xí)能力,使其能夠勝任更多的古漢語相關(guān)工作。

    猜你喜歡
    人工智能
    我校新增“人工智能”本科專業(yè)
    用“小AI”解決人工智能的“大”煩惱
    汽車零部件(2020年3期)2020-03-27 05:30:20
    當(dāng)人工智能遇見再制造
    2019:人工智能
    商界(2019年12期)2019-01-03 06:59:05
    AI人工智能解疑答問
    人工智能與就業(yè)
    基于人工智能的電力系統(tǒng)自動化控制
    人工智能,來了
    數(shù)讀人工智能
    小康(2017年16期)2017-06-07 09:00:59
    人工智能來了
    中文欧美无线码| 多毛熟女@视频| 国产精品久久久久久久电影| 人妻一区二区av| 精品一品国产午夜福利视频| 免费少妇av软件| 亚洲成人一二三区av| 女的被弄到高潮叫床怎么办| 国产爽快片一区二区三区| 成年av动漫网址| 在线观看人妻少妇| 亚洲美女搞黄在线观看| 99久久人妻综合| 蜜桃久久精品国产亚洲av| 一个人免费看片子| 国产高清三级在线| 在线亚洲精品国产二区图片欧美 | 亚洲美女搞黄在线观看| 九九爱精品视频在线观看| 亚洲精品乱码久久久v下载方式| 亚洲国产成人一精品久久久| 熟妇人妻不卡中文字幕| 久久久国产欧美日韩av| 乱码一卡2卡4卡精品| 精品亚洲乱码少妇综合久久| 中文字幕制服av| 丝瓜视频免费看黄片| 高清毛片免费看| 高清在线视频一区二区三区| av黄色大香蕉| 新久久久久国产一级毛片| av在线老鸭窝| 女的被弄到高潮叫床怎么办| 老熟女久久久| 丝袜喷水一区| 日韩一区二区视频免费看| 在线观看免费视频网站a站| av专区在线播放| 日韩电影二区| 国产成人午夜福利电影在线观看| 男女无遮挡免费网站观看| 国产精品国产av在线观看| 在线播放无遮挡| 中国美白少妇内射xxxbb| 人体艺术视频欧美日本| 女人久久www免费人成看片| 你懂的网址亚洲精品在线观看| 纵有疾风起免费观看全集完整版| 亚洲av中文av极速乱| 91午夜精品亚洲一区二区三区| 亚洲激情五月婷婷啪啪| 五月伊人婷婷丁香| 国产成人免费观看mmmm| 日本猛色少妇xxxxx猛交久久| 黑人猛操日本美女一级片| 青青草视频在线视频观看| av卡一久久| 亚洲欧美精品自产自拍| 国产精品99久久久久久久久| 女人久久www免费人成看片| 插逼视频在线观看| 老司机影院毛片| 成人毛片a级毛片在线播放| 亚洲精品久久久久久婷婷小说| 国产精品无大码| 男人操女人黄网站| 看非洲黑人一级黄片| av免费在线看不卡| 自拍欧美九色日韩亚洲蝌蚪91| 午夜久久久在线观看| 天美传媒精品一区二区| 久久韩国三级中文字幕| 能在线免费看毛片的网站| 亚洲欧美清纯卡通| 久久久久精品性色| 久久人人爽人人片av| 特大巨黑吊av在线直播| 99久久人妻综合| 美女中出高潮动态图| 两个人免费观看高清视频| 高清视频免费观看一区二区| 伦理电影大哥的女人| 国产精品久久久久久久电影| 中文天堂在线官网| 最新的欧美精品一区二区| 欧美bdsm另类| 自拍欧美九色日韩亚洲蝌蚪91| 久久综合国产亚洲精品| 大片免费播放器 马上看| 国产片特级美女逼逼视频| 国产乱来视频区| 国产在线一区二区三区精| 少妇精品久久久久久久| 精品人妻在线不人妻| 亚洲精华国产精华液的使用体验| 国产精品99久久久久久久久| 亚洲经典国产精华液单| 欧美xxⅹ黑人| 成人手机av| 久久精品国产自在天天线| 女人精品久久久久毛片| √禁漫天堂资源中文www| 欧美日韩视频高清一区二区三区二| 热re99久久国产66热| a级毛片黄视频| 韩国av在线不卡| 亚洲精品国产av蜜桃| 国产亚洲精品第一综合不卡 | 如何舔出高潮| 内地一区二区视频在线| 一个人免费看片子| 日日摸夜夜添夜夜添av毛片| 久久女婷五月综合色啪小说| 伊人亚洲综合成人网| 久久精品国产自在天天线| 久久人人爽人人爽人人片va| 人人妻人人添人人爽欧美一区卜| 大片免费播放器 马上看| 欧美xxxx性猛交bbbb| 免费黄网站久久成人精品| 亚洲三级黄色毛片| 亚洲国产日韩一区二区| 中文字幕人妻丝袜制服| 亚洲精品,欧美精品| 婷婷色综合大香蕉| 色婷婷av一区二区三区视频| 日本猛色少妇xxxxx猛交久久| 精品少妇久久久久久888优播| 99久久综合免费| 少妇熟女欧美另类| 高清毛片免费看| 99久久精品一区二区三区| 人妻制服诱惑在线中文字幕| 亚洲国产精品一区二区三区在线| 欧美亚洲 丝袜 人妻 在线| 一区二区三区精品91| 成人毛片a级毛片在线播放| 人成视频在线观看免费观看| 大陆偷拍与自拍| 婷婷色麻豆天堂久久| 各种免费的搞黄视频| 精品少妇久久久久久888优播| 99久久精品国产国产毛片| 热re99久久精品国产66热6| 国产高清三级在线| 国产欧美亚洲国产| 久久久久久久久久久久大奶| 精品久久久久久久久亚洲| 五月玫瑰六月丁香| 91在线精品国自产拍蜜月| 色婷婷久久久亚洲欧美| 欧美成人精品欧美一级黄| 国产高清三级在线| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 欧美人与性动交α欧美精品济南到 | 午夜日本视频在线| 草草在线视频免费看| 亚洲精品国产色婷婷电影| 精品久久久精品久久久| 日本黄色片子视频| 最近中文字幕高清免费大全6| 能在线免费看毛片的网站| 99热全是精品| 涩涩av久久男人的天堂| 99国产精品免费福利视频| 在线看a的网站| 少妇人妻 视频| 狂野欧美激情性xxxx在线观看| 嫩草影院入口| 久久精品久久久久久久性| 午夜影院在线不卡| 五月开心婷婷网| 久久久亚洲精品成人影院| 桃花免费在线播放| 欧美日韩视频高清一区二区三区二| 春色校园在线视频观看| 三级国产精品片| 亚洲欧美色中文字幕在线| 久久精品国产亚洲av涩爱| 欧美日韩一区二区视频在线观看视频在线| 日本av免费视频播放| 日本猛色少妇xxxxx猛交久久| 国产免费一区二区三区四区乱码| 久久99热6这里只有精品| 一个人免费看片子| 国产成人精品福利久久| 日产精品乱码卡一卡2卡三| 一本色道久久久久久精品综合| 一区二区三区四区激情视频| 国产日韩欧美视频二区| 免费黄频网站在线观看国产| 国产精品一区二区三区四区免费观看| 成人毛片a级毛片在线播放| 97超视频在线观看视频| 热re99久久国产66热| 国产日韩欧美视频二区| 精品视频人人做人人爽| 久久久久久久久久久免费av| 91aial.com中文字幕在线观看| 久久久国产一区二区| 国模一区二区三区四区视频| 日韩亚洲欧美综合| 久久青草综合色| 黄色欧美视频在线观看| 超色免费av| 91久久精品国产一区二区三区| 免费少妇av软件| 99久久精品一区二区三区| 全区人妻精品视频| 久久精品久久久久久噜噜老黄| 国产片内射在线| 男人爽女人下面视频在线观看| 一个人免费看片子| 亚洲成色77777| 国产一区二区在线观看日韩| 久久人人爽av亚洲精品天堂| 国产日韩欧美视频二区| 蜜桃在线观看..| 亚洲国产精品一区二区三区在线| 免费大片黄手机在线观看| 久久久久久久久久久久大奶| 亚洲国产欧美在线一区| 大片免费播放器 马上看| 飞空精品影院首页| kizo精华| 中文天堂在线官网| 各种免费的搞黄视频| 王馨瑶露胸无遮挡在线观看| 亚洲av综合色区一区| 两个人免费观看高清视频| 免费观看av网站的网址| 看非洲黑人一级黄片| 一级二级三级毛片免费看| 国内精品宾馆在线| 亚洲国产成人一精品久久久| 久久毛片免费看一区二区三区| 日本-黄色视频高清免费观看| 成人国产麻豆网| 黑人欧美特级aaaaaa片| 女性被躁到高潮视频| 亚洲少妇的诱惑av| 看十八女毛片水多多多| 国产精品成人在线| 国产精品欧美亚洲77777| 亚洲欧美清纯卡通| 新久久久久国产一级毛片| www.av在线官网国产| 22中文网久久字幕| 99久久中文字幕三级久久日本| 午夜福利影视在线免费观看| 亚洲不卡免费看| 久久久久国产网址| 欧美精品一区二区免费开放| 国产亚洲午夜精品一区二区久久| 大香蕉97超碰在线| 蜜桃久久精品国产亚洲av| 99国产精品免费福利视频| 国产精品成人在线| 搡老乐熟女国产| 亚洲欧美一区二区三区国产| 国产日韩欧美在线精品| 色网站视频免费| 最新中文字幕久久久久| 18禁在线播放成人免费| 黄色视频在线播放观看不卡| videos熟女内射| 岛国毛片在线播放| 五月伊人婷婷丁香| √禁漫天堂资源中文www| 欧美日韩av久久| 日韩电影二区| 亚洲av欧美aⅴ国产| 777米奇影视久久| 2021少妇久久久久久久久久久| 久久精品国产自在天天线| 成人国产av品久久久| 亚洲一级一片aⅴ在线观看| 大香蕉97超碰在线| 日韩一区二区视频免费看| 午夜日本视频在线| 久久青草综合色| 自线自在国产av| 精品国产露脸久久av麻豆| 各种免费的搞黄视频| a 毛片基地| 精品人妻熟女毛片av久久网站| 日本vs欧美在线观看视频| 亚洲欧美一区二区三区国产| 亚洲av欧美aⅴ国产| 成人无遮挡网站| 亚洲国产成人一精品久久久| 边亲边吃奶的免费视频| 老司机影院成人| 欧美日韩综合久久久久久| 搡老乐熟女国产| 免费少妇av软件| 亚洲欧美成人综合另类久久久| 性色av一级| 久久人妻熟女aⅴ| 好男人视频免费观看在线| 亚洲精品美女久久av网站| 一级毛片电影观看| 亚洲人成网站在线观看播放| 有码 亚洲区| 老女人水多毛片| 亚洲av成人精品一二三区| 超碰97精品在线观看| 日韩av在线免费看完整版不卡| 老司机影院成人| 精品国产露脸久久av麻豆| 少妇猛男粗大的猛烈进出视频| 国产精品99久久久久久久久| 在线观看美女被高潮喷水网站| 少妇的逼水好多| 日韩av免费高清视频| 国产高清三级在线| 各种免费的搞黄视频| 国产乱人偷精品视频| 99热国产这里只有精品6| 欧美丝袜亚洲另类| 制服诱惑二区| 丝袜在线中文字幕| 国产熟女午夜一区二区三区 | 日本wwww免费看| 久久久久久久大尺度免费视频| 日产精品乱码卡一卡2卡三| 国产精品99久久99久久久不卡 | 在线观看www视频免费| 亚洲av中文av极速乱| 精品人妻熟女av久视频| 男女边摸边吃奶| 黄色视频在线播放观看不卡| 国产精品 国内视频| 中文乱码字字幕精品一区二区三区| 九九在线视频观看精品| 能在线免费看毛片的网站| 久久鲁丝午夜福利片| 精品久久久久久久久av| 秋霞伦理黄片| 欧美少妇被猛烈插入视频| 秋霞伦理黄片| 亚洲精品国产色婷婷电影| av网站免费在线观看视频| 午夜老司机福利剧场| 人人妻人人澡人人爽人人夜夜| 啦啦啦视频在线资源免费观看| 精品少妇黑人巨大在线播放| 一区二区三区四区激情视频| 日韩熟女老妇一区二区性免费视频| 国精品久久久久久国模美| 国产在线视频一区二区| 国产免费视频播放在线视频| 看十八女毛片水多多多| 午夜91福利影院| 欧美最新免费一区二区三区| av电影中文网址| 精品国产露脸久久av麻豆| videossex国产| 性高湖久久久久久久久免费观看| 久久午夜福利片| 黑丝袜美女国产一区| av国产久精品久网站免费入址| 国产精品.久久久| 国精品久久久久久国模美| 看免费成人av毛片| 99久久综合免费| 国产免费现黄频在线看| 一区二区三区乱码不卡18| 色网站视频免费| 精品久久久精品久久久| 国产成人精品久久久久久| 老司机亚洲免费影院| 久久人妻熟女aⅴ| 亚洲av免费高清在线观看| 国产免费福利视频在线观看| 熟女人妻精品中文字幕| 欧美日韩成人在线一区二区| 亚洲av综合色区一区| 亚洲精品日韩av片在线观看| 三上悠亚av全集在线观看| 国产极品粉嫩免费观看在线 | 亚洲美女黄色视频免费看| 亚洲成人一二三区av| 欧美日韩视频精品一区| 九九爱精品视频在线观看| 日本wwww免费看| 欧美成人精品欧美一级黄| 永久免费av网站大全| 午夜福利影视在线免费观看| 两个人的视频大全免费| 能在线免费看毛片的网站| 麻豆成人av视频| 9色porny在线观看| 国产精品一区二区三区四区免费观看| videossex国产| 国产有黄有色有爽视频| 亚洲精品日本国产第一区| 亚洲精品aⅴ在线观看| 精品人妻熟女av久视频| 国产精品成人在线| 狠狠精品人妻久久久久久综合| av福利片在线| 国产亚洲精品第一综合不卡 | 亚洲国产精品成人久久小说| 2022亚洲国产成人精品| 女的被弄到高潮叫床怎么办| 亚洲综合色惰| 国产精品麻豆人妻色哟哟久久| 国产国拍精品亚洲av在线观看| 国产av一区二区精品久久| 国产日韩一区二区三区精品不卡 | 国产精品欧美亚洲77777| 国产又色又爽无遮挡免| 国产黄片视频在线免费观看| 亚洲成人av在线免费| 国产精品久久久久成人av| 亚洲国产精品一区二区三区在线| 一级黄片播放器| 日本av免费视频播放| 在线亚洲精品国产二区图片欧美 | 99久久精品一区二区三区| 搡老乐熟女国产| 一个人看视频在线观看www免费| 中文字幕av电影在线播放| 国产高清不卡午夜福利| 女性被躁到高潮视频| 亚洲精品乱码久久久久久按摩| 三级国产精品片| 精品久久久久久久久亚洲| 亚洲国产精品国产精品| 国产亚洲欧美精品永久| 色5月婷婷丁香| 久久 成人 亚洲| 大陆偷拍与自拍| 欧美 亚洲 国产 日韩一| 久久久久久久久久久久大奶| 成人二区视频| 亚洲av男天堂| 秋霞伦理黄片| 天美传媒精品一区二区| 最近中文字幕2019免费版| 在线 av 中文字幕| 成人手机av| 欧美成人午夜免费资源| 久久人人爽人人爽人人片va| 国产毛片在线视频| 一级,二级,三级黄色视频| 国产无遮挡羞羞视频在线观看| 最新中文字幕久久久久| 亚洲第一av免费看| 成人漫画全彩无遮挡| av有码第一页| 日韩亚洲欧美综合| 亚洲精品日韩在线中文字幕| 亚洲国产成人一精品久久久| 黑人高潮一二区| 国产精品国产av在线观看| 免费观看性生交大片5| 免费高清在线观看日韩| 精品人妻熟女av久视频| 国产熟女午夜一区二区三区 | 久久青草综合色| 免费看光身美女| 丰满少妇做爰视频| 交换朋友夫妻互换小说| 在线观看www视频免费| 草草在线视频免费看| 日韩视频在线欧美| 黑人欧美特级aaaaaa片| 色网站视频免费| 下体分泌物呈黄色| 欧美人与性动交α欧美精品济南到 | 97超视频在线观看视频| 97超碰精品成人国产| 黄色毛片三级朝国网站| 成人毛片60女人毛片免费| 韩国av在线不卡| 日韩精品有码人妻一区| 久久狼人影院| 天美传媒精品一区二区| 中文字幕人妻丝袜制服| 建设人人有责人人尽责人人享有的| 26uuu在线亚洲综合色| 国产成人精品一,二区| 成人影院久久| 夫妻性生交免费视频一级片| 水蜜桃什么品种好| 欧美bdsm另类| 成年女人在线观看亚洲视频| av在线播放精品| 日本-黄色视频高清免费观看| 日韩一区二区三区影片| 少妇人妻久久综合中文| 少妇的逼水好多| 91久久精品国产一区二区成人| 男女免费视频国产| 国产无遮挡羞羞视频在线观看| 亚洲国产精品专区欧美| 一级毛片aaaaaa免费看小| 在线观看美女被高潮喷水网站| 国产av精品麻豆| 午夜激情福利司机影院| 亚洲国产av影院在线观看| 久久这里有精品视频免费| 国产av国产精品国产| 亚洲av日韩在线播放| 另类精品久久| 各种免费的搞黄视频| 中国美白少妇内射xxxbb| 亚洲高清免费不卡视频| 午夜日本视频在线| 国产乱人偷精品视频| av一本久久久久| 大香蕉久久网| 简卡轻食公司| 99热国产这里只有精品6| 青春草视频在线免费观看| 久久99热这里只频精品6学生| 日本-黄色视频高清免费观看| 性色av一级| 最近最新中文字幕免费大全7| 久久久欧美国产精品| 精品卡一卡二卡四卡免费| 国产永久视频网站| 中文字幕免费在线视频6| 中文精品一卡2卡3卡4更新| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 少妇人妻 视频| 午夜免费观看性视频| 久久 成人 亚洲| av网站免费在线观看视频| 午夜精品国产一区二区电影| 国产亚洲午夜精品一区二区久久| 久久久国产精品麻豆| 人妻少妇偷人精品九色| 亚洲美女视频黄频| 热99久久久久精品小说推荐| 午夜91福利影院| 超色免费av| 日本91视频免费播放| 中国国产av一级| 全区人妻精品视频| 蜜桃国产av成人99| 中文精品一卡2卡3卡4更新| 亚洲国产日韩一区二区| 国产精品一区www在线观看| 视频区图区小说| 精品人妻在线不人妻| 大片免费播放器 马上看| 国产黄色免费在线视频| 国产亚洲av片在线观看秒播厂| 黑人欧美特级aaaaaa片| 寂寞人妻少妇视频99o| 嘟嘟电影网在线观看| 2018国产大陆天天弄谢| 国产白丝娇喘喷水9色精品| 亚洲欧美一区二区三区国产| 日本vs欧美在线观看视频| 中国美白少妇内射xxxbb| 免费观看的影片在线观看| 男人操女人黄网站| 亚洲丝袜综合中文字幕| 国产成人a∨麻豆精品| 一级,二级,三级黄色视频| 十八禁高潮呻吟视频| 成人18禁高潮啪啪吃奶动态图 | 美女内射精品一级片tv| 免费高清在线观看视频在线观看| 国产色爽女视频免费观看| 最近中文字幕高清免费大全6| 中文天堂在线官网| 久久久久久久久久久丰满| 搡老乐熟女国产| 成年美女黄网站色视频大全免费 | 中文精品一卡2卡3卡4更新| 大香蕉久久网| 亚洲精品第二区| 亚洲精品乱久久久久久| 欧美日本中文国产一区发布| 日韩 亚洲 欧美在线| 国产成人免费观看mmmm| 国产探花极品一区二区| 黄色视频在线播放观看不卡| 久久久久久伊人网av| 99国产精品免费福利视频| 国产精品一区www在线观看| 精品久久久久久电影网| 伦精品一区二区三区| 久久久久网色| 亚洲怡红院男人天堂| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 亚洲精品乱久久久久久| 国产欧美亚洲国产| 一级黄片播放器| av又黄又爽大尺度在线免费看| 女人久久www免费人成看片| 麻豆乱淫一区二区| 777米奇影视久久| 久久久国产精品麻豆| 国产亚洲一区二区精品| 高清av免费在线| 大陆偷拍与自拍| 飞空精品影院首页| 精品一区在线观看国产| 永久网站在线| 久久精品国产亚洲av天美| 青春草亚洲视频在线观看| 满18在线观看网站| 黑人巨大精品欧美一区二区蜜桃 | 999精品在线视频| √禁漫天堂资源中文www| 国产有黄有色有爽视频| 亚洲精品国产av蜜桃| 丰满迷人的少妇在线观看| 交换朋友夫妻互换小说|