隨著人工智能在各行各業(yè)的應(yīng)用,Al已從流行熱詞轉(zhuǎn)變?yōu)樘岣咝实挠埠斯ぞ?。在出版領(lǐng)域,Al生產(chǎn)力滲透到出版各環(huán)節(jié),顯著提高了工作效率。其中,Al審校工具通過不同算法和功能,幫助編輯人員在人工審校后進(jìn)一步校對,提高內(nèi)容質(zhì)量。然而,Al審校工具在深層語義理解、語料更新速度等方面存在局限。Al審校系統(tǒng)需要不斷優(yōu)化算法,提高對語言細(xì)節(jié)的理解能力,并實(shí)現(xiàn)語料的動態(tài)更新。建立用戶自定義機(jī)制,讓編輯和審校人員參與系統(tǒng)的訓(xùn)練,有助于推動AI審校系統(tǒng)向更智能的方向發(fā)展。
智能時代的生產(chǎn)力進(jìn)階
在傳統(tǒng)的期刊出版工作中,編輯加工、內(nèi)容審校是整個出版流程中最為耗時、耗力的環(huán)節(jié)。在“多出善本,不出錯本”的職業(yè)追求下,消除謬誤、確保正確是內(nèi)容生產(chǎn)的底線和基本要求。然而,即使編校人員不遺余力地悉心梳理和精心校對,受人類精力和注意力的局限以及各不相同的知識盲區(qū)可能導(dǎo)致的遺漏仍然存在,編輯加工審校工作仍然面臨著挑戰(zhàn)。
AI審校的不斷發(fā)展為編校工作帶來了越來越強(qiáng)的補(bǔ)位作用。人工審校之后,再用AI審查一遍,能夠在一定程度上消除可能遺漏的差錯。
當(dāng)前,在編輯工作中應(yīng)用的AI審校工具主要分為以下三類。
一是傳統(tǒng)的研發(fā)型的智能審校軟件。其中“黑馬校對”軟件是編輯工作中應(yīng)用最多的智能審校軟件。其擁有1萬億字的語料信息,能依靠語言模型進(jìn)行漢語依存關(guān)系分析,采用先進(jìn)的技術(shù)如高倍信息壓縮、快速檢索等,校對出政治性問題、錯別字、詞語搭配、語法語義、異形詞、繁體字等錯誤。除了“黑馬校對”軟件,國內(nèi)出版行業(yè)應(yīng)用得較多的主流智能審校軟件還有北大方正電子有限公司研發(fā)的“方正智能輔助審校系統(tǒng)”,該系統(tǒng)累積的錯詞、專業(yè)術(shù)語、敏感詞等編校知識詞條超過百萬,依托大規(guī)模語料庫進(jìn)行訓(xùn)練學(xué)習(xí),可提供字詞檢查、標(biāo)點(diǎn)符號檢查、文章邏輯檢查、上下文查重、專業(yè)術(shù)語檢查、敏感詞檢查等多角度內(nèi)容審校。
二是常用軟件自帶的智能審校插件。如:Word軟件內(nèi)置“方正智能輔助審校系統(tǒng)”的插件,實(shí)現(xiàn)智能審校功能,可以幫助用戶進(jìn)行文本校對;WPSOffice內(nèi)置了“金山黑馬校對”功能,提供智能校對服務(wù),不僅校對速度快,而且查錯率高。編輯文稿點(diǎn)擊“文檔校對”,能夠檢查出許多常見的錯誤。發(fā)廠付印之前的檢查,在人工查對之外,也可以將即將進(jìn)廠的PDF文檔轉(zhuǎn)換成Word格式,再次進(jìn)行掃描,防止出現(xiàn)“漏網(wǎng)之魚”。
三是主流AI工具。編校人員對AI的應(yīng)用往往集中在信息搜集、靈感尋找等方面,主流AI工具都可以作為審校工具,如百度的“文心一言”、阿里云的“通義千問”、騰訊研發(fā)的“混元助手”、360公司的“AI智腦”等。當(dāng)需要校對一段文字時,編輯人員只需要輸入指令“請校對以下文字”,并將需要校對的文本復(fù)制粘貼,一份有理有據(jù)的審校報告馬上就出現(xiàn)在眼前。與需要購買的傳統(tǒng)審校軟件及要充值成為會員才能使用的智能審校插件相比,這些主流AI工具的審校功能基本不需要額外支付費(fèi)用。
在人工審校面對的精力與注意力局限之下,智能審校工具在出版各個環(huán)節(jié)展現(xiàn)了卓越的專業(yè)能量,為編校人員提供了不可多得的助力。
AI審校的應(yīng)用與比較
AI審校給編輯人員帶來許多非常實(shí)際的幫助,但是,不同的AI審校工具審校效果也不同,選取幾種常用的審校工具進(jìn)行對比如下:傳統(tǒng)研發(fā)型智能審校軟件“黑馬校對”,常用軟件審校插件WPS內(nèi)置校對工具,主流AI工具“文心一言”、“通義千問”及Kimi。
例文:七月流火的天氣,下水游泳成人們的一大愛好?!安凰阶韵滤斡?,不擅自與他人結(jié)伴游泳..”為進(jìn)一步做好校園防溺水安全教育,7月1日上午學(xué)校在校運(yùn)動場舉行2024年防溺水安全演練,旨在提高學(xué)生們的防溺水意識和自救互救能力。本次防溺水教育以“理論+實(shí)操”的方式開展。演練前,學(xué)校相關(guān)負(fù)責(zé)人給全體同學(xué)們帶來了一堂主題為“珍愛生命,預(yù)防溺水”的防弱水專題課給同學(xué)們講解了防溺水“七不兩會”、預(yù)防溺水的措施、溺水時的自救方法、發(fā)現(xiàn)有人溺水時的救護(hù)方法等相關(guān)知識。會上有同學(xué)提供了很多的防滋水技巧,這值得其他人效尤。
首先來看“黑馬校對”的結(jié)果:
1.疑錯:實(shí)操(建議:軍操)
原句:本次防滋水教育以“理論+實(shí)操”的方式開展
2.錯詞:全體同學(xué)們(建議:全體同學(xué))
原句:學(xué)校相關(guān)負(fù)責(zé)人給全體同學(xué)們帶來了
3.疑錯:滋
原句:有同學(xué)提供了很多的防滋水再看校對插件代表WPS的效果:
1.成→成為 2 3., 4.提高→增強(qiáng)
5.全體同學(xué)們→全體同學(xué)6.弱→溺
7., 8. 9.滋水→水
最后是主流AI工具的校對結(jié)果:
“文心一言”梳理了部分標(biāo)點(diǎn)錯誤,并對語句進(jìn)行了梳理。主要修改點(diǎn)如下。
1.“防弱水專題課”修改為“防溺水專題課”,以與后文的“防溺水”保持一致性。
2.“防滋水技巧”修改為“防溺水技巧”,與上下文保持一致性。
3“值得其他人效尤”修改為“值得其他人學(xué)\",以使用更釈極和正面的表述。
“通義千問”也對文段進(jìn)行了梳理,并改正了部分半角標(biāo)點(diǎn)。其改動說明如下。
1.將“防弱水”修正為“防溺水”,因“弱水”與原文意不符。
2.改防滋水技巧”為“防溺水技巧”,“滋水”疑為筆誤。
3.將“效尤”改為“學(xué)習(xí)和借鑒”,因?yàn)椤靶в取蓖ǔV傅氖欠滦уe誤的行為,此處更正為正面的表達(dá)。
4修正了部分表述,使其更加流暢和準(zhǔn)確,如將“熱門消遣”調(diào)整為“熱門消遣方式之一”,但基于上下文,直接使用“熱門消遣”也已足夠明確,故未做此調(diào)整。
Kimi先對文字中需要校對的地方進(jìn)行了說明,再對文段進(jìn)行了梳理,并對部分半角標(biāo)點(diǎn)進(jìn)行了修正。以下是Kimi的校對說明。
1.“七月流火”這個成語用得不太恰當(dāng),它通常用來形容天氣非常炎熱,但這里描述的是游泳成為愛好,可能用“炎炎夏日”或“七月炎炎”更為合適。
2“下水游泳成人們的一大愛好”中,“人們”應(yīng)該指代“學(xué)生”,因?yàn)楹笪奶岬搅诵@防溺水安全教育。
3.“防弱水專題課”中的“弱水”應(yīng)該是“溺水”。
4“防溺水七不兩會”中的“七不兩會”沒有具體解釋,可能需要補(bǔ)充具體內(nèi)容。
5.“會上,有同學(xué)提供了很多的防滋水技巧”中的“防滋水”應(yīng)該是“防溺水”。
6.“這值得其他人效尤”中的“效尤”用詞不當(dāng),應(yīng)該是“效仿”。
在例文中,至少存在成語誤用、標(biāo)點(diǎn)錯誤、搭配不當(dāng)、錯字別字、多字少字、褒貶誤用等12處差錯。各AI審校工具的審校效果各不相同(見表1)。其中,使用“黑馬校對”的結(jié)果不盡如人意,它識別了3條結(jié)果,其中標(biāo)紅的僅有1條,標(biāo)粉的2條?!皩?shí)操”一詞為職業(yè)教育常用表述,標(biāo)粉情有可原。但“防滋水”也被標(biāo)粉,就提示我們在日常使用“黑馬校對”的時候,一定不能輕易忽略標(biāo)粉的條目,否則可能留下錯誤。
插件代表WPS表現(xiàn)出色,識別了其中的9條,包括4條標(biāo)點(diǎn)錯誤。
主流AI工具中,“文心一言”對文本進(jìn)行了梳理,查出了兩處“防溺水”的差錯,并將“效尤”這處褒貶誤用的差錯挑了出來。標(biāo)點(diǎn)符號方面,除了省略號未更正,其他半角的逗號、句號全部修正了?!巴x千問”的結(jié)果與“文心一言”相近,并修正在部分表述,如將“全體同學(xué)們”改成了“全體學(xué)生”,使文章更加流暢和準(zhǔn)確,但將“成”修改為“成為了”,產(chǎn)生了新的差錯。Kimi表現(xiàn)最為出色,不僅修正了錯別字,對使用不當(dāng)?shù)某烧Z“七月流火”、詞語“效尤”均識別出來。標(biāo)點(diǎn)方面,Kimi修正了除省略號外的所有標(biāo)點(diǎn)差錯,還結(jié)合上下文對相關(guān)表述進(jìn)行了調(diào)整,并提出了相關(guān)的修改建議。
從例文審校過程和審校結(jié)果來看,傳統(tǒng)研發(fā)型智能審校軟件的表現(xiàn)相對欠佳,這是否提示編輯人員應(yīng)當(dāng)及時進(jìn)行數(shù)據(jù)庫的更新?常用軟件的校對插件識別能力不錯,能夠應(yīng)對許多常見的編校差錯審校。主流AI工具的審校功能基于大模型更強(qiáng)大的算法,對傳統(tǒng)研發(fā)型智能審校軟件、常用軟件校對插件審校欠缺的成語、詞語誤用方面表現(xiàn)出色,并能夠較好地結(jié)合上下文梳理全文,但在省略號這類在網(wǎng)絡(luò)語言體系中常被誤用的標(biāo)點(diǎn)方面,則容易出現(xiàn)混亂。
在實(shí)際應(yīng)用中,為了確保得到更好的審校效果,編校人員不妨多管齊下,在人工審校的基礎(chǔ)上綜合使用多種智能審校軟件,盡可能消除差錯,向“多出善本,不出錯本”的目標(biāo)不斷前進(jìn)。
在技術(shù)奇點(diǎn)之前
1958年,美國數(shù)學(xué)家、“計算機(jī)之父”約翰·馮·諾依曼首次在科技領(lǐng)域引入“奇點(diǎn)”這一術(shù)語。技術(shù)奇點(diǎn)假說認(rèn)為,隨著人工智能的不斷發(fā)展,機(jī)器將達(dá)到一個點(diǎn),它們能夠進(jìn)行自我改進(jìn),并以指數(shù)級的速度不斷進(jìn)步,最終創(chuàng)造出遠(yuǎn)超人類智能的超級智能。
雖然人類對人工智能的未來懷抱如此美好的愿景,人工智能技術(shù)的發(fā)展也帶來了巨大的潛力和益處,但在現(xiàn)階段,人類對其應(yīng)用仍然存在局限。智能審校當(dāng)然也不例外。編校人員從智能審校工具中得到了相應(yīng)的助力,使得工作效率及成效均得到提高。但AI智能審校工具仍存在一些局限。
結(jié)合工作實(shí)際,對審校人員而言,智能審校的局限主要體現(xiàn)為以下兩點(diǎn)。
一是機(jī)械算法在深層語義理解上的局限。漢語博大精深,在不同語境中表意往往可能大相徑庭。當(dāng)前使用的智能審校工具大多通過計算機(jī)快速檢索、對比、檢查進(jìn)行處理,在識別和糾正字詞差錯(如拼寫錯誤、音近字、形近字及成語誤用等)、基礎(chǔ)語法錯誤(如多字、少字、字序顛倒、詞序顛倒等)、標(biāo)點(diǎn)符號錯誤、專業(yè)及學(xué)科錯誤、敏感詞和政治術(shù)語錯誤、基本常識性錯誤(如紀(jì)年和日期、人物和地名等)、圖像視頻內(nèi)容錯誤等方面,具備出色的審校能力。而一旦涉及深層語義、復(fù)雜語義、情感色彩和特定文化背景等的文檔,其理解力和判斷力將大打折扣。
二是語料更新在速度與實(shí)時性上的局限。智能審校工具基于海量的既有語料對內(nèi)容進(jìn)行判斷,然而,人類生活的豐富性使得語言始終處于發(fā)展變化之中,新詞匯、新表達(dá)和網(wǎng)絡(luò)語言層出不窮,各行各業(yè)的實(shí)時變化也帶來海量的信息變化,智能審校系統(tǒng)需要不斷優(yōu)化和更新以適應(yīng)新的語言現(xiàn)象和規(guī)劃。然而,目前許多智能審校工具在應(yīng)用實(shí)踐中存在滯后性,從而使得審校效果不盡如人意。
以上兩種局限,讓現(xiàn)有智能審校工具難以滿足專業(yè)編輯與審校人員的期待。從技術(shù)發(fā)展與工具完善的角度來說,如何讓“不夠智能”的智能審校工具實(shí)現(xiàn)審校能力的迭代?各AI審校工具除了優(yōu)化審校模型算法、提高對語言細(xì)節(jié)的理解能力、實(shí)現(xiàn)語料的動態(tài)更新外,還應(yīng)注重保持系統(tǒng)的開放性,建立更完善的用戶自定義機(jī)制。
(作者單位:湖南教育報刊集團(tuán)有限公司)