6月19日至23日,為期5天的第三十屆北京國際圖書博覽會在國家會議中心舉行。作為全球第二、亞洲第一的圖書博覽會,大會備受矚目。
人工智能(簡稱“AI”)的發(fā)展趨勢目前聚焦在生成式人工智能,也就是大模型方面。大模型出現(xiàn)后帶來效率躍升,有人擔心人類會不會因此失業(yè),也有人擔心會不會誕生硅基生命,最后把碳基生命打敗。
“從現(xiàn)在來看,我們可見的將來,人工智能的定位就是人類的助手,是幫助人類的?!痹?月19日舉行的2024出版與技術創(chuàng)新大會上,演講嘉賓、北京大學王選計算機研究所研究員趙東巖否定了上述猜想。
那么,在未來,AI這個助手將在出版業(yè)扮演怎樣的角色呢?以“AI賦能下的出版未來”為主題,2024出版與技術創(chuàng)新大會吸引了眾多海內(nèi)外出版界精英、學術領袖及AI技術專家,共同探索AI技術如何為出版業(yè)賦能,塑造全新的出版業(yè)態(tài)。
1956年,人工智能的概念被提出。上世紀90年代以來,人工智能領域出現(xiàn)了三次標志性事件。
1997年,“深藍”打敗國際象棋世界冠軍,標志著在計算智能領域計算機已經(jīng)超過人類;2016年,AlphaGo打敗圍棋世界冠軍李世石,標志著在感知智能方面計算機超過了人類;2022年底,Chat-GPT推出,兩個月之內(nèi)就達到月活上億,生成式人工智能時代隨之來臨。
“伴隨著數(shù)智時代的來臨,人工智能作為一種顛覆性的科技創(chuàng)新范式,為學術研究和出版行業(yè)帶來了前所未有的變革和機遇?!敝袊茖W院院士、開放科學促進聯(lián)合體理事長何滿潮表示。
何滿潮詳細講述了AI在他熟知的工程巖體力學研究中發(fā)揮的作用,指出人工智能技術在出版業(yè)的應用也在不斷深入,并且這一趨勢正在重塑傳統(tǒng)的出版流程和內(nèi)容創(chuàng)作方式。
在如今知識爆炸的時代,短時間內(nèi)想要了解海量的信息和最新研究成果幾乎不可能,而要在此基礎上對信息加以分析并寫出比較全面的書籍更是難上加難,所以何滿潮認為,用AI技術幫助寫書將是出版領域一個重大的應用場景。
在何滿潮看來,AI技術是一個非常好的幫手,可以幫助科學家節(jié)省更多的時間進行更高效的工作,把精力集中在更重要的研究工作中。目前,何滿潮所在的團隊正在推進與中國圖書進出口(集團)有限公司、中圖科信數(shù)智技術(北京)有限公司以及施普林格·自然集團的合作,預期通過AI技術合作出版巖石力學相關圖書。
知識產(chǎn)權出版社目前擁有數(shù)據(jù)種類539種,涉及專利、商標、版權、標準、知識產(chǎn)權相關圖書、相關案例裁判等,容量多達420TB,優(yōu)質(zhì)且堅實的數(shù)據(jù)基礎為該社跨越式發(fā)展提供了得天獨厚的條件。
據(jù)知識產(chǎn)權出版社副總編輯劉新民介紹,他們結(jié)合本社知識產(chǎn)權大數(shù)據(jù),采用智能算法模型,構(gòu)建了知識產(chǎn)權評估體系,為知識產(chǎn)權價值進行科學評估?!斑@個系統(tǒng)不僅可以評估一項技術,而且可以延伸評估一個企業(yè)或者一個團隊的創(chuàng)新能力和創(chuàng)新水平,從而為科學決策提供依據(jù)?!?/p>
通過該系統(tǒng),知識產(chǎn)權出版社為2023中國·海淀高價值專利培育大賽篩選了70余個項目,對接資本上億元,促進了先進技術產(chǎn)業(yè)落地。而這只是應用場景之一。目前,在國內(nèi)知識產(chǎn)權金融及創(chuàng)新創(chuàng)業(yè)大賽中,該系統(tǒng)得到了廣泛應用。
今年4月,知識產(chǎn)權出版社發(fā)布旗艦產(chǎn)品——中知慧海知識產(chǎn)權大數(shù)據(jù)與智慧服務系統(tǒng)。據(jù)介紹,該系統(tǒng)是利用AI技術的集大成者,能夠精準理解用戶的查詢意圖,為用戶打造一個全方位的創(chuàng)新工作平臺。
愛思唯爾是一家有著400多年歷史的老牌出版商,擁有近3000種期刊,每年出版3萬多種圖書,2萬多家客戶遍布全球。依托生成式人工智能技術,今年以來,愛思唯爾向市場推出了Scopus AI和ClinicalKey AI兩款產(chǎn)品,還有一款正在測試中。
愛思唯爾大中華區(qū)總裁李琳著重介紹了Scopus AI?!斑@是全球第一款生成式科研發(fā)現(xiàn)平臺,它能夠幫助學生和科研人員提高在文獻精準度方面的發(fā)現(xiàn)能力和概括能力?!?/p>
AI技術為出版賦能,給傳統(tǒng)出版業(yè)帶來巨變,也給讀者帶來數(shù)字閱讀新體驗。在2024出版與技術創(chuàng)新大會上,華為終端云閱讀業(yè)務部部長作為受邀嘉賓發(fā)聲,為人們了解數(shù)字閱讀的新動向打開了一扇窗。
AI技術代表著文化和科技前沿,而閱讀則相對傳統(tǒng)和經(jīng)典,當AI遇上閱讀,兩者碰撞會產(chǎn)生怎樣的火花?
根據(jù)華為閱讀的實踐,“AI+閱讀”至少可以帶來三個維度的提升。第一,AI可以讓閱讀變得更加舒服。當讀者閱讀時,屏幕的色溫、字體、行間距、排版等,都會影響閱讀體驗,AI可以幫助提升舒適感。第二,AI可以讓讀書變得更加便捷。從紙質(zhì)書到電子書,便捷性無疑有了大的提升,攜帶、檢索和閱讀都變得更加方便。在不久的將來,甚至連翻書都可以省掉,在AI技術的加持下,直接用眼球就可以實現(xiàn)翻頁。第三,AI可以讓閱讀更有效率。如果原來看一本書需要1個月或者10天,通過AI的輔助,也許5天甚至5個小時就足夠了。
科技點亮生活。在華為閱讀App下載專區(qū)的評論里,有讀者對它贊賞有加。據(jù)稱,華為閱讀的字體和背景設置比另一款主流閱讀產(chǎn)品更加美觀,導入本地書籍時,對文檔的章節(jié)劃分也更加準確。顯然,這少不了AI的功勞?!澳壳埃覀冞x了15種主題和12款字體?!蓖ㄟ^大模型計算,AI幫助華為閱讀從近億用戶中找到讀者最喜歡的排版格式。在華為閱讀官網(wǎng)首頁,有著這樣的描述:“多種詩意的國風色調(diào)、多款自然主題背景可以隨意搭配,讓閱讀更有氛圍感……”
將手解放出來,用眼球就可以實現(xiàn)翻頁,這是華為閱讀的一項“黑科技”。據(jù)介紹,這項技術目前還未正式面市,但已經(jīng)在實驗室里取得良好效果。如果讀者覺得翻頁過于麻煩,沒有關系,當他們面對屏幕進行閱讀時,系統(tǒng)可以根據(jù)監(jiān)測到的眼球移動,判斷是否看完頁面,再幫助讀者翻頁,“準確度非常高”。
大大壓縮閱讀時間,這又是如何做到的?據(jù)介紹,AI摘要和關系圖譜是華為閱讀新開發(fā)的功能,前者是AI基于語義判斷,把文章內(nèi)容做簡短的提煉,后者是AI基于對一本書架構(gòu)的認知,提煉出關系圖譜輔助讀者閱讀。使用AI摘要的典型場景有兩個:一是讀者查閱學術類書籍時,AI摘要可以快速把學術類書籍的概要提煉出來,幫助讀者提升工作效率;二是當讀者閱讀特別長的網(wǎng)文時,如果中間有些部分不想細看,為了保持內(nèi)容的連貫性,AI摘要可以把不想細看的那部分內(nèi)容濃縮成短文,節(jié)約讀者的閱讀時間。關系圖譜也是提升閱讀效率的有力抓手。比如《紅樓夢》里的人物關系圖譜非常復雜,有了AI的幫助,讀者閱讀起來就可以更輕松。從目前實踐結(jié)果看,華為閱讀的關系圖譜準確率已經(jīng)達到90%。
書籍架起溝通的橋梁,讓國與國之間的距離更加緊密。華為閱讀優(yōu)選全球超過220萬冊圖書和精品有聲內(nèi)容,供讀者閱讀成長。為了幫助讀者打破閱讀屏障,華為閱讀傾心推出一鍵翻譯功能,支持多達57種語言實時翻譯,目前在國內(nèi)所有閱讀App中位列第一。
盡管在世界范圍內(nèi)“AI+出版”取得了一定的創(chuàng)新成果,但二者的融合發(fā)展并非坦途。
挑戰(zhàn)無處不在。比如,建設高質(zhì)量學術數(shù)據(jù)語料庫是打造生成式人工智能的“壓艙石”,可高質(zhì)量學術數(shù)據(jù)語料庫從何而來?從數(shù)據(jù)到大模型訓練,語料是重要的過渡。上海數(shù)據(jù)交易所總經(jīng)理湯奇峰表示,語料庫供應方面存在重要挑戰(zhàn)。一些組織愿意公開語料,但也有一些組織不愿意公開。即使在愿意公開的里面,也不是所有的質(zhì)量都達標,有的甚至沒有組織成語料。
“作為科研知識服務提供商,我們秉承的是可信賴的AI應用原則,這是一個基石。我們要確保數(shù)據(jù)質(zhì)量是高質(zhì)量的?!?/p>
李琳說,整個生成式人工智能正在給出版界、知識服務界和科技界帶來很多驚喜,當然也可能會帶來一些潛在的挑戰(zhàn)。作為從業(yè)者,對于新的技術和工具,她認為應該開放地擁抱,不斷嘗試,這樣才能把產(chǎn)品和服務做得更好。
李琳強調(diào),愛思唯爾只是科研共同體的一部分,整個學術知識的產(chǎn)生和出版其實是一個共創(chuàng)的過程,不管期刊的編輯、主編還是評審人,都只是整個生態(tài)當中的一環(huán)。所以,面對這個創(chuàng)新的時代,需要繼續(xù)秉承合作共創(chuàng)的模式。愛思唯爾致力于成為一個更加開放的平臺,將引入更多第三方出版社的內(nèi)容,更好地為科研人員服務。
本屆圖博會的主題為“5XcOzwWE6SjQD+lllIcxjzQyy4qGGPYfpH7DA9VMb8k=深化文明互鑒,合作共贏未來”,一共有22萬種中外圖書亮相博覽會。合作也是此次出版與技術創(chuàng)新大會的關鍵詞。北京印刷學院副院長陳丹說,學院與國內(nèi)一些高校和科研院所建立了合作關系,希望形成一個學術共同體,共同推進學術數(shù)據(jù)的開發(fā)和利用;德國出版公司德古意特博睿首席商務官Ben Ashcroft表示,他們與全球各地的50家出版商合作,包括知名的美國大學出版社,一邊幫助他們把作品帶到中國,一邊幫助中國研究者把研究成果發(fā)表在國外期刊上;大會舉辦方代表、第十四屆全國政協(xié)委員、中國圖書進出口(集團)有限公司總經(jīng)理林麗穎強調(diào),作為連接出版上下游的中盤商和中外溝通橋梁的兩個特殊角色,公司能夠與不同類型的合作伙伴在學術服務的應用場景、跨境數(shù)據(jù)交易、智能閱讀、AI知識服務等不同維度進行合作……
5年前,著名學術出版商施普林格·自然集團出版了第一本由機器學習生成的書籍——《鋰離子電池:機器生成的當前研究摘要》。5年后的今天,大會期間,施普林格·自然集團宣布將在中國啟動“Artificial Pen Project”AI生成式寫書計劃。而它的合作伙伴,中圖科信數(shù)智技術(北京)有限公司則發(fā)布了“思瓜”LUFFAAI——一款為科研人員量身定制的自主訓練大模型,預示著個性化知識服務的時代將加速到來。