中圖分類號(hào):G254 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-6916(2025)10-0069-04
A Study on the Classfication System of Social Question and Answer Websites
——Taking the“Topic Tree” of the“Zhihu” Website as an Example Zhou Haibin’Ding Chuanrui2He Yufei1 (1.Chengdu College of University of Electronic Science and Technology of China,Chengdu 611731; . School of Economics and Management, Southwest University of Science and Technology,Mianyang 621000)
Abstract:Withte“topictree”knowldgeclasificationsystem,“Zhiu”websitefectivelyintegratestheraditioalclaification andsociallabelclasifctionsystems,whichhasimportantreferentialsignfcancefortheintegrationandorganizationofnetwork information.Taking“Zhiu”websiteastheresearchobject,thispapercomparestheinformationresources,userlabels,andtopicstructure f hiswebsitewittefsooyndtrdiioallassficationmeodspecivelyandsumsisprosadcos.oire structurefestosihfiteifoatooaatiostittablultimesalacalsatio; seconditsstoartiiateiifoatiooaatioyatingtpiosgtsfoprovtsdon informationorganzationprinciplesareputforwardasfolows:orderinginformationorganzationtostrengthenthesemanticreprsetation capabitiesoftoicstructures;optiigiforatioganationtoitigatethmpactofusersubjectiityonifoationcasa; beautifying information organization to enrich the visual presentation of topic tags on the homepage.
Keywords: social website;question and answer website;classfication system; topic tree
移動(dòng)互聯(lián)網(wǎng)技術(shù)的進(jìn)步使用戶已養(yǎng)成隨時(shí)通過問答網(wǎng)站獲取和分享內(nèi)容的習(xí)慣,并同時(shí)以協(xié)同構(gòu)建話題結(jié)構(gòu)、等級(jí)體系等社會(huì)化的方式組織內(nèi)容。“知乎”創(chuàng)立于2010年,是目前國內(nèi)訪問量最大的社會(huì)化問答社區(qū)。其以高質(zhì)量的知識(shí)體系為發(fā)展基礎(chǔ),通過用戶對(duì)話題、問題的關(guān)注與高質(zhì)量的回答形成互動(dòng),構(gòu)建了完善的生態(tài)體系。截至2024年6月30日,知乎累計(jì)擁有7490萬名內(nèi)容創(chuàng)作者,平均月活躍用戶數(shù)為8110萬人,平臺(tái)累計(jì)內(nèi)容達(dá)8.309億條。隨著用戶問答內(nèi)容和標(biāo)簽的劇增,有效組織管理以防止信息過載、滿足個(gè)性化需求成為問答網(wǎng)站發(fā)展的關(guān)鍵?!爸酢本W(wǎng)站的話題結(jié)構(gòu)通過結(jié)合傳統(tǒng)分類法與社會(huì)化標(biāo)簽,實(shí)現(xiàn)了知識(shí)的有效組織。因此,深人研究其基于用戶社會(huì)化標(biāo)簽的層次分類體系,可促進(jìn)網(wǎng)絡(luò)信息組織及分類體系的改進(jìn)。
一、網(wǎng)站信息組織的研究現(xiàn)狀
國內(nèi)外學(xué)者主要將網(wǎng)站類型分為三大類,分別是:門戶網(wǎng)站、信息服務(wù)機(jī)構(gòu)網(wǎng)站和Web2.0網(wǎng)站,對(duì)網(wǎng)站信息組織開展的研究基本是圍繞這三大類網(wǎng)站展開的。在門戶網(wǎng)站相關(guān)研究中:唐煒研究網(wǎng)易、搜狐、新浪以及雅虎中國四家大型綜合門戶網(wǎng)站,分析其信息管理與信息組織體系的原理和特點(diǎn),總結(jié)關(guān)于相關(guān)組織體系的不足與改進(jìn)建議。楊帥旗[2]提出基于公眾分類的醫(yī)療門戶網(wǎng)站分類系統(tǒng),改進(jìn)原有體系,推動(dòng)其信息組織體系個(gè)性化、動(dòng)態(tài)化發(fā)展,以滿足用戶需求。劉佳美等人[3]以德國聯(lián)邦檔案館專題門戶網(wǎng)站在線互動(dòng)為切入點(diǎn),發(fā)現(xiàn)其互動(dòng)欄目多樣性、互動(dòng)體驗(yàn)趣味性等多個(gè)特點(diǎn),并提出相關(guān)啟示。在對(duì)信息服務(wù)機(jī)構(gòu)網(wǎng)站的研究中:褚節(jié)旺等人議[4對(duì)國外6個(gè)MOOC網(wǎng)站信息資源組織進(jìn)行比較分析,并提出優(yōu)化建議。凌宇飛[5以四川省5所高校圖書館網(wǎng)站為例,從首頁信息、欄目設(shè)置等多維度分析網(wǎng)站信息組織現(xiàn)狀及問題,并提出改進(jìn)對(duì)策。陸炫冰等人[以新華網(wǎng)和澎湃新聞為例,分析其選題內(nèi)容、交互形式等方面,得出國內(nèi)數(shù)據(jù)新聞的交互現(xiàn)狀。在對(duì)Web2.0網(wǎng)站的研究中:朱愛菊[7]以新浪微博為例,分析基于人際聯(lián)動(dòng)的信息組織與獲取機(jī)制,認(rèn)為可以從對(duì)人的關(guān)注和瀏覽中獲取信息。熊回香[8]以豆瓣網(wǎng)為例,分析其類目體系、標(biāo)簽規(guī)范等方面缺陷,提出類目體系、標(biāo)簽、豆瓣小組話題關(guān)聯(lián)、交叉推薦4個(gè)方面的優(yōu)化策略。王震霄通過對(duì)比分析多個(gè)國家圖書館網(wǎng)站,分析Web2.0技術(shù)使用現(xiàn)狀,提出關(guān)于我國圖書館網(wǎng)站建設(shè)和服務(wù)的相關(guān)建議。
綜上所述,現(xiàn)有研究中欠缺對(duì)問答網(wǎng)站的研究,對(duì)社會(huì)化問答網(wǎng)站信息組織的研究也非常欠缺。鑒于以“知乎”為代表的問答網(wǎng)站影響力越來越大,有必要借鑒信息組織的理論與方法對(duì)問答網(wǎng)站進(jìn)行研究,有助于網(wǎng)絡(luò)信息組織及分類體系的進(jìn)一步改進(jìn)和完善。
二、“知乎”問答網(wǎng)站的用戶標(biāo)簽系統(tǒng)
(一)“知乎”網(wǎng)站信息資源的特點(diǎn)
“知乎”以問題及關(guān)于問題的回答、討論為主要內(nèi)容,充許用戶提出任何問題,不對(duì)答案的正確與否做出判斷,只在乎該問題是否引發(fā)了用戶廣泛而深入地討論。作為典型的社會(huì)化問答網(wǎng)站,知乎在“問答機(jī)制”上融合了“社交關(guān)系”,其信息資源具有以下3個(gè)特點(diǎn)。
1.信息內(nèi)容體現(xiàn)用戶特色
“知乎”的信息生產(chǎn)方式為用戶生成內(nèi)容(UGC),這種信息生產(chǎn)方式使得社區(qū)內(nèi)的信息全都來源于用戶,因此必然體現(xiàn)了用戶社群的群體意識(shí)傾向和知識(shí)背景。在“知乎”網(wǎng)站中,知識(shí)和信息不僅僅是一種信息資源,更代表著用戶自身的價(jià)值觀和態(tài)度,在社交層面上具備了被共享和分享的價(jià)值。
2.信息與人群的高度互動(dòng)
在“知乎”社區(qū)中,用戶可關(guān)注特定用戶或領(lǐng)域/話題,增強(qiáng)信息來源的深度和廣度,加速信息傳播,促進(jìn)信息向知識(shí)轉(zhuǎn)化。用戶在感興趣話題的問答互動(dòng)中形成知識(shí)研究小群體,進(jìn)而構(gòu)成穩(wěn)定的興趣基礎(chǔ)知識(shí)探討群體。因此,“知乎”的信息交互實(shí)現(xiàn)了從單向到雙向交流的轉(zhuǎn)變,每個(gè)用戶和信息都成為傳播和分享網(wǎng)絡(luò)的一部分。
3.高質(zhì)量的信息反饋
“知乎”并不是以簡單的生活常識(shí)構(gòu)建的知識(shí)平臺(tái),而是基于個(gè)人對(duì)一定專業(yè)性、準(zhǔn)確性以及個(gè)性化的知識(shí)需求而產(chǎn)生的。在這一體系中,人與人之間的社會(huì)關(guān)系是以“問答”的方式體現(xiàn),進(jìn)而產(chǎn)生社交行為。因此,系統(tǒng)會(huì)自動(dòng)將低質(zhì)量的或沒有意義的問題或回答予以屏蔽。此外,為構(gòu)建良好的社交生態(tài),參與用戶往往會(huì)主動(dòng)對(duì)問題與回答進(jìn)行控制,不斷優(yōu)化其知識(shí)體系內(nèi)的知識(shí)探索氛圍,保證高質(zhì)量的信息可以被用戶快速地獲得。
(二)“知乎”網(wǎng)站用戶、話題、信息資源三者的互動(dòng)
“知乎”標(biāo)簽系統(tǒng)由“用戶”“話題”“信息資源”三類對(duì)象及用戶標(biāo)注行為構(gòu)成。用戶提問并綁定話題,編輯話題結(jié)構(gòu),影響問題。問題與話題結(jié)構(gòu)相互依存,通過話題集中相關(guān)領(lǐng)域討論和興趣用戶。標(biāo)注是用戶基于知識(shí)認(rèn)知選擇信息資源、確定知識(shí)標(biāo)簽的過程。用戶分為話題創(chuàng)建者和使用者,前者編輯話題,后者使用現(xiàn)有話題。“知乎”限制用戶權(quán)限,非所有用戶可編輯話題結(jié)構(gòu)。
(三)“知乎”標(biāo)簽系統(tǒng)與社會(huì)化標(biāo)注系統(tǒng)的比較
社會(huì)化標(biāo)注作為 環(huán)境下的信息資源分類方法,充許用戶自由選擇標(biāo)簽進(jìn)行網(wǎng)絡(luò)資源標(biāo)注,類名由標(biāo)簽使用頻率決定。標(biāo)簽反映用戶對(duì)資源的個(gè)性化關(guān)注或總結(jié),體現(xiàn)個(gè)人觀點(diǎn)。社會(huì)化標(biāo)注系統(tǒng)以個(gè)性化詞語為類目,無等級(jí)結(jié)構(gòu)。與社會(huì)化標(biāo)注不同,“知乎”用戶在添加個(gè)性化標(biāo)注時(shí),必須從給定的規(guī)范化話題標(biāo)簽中選擇,而不能根據(jù)個(gè)人喜好隨意添加新標(biāo)簽。與社會(huì)化標(biāo)簽系統(tǒng)相比,“知乎”對(duì)用戶標(biāo)注行為設(shè)限可以減少標(biāo)簽的語義重復(fù)和冗余度,提高專指度和準(zhǔn)確性。
社會(huì)化標(biāo)注系統(tǒng)與知乎標(biāo)簽系統(tǒng)在多個(gè)維度上展現(xiàn)出異同。從揭示對(duì)象來看,社會(huì)化標(biāo)注系統(tǒng)主要面向網(wǎng)絡(luò)信息資源,而知乎標(biāo)簽系統(tǒng)則針對(duì)社區(qū)問答內(nèi)容。在選用詞匯方面,社會(huì)化標(biāo)注系統(tǒng)傾向于使用大眾用詞,而知乎標(biāo)簽系統(tǒng)則采用了經(jīng)過規(guī)范的大眾用詞。在詞間關(guān)系上,社會(huì)化標(biāo)注系統(tǒng)通常沒有明確的詞間關(guān)系,而知乎標(biāo)簽系統(tǒng)則建立了上下位詞的層級(jí)關(guān)系。此外,兩者在揭示語義方面也存在差異,社會(huì)化標(biāo)注系統(tǒng)揭示的語義相對(duì)模糊稀疏,而知乎標(biāo)簽系統(tǒng)則主要表達(dá)層級(jí)語義。在構(gòu)建人員方面,社會(huì)化標(biāo)注系統(tǒng)由大眾參與構(gòu)建,而知乎標(biāo)簽系統(tǒng)則需要滿足社區(qū)權(quán)限要求的人員進(jìn)行構(gòu)建。盡管兩者在構(gòu)建人員上有所不同,但它們的用戶定位都是面向大眾。
三、“知乎”問答網(wǎng)站的話題樹類目體系
“知乎”平臺(tái)以問題及回答、討論為主要內(nèi)容,通過話題分類將相似問答組織成樹型話題結(jié)構(gòu),類似于非循環(huán)有向圖。話題樹的基本結(jié)構(gòu)由“知乎”決定,用戶協(xié)同編輯子話題及相關(guān)說明,建立豐富的話題層。信息分類旨在按標(biāo)準(zhǔn)和邏輯方法歸結(jié)信息以便區(qū)分,便于知識(shí)集中與提煉。傳統(tǒng)分類法通常采用樹狀結(jié)構(gòu),從面到點(diǎn)劃分知識(shí)?!爸酢钡脑掝}樹類目體系與傳統(tǒng)分類法在結(jié)構(gòu)上相似,但類目設(shè)置和展開方式完全不同。
(一)話題樹的聚類標(biāo)準(zhǔn)與類目設(shè)置
“知乎\"將話題劃分為6個(gè)一級(jí)類目、5100多個(gè)二級(jí)類目,繼續(xù)細(xì)分至最底層,一級(jí)類目和二級(jí)類目由“知乎\"確定,其余類目多由用戶創(chuàng)建。一級(jí)類目包括“未歸類話題”“學(xué)科”“實(shí)體”“形而上話題”“產(chǎn)業(yè)”“生活藝術(shù)文化與活動(dòng)”。知乎的分類體系不同于傳統(tǒng)以學(xué)科為基礎(chǔ)的聚類標(biāo)準(zhǔn),更注重實(shí)用性和用戶特色,如設(shè)置“形而上話題”等以保持體系完整性。類目存在與否取決于用戶參與度,而非知識(shí)體系嚴(yán)謹(jǐn)性。話題旨在幫助用戶組織和發(fā)現(xiàn)內(nèi)容,因此不預(yù)設(shè)話題以保持知識(shí)體系完整。類目名稱多源于用戶標(biāo)注,使用中英文縮寫和網(wǎng)絡(luò)流行語,雖符合用戶習(xí)慣,但存在語義重復(fù)和專指度不高等問題,易誤導(dǎo)用戶。
(二)話題樹的類目關(guān)系與結(jié)構(gòu)
“知乎\"話題樹是一個(gè)層次豐富關(guān)系復(fù)雜的類目體系,通過明確的類目關(guān)系和層級(jí)結(jié)構(gòu)連接不同的話題。每個(gè)話題代表一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)之間通過父子關(guān)系相互連接,形成多級(jí)、有根無循環(huán)的有向圖。從根話題開始,話題可細(xì)分為更具體的子話題,使得話題結(jié)構(gòu)更加清晰易懂。同時(shí),話題間也可能存在交叉和關(guān)聯(lián),以此增加話題結(jié)構(gòu)的靈活性和多樣性。話題樹的根節(jié)點(diǎn)及三層底層話題由知乎站方?jīng)Q定,不開放修改;其余部分允許用戶公共編輯?!爸酢痹掝}樹結(jié)構(gòu)有效揭示了父子話題的隸屬關(guān)系:子話題作為父話題內(nèi)容的分類,而父話題則概括子話題內(nèi)容。但該結(jié)構(gòu)未揭示同級(jí)話題間的橫向關(guān)系。同一父話題下的子話題既不相互排斥,也不必窮盡父話題內(nèi)容,且未按統(tǒng)一標(biāo)準(zhǔn)劃分。例如,“書籍”“人”“商品”均隸屬于“實(shí)體”,但概念內(nèi)涵上無共性且不互斥。
(三)話題樹與傳統(tǒng)分類體系的比較分析
“知乎”話題樹結(jié)構(gòu)揭示父話題與子話題的隸屬關(guān)系,構(gòu)成層次分類體系,但橫向話題間無層級(jí)關(guān)系,體現(xiàn)標(biāo)簽的無序性和非規(guī)范化?!爸酢痹掝}樹與傳統(tǒng)分類體系在揭示對(duì)象、選用詞匯、類目設(shè)置、聚類標(biāo)準(zhǔn)、類目關(guān)系及用戶定位上存在顯著差異?!爸酢痹掝}樹主要針對(duì)網(wǎng)絡(luò)社區(qū)問答資源,采用規(guī)范的大眾用詞,以社區(qū)內(nèi)容為核心分為六大話題,聚類靈活多樣,面向大眾用戶。而傳統(tǒng)分類體系則專注于圖書文獻(xiàn)資源,使用受控詞,以學(xué)科為基礎(chǔ)分為22個(gè)大類,聚類標(biāo)準(zhǔn)嚴(yán)謹(jǐn),形成了嚴(yán)格的層級(jí)式體系,既服務(wù)于專業(yè)人員也面向大眾。盡管兩者在類目關(guān)系上都采用上下位隸屬關(guān)系,但“知乎”話題樹更加貼近用戶需求和興趣,體現(xiàn)了社區(qū)問答的特色;而傳統(tǒng)分類體系則更加注重學(xué)科分類的準(zhǔn)確性和專業(yè)性。
四、分析與建議
(一)話題樹結(jié)構(gòu)對(duì)網(wǎng)站信息組織的啟示
“知乎”平臺(tái)采用大眾分類與樹狀層次結(jié)構(gòu)相結(jié)合的信息組織方式,通過用戶標(biāo)簽聚合和歸類問答內(nèi)容,形成符合人類認(rèn)知習(xí)慣的樹狀結(jié)構(gòu)。這種組織方式不僅表達(dá)標(biāo)簽的類別和上下位關(guān)系,還為用戶提供資源集合的全景圖,從而改善用戶體驗(yàn)。其對(duì)其他網(wǎng)站的信息組織提供以下啟示。
1.建立多維等級(jí)分類體系
大眾分類法在Web2.0時(shí)代已成為趨勢(shì),但其多樣性、模糊性降低了檢索效率。平面化Tag結(jié)構(gòu)導(dǎo)致瀏覽障礙,語義關(guān)系缺乏使一詞多義現(xiàn)象難以控制。
“知乎”的話題樹結(jié)構(gòu)結(jié)合了大眾分類法的個(gè)性化和專家分類法的層次性,彌補(bǔ)了扁平化不足。網(wǎng)站應(yīng)依據(jù)科學(xué)分類原理,以用戶需求為核心,制定標(biāo)注規(guī)則,構(gòu)建層級(jí)分類體系,組織社會(huì)化標(biāo)簽,實(shí)現(xiàn)信息有序,改善扁平結(jié)構(gòu)問題。
2.賦予用戶權(quán)限參與信息組織
信息組織的目的是提升用戶體驗(yàn),應(yīng)以真實(shí)用戶需求為核心,引導(dǎo)用戶參與信息組織和傳遞全過程。“知乎”通過話題樹方式有效聚合問答內(nèi)容,形成樹狀層次體系。話題作為用戶標(biāo)簽和分類類目,用戶借助話題實(shí)現(xiàn)信息組織,成為分類體系制定者。網(wǎng)站應(yīng)讓用戶全方位參與信息組織工作,如設(shè)置規(guī)則篩選優(yōu)質(zhì)用戶,賦予權(quán)限參與分類體系構(gòu)建,借助群體智慧優(yōu)化信息組織。
(二)基于信息組織原理的改進(jìn)建議
1.信息組織的序化
強(qiáng)化話題結(jié)構(gòu)的語義揭示能力。信息序化依賴符號(hào)系統(tǒng)。“知乎”以樹狀層次結(jié)構(gòu)組織信息,逐層展開父子話題,形成等級(jí)列舉式分類體系,描述縱向從屬關(guān)系,但不揭示橫向聯(lián)系。建議保留話題樹狀結(jié)構(gòu),同時(shí)采用圖譜形式揭示知識(shí)層面關(guān)系,可視化輔助用戶獲取和探索知識(shí),使知識(shí)圖譜與話題樹結(jié)構(gòu)互補(bǔ)。這將完整呈現(xiàn)問答內(nèi)容全貌,揭示隱含關(guān)系和規(guī)律,促進(jìn)社區(qū)新討論和知識(shí)產(chǎn)生。
2.信息組織的優(yōu)化
弱化用戶主觀對(duì)信息分類的影響。信息組織優(yōu)化本質(zhì)上是對(duì)信息的優(yōu)先選擇。同一內(nèi)容可能因用戶自定義關(guān)鍵詞不同而無法組織在一起,導(dǎo)致數(shù)據(jù)冗余,降低信息獲取效率。因此,建議利用標(biāo)簽推薦技術(shù),根據(jù)用戶行為習(xí)慣和資源內(nèi)容等信息,為用戶推薦合適的標(biāo)簽,減小用戶信息能力的主觀差距對(duì)網(wǎng)站信息資源分類的影響。
3.信息組織的美化
豐富話題標(biāo)簽在網(wǎng)站首頁的展示。信息組織的美化涉及頁面美觀及排布方式符合信息搜索和獲取的行為習(xí)慣。“知乎”僅顯示用戶關(guān)注的話題,限制了信息獲取的廣度和深度。建議顯示問題與話題的全部關(guān)聯(lián)信息,以增強(qiáng)用戶對(duì)問題背景的理解,促進(jìn)深入討論。通過相關(guān)話題提示,用戶可發(fā)現(xiàn)更多感興趣內(nèi)容,提升信息理解和吸收。
五、結(jié)束語
本文首先從信息資源、用戶標(biāo)簽和話題結(jié)構(gòu)三個(gè)方面對(duì)“知乎”網(wǎng)站信息分類體系進(jìn)行了總結(jié)概述,并將其與大眾分類和傳統(tǒng)分類法進(jìn)行了對(duì)比研究。在剖析知乎分類體系自身特點(diǎn)的基礎(chǔ)上,取其優(yōu)點(diǎn)對(duì)其他網(wǎng)站的信息組織工作提供參考借鑒,并依據(jù)信息組織的基本原理對(duì)其存在的問題提出了改進(jìn)建議。在后續(xù)研究中,可以深入探討具體的實(shí)現(xiàn)方法和措施,為網(wǎng)站的信息組織提供建議和參考。
參考文獻(xiàn):
[1]唐煒.大型綜合性中文門戶網(wǎng)站信息組織體系分析[J].圖書情報(bào)工作,2005(2):27-31,72.
[2]楊帥旗.公眾分類在醫(yī)療門戶網(wǎng)站信息資源組織中的應(yīng)用研究[D].北京:北京交通大學(xué),2017.
[3]劉佳美,陳祖芬.德國聯(lián)邦檔案館專題門戶網(wǎng)站在線互動(dòng)分析及啟示[J].檔案管理,2024(5):126-128.
[4]儲(chǔ)節(jié)旺,李瑩瑩.國外MOOC網(wǎng)站信息資源組織比較研究[J].圖書館學(xué)研究,2016(12):45-49,31.
[5]凌宇飛.四川省高校圖書館網(wǎng)站信息組織現(xiàn)狀調(diào)查分析[J].河南圖書館學(xué)刊,2016(2):24-26.
[6]陸炫冰,李霞.國內(nèi)數(shù)據(jù)新聞交互現(xiàn)狀及提升策略研究:以新華網(wǎng)和澎湃新聞為例[J].互聯(lián)網(wǎng)周刊,2023(6):51-53.
[7]朱愛菊.從對(duì)人的關(guān)注和瀏覽中獲取信息:新浪微博中的信息組織與信息獲取機(jī)制分析[J].情報(bào)雜志,2011(5):161-164.
[8]熊回香,金曉耕.Web2.0環(huán)境下信息組織的優(yōu)化研究:以豆瓣網(wǎng)為例[J].現(xiàn)代情報(bào),2012(4):19-24.
[9]王震霄.Web2.0技術(shù)在圖書館網(wǎng)站建設(shè)與服務(wù)中的應(yīng)用研究[J].信息系統(tǒng)工程,2020(3):17-18.
作者簡介:周海濱(1984—),男,漢族,黑龍江七臺(tái)河人,博士,副教授,研究方向?yàn)榻逃龑W(xué)、管理學(xué)。丁川芮(1993—),女,漢族,四川成都人,單位為西南科技大學(xué),研究方向?yàn)樾畔鞑ヅc管理。
通信作者:何羽霏(1987—),女,漢族,四川成都人,單位為,研究方向?yàn)閯?chuàng)新管理、教育管理。
(責(zé)任編輯:趙良)