摘 要: [目的/ 意義] 現(xiàn)行法律法規(guī)和行業(yè)標(biāo)準(zhǔn)對(duì)人社數(shù)據(jù)提出分級(jí)保護(hù), 但缺乏定量依據(jù), 本文定量測(cè)度人社數(shù)據(jù)隱私值, 探索解決該問題。[方法/ 過程] 普查人社隱私相關(guān)文獻(xiàn), 建立人社隱私文本庫; 構(gòu)建人社隱私詞表框架, 建立人社敏感詞表, 進(jìn)行人社數(shù)據(jù)敏感性識(shí)別; 設(shè)計(jì)隱私計(jì)量模型, 測(cè)度人社數(shù)據(jù)隱私值。[結(jié)果/ 結(jié)論] 計(jì)量結(jié)果表明, 人社數(shù)據(jù)隱私值由高到低為: 工資與保險(xiǎn)福利數(shù)據(jù)、專業(yè)技術(shù)數(shù)據(jù)、行政工作數(shù)據(jù)、個(gè)人基礎(chǔ)數(shù)據(jù)和入職流動(dòng)數(shù)據(jù)。本文挖掘客觀存在的人社隱私文本, 計(jì)量結(jié)果具有客觀性, 為人社數(shù)據(jù)分級(jí)提供更科學(xué)的依據(jù)。
關(guān)鍵詞: 人社數(shù)據(jù); 數(shù)據(jù)隱私; 隱私計(jì)量; 敏感性識(shí)別
DOI:10.3969 / j.issn.1008-0821.2025.05.008
〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821 (2025) 05-0077-12
人力資源和社會(huì)保障部(簡(jiǎn)稱“人社部”)服務(wù)業(yè)務(wù)主要包括就業(yè)創(chuàng)業(yè)、社會(huì)保障、人才人事、勞動(dòng)關(guān)系等。個(gè)人人社數(shù)據(jù)指人社部門為用戶提供服務(wù)過程中采集、調(diào)用和制作的個(gè)人數(shù)據(jù)[1] , 簡(jiǎn)稱“人社數(shù)據(jù)”。隱私指隱私主體對(duì)隱私客體的敏感性認(rèn)知[2] , 針對(duì)個(gè)人人社數(shù)據(jù), 隱私主體是使用人社服務(wù)的公眾, 隱私客體為個(gè)人人社數(shù)據(jù)項(xiàng)。因此,人社數(shù)據(jù)隱私是指?jìng)€(gè)人在接受人社服務(wù)時(shí)對(duì)被采集的個(gè)人數(shù)據(jù)的敏感性認(rèn)知, 也是人社部門對(duì)個(gè)人數(shù)據(jù)在其生命周期內(nèi)被采集使用過程中涉及的個(gè)人隱私, 稱為“人社隱私”。
數(shù)智時(shí)代背景下, 人社部門建成了人社業(yè)務(wù)服務(wù)的“大平臺(tái)”, 構(gòu)成了全國(guó)聯(lián)動(dòng)的“大系統(tǒng)”, 形成了人社領(lǐng)域的“全數(shù)據(jù)共享、全服務(wù)上網(wǎng)、全業(yè)務(wù)用卡” 的應(yīng)用格局, 產(chǎn)生了海量人社數(shù)據(jù)?;趯?duì)該類數(shù)據(jù)分析與使用, 人社部門可以提高業(yè)務(wù)效率, 開展人力資源市場(chǎng)運(yùn)行監(jiān)測(cè), 制定更加科學(xué)合理的政策, 政策實(shí)施更加精準(zhǔn)有力。但同時(shí)會(huì)產(chǎn)生人社數(shù)據(jù)泄露, 損害用戶個(gè)人利益, 影響社會(huì)穩(wěn)定,威脅國(guó)家安全, 如: 上萬份簡(jiǎn)歷信息被明碼標(biāo)價(jià)、打包出售形成黑色產(chǎn)業(yè)鏈[4] , 在求職平臺(tái)發(fā)布虛假兼職信息、出售求職者個(gè)人簡(jiǎn)歷信息非法獲利[5] 等。對(duì)此, 國(guó)家制定法律法規(guī), 人社部門制定行業(yè)標(biāo)準(zhǔn),保護(hù)人社數(shù)據(jù)安全, 并將分級(jí)保護(hù)作為基本制度,如《中華人民共和國(guó)個(gè)人信息保護(hù)法》《中華人民共和國(guó)數(shù)據(jù)安全法》《全國(guó)干部、人事管理信息系統(tǒng)指標(biāo)體系與數(shù)據(jù)結(jié)構(gòu)》《全國(guó)公安人事管理信息結(jié)構(gòu)體系》等, 但均缺少分級(jí)的定量客觀依據(jù), 致使分級(jí)保護(hù)制度無法落地。
1 實(shí)踐與研究進(jìn)展
數(shù)字人社建設(shè)產(chǎn)生海量人社數(shù)據(jù), 人社數(shù)據(jù)開放利用與隱私保護(hù)構(gòu)成尖銳矛盾, 為了解決這一矛盾, 業(yè)界的實(shí)踐和學(xué)界的研究均取得一定成果。
1. 1 業(yè)界的實(shí)踐
業(yè)界的實(shí)踐研究集中在隱私保護(hù)方面, 采用的工具主要有行業(yè)標(biāo)準(zhǔn)和法律法規(guī), 相關(guān)研究匯總?cè)绫恚?所示。
行業(yè)標(biāo)準(zhǔn)方面, 國(guó)內(nèi)和國(guó)際在人力資源方面的標(biāo)準(zhǔn)制定都側(cè)重在人力資源的術(shù)語界定和人力資源服務(wù)的規(guī)則規(guī)范兩個(gè)方面: 社會(huì)保障方面, 國(guó)際標(biāo)準(zhǔn)明顯比國(guó)內(nèi)的更具體、更全面; 法律法規(guī)方面,國(guó)內(nèi)制定的多為普適性的隱私保護(hù)法律法規(guī), 缺少專門針對(duì)人社數(shù)據(jù)的法律法規(guī), 國(guó)外制定的法律法規(guī)專指性較強(qiáng), 如美、英、日都有出臺(tái)關(guān)于人社數(shù)據(jù)保護(hù)框架和保護(hù)措施的相關(guān)法律法規(guī)。
1. 2 學(xué)術(shù)界的研究
學(xué)術(shù)界在人社數(shù)據(jù)領(lǐng)域的研究集中在隱私保護(hù)、隱私計(jì)量和文本挖掘3 個(gè)方面, 相關(guān)研究匯總?cè)绫恚菜尽?/p>
學(xué)術(shù)界對(duì)人社數(shù)據(jù)隱私保護(hù)方面的研究集中在管理和技術(shù)兩個(gè)層面: 管理層面的研究主要是對(duì)人社部門或人社管理部門提出要求; 技術(shù)層面的研究主要在人社數(shù)據(jù)的“用前、用中、用后” 進(jìn)行各類技術(shù)保護(hù), 以提升人社數(shù)據(jù)隱私安全。學(xué)術(shù)界對(duì)相關(guān)領(lǐng)域隱私計(jì)量研究主要有上述4 種方法, 但各有優(yōu)劣。學(xué)術(shù)界對(duì)相關(guān)領(lǐng)域文本挖掘的研究較為成熟,無論是文本特征提取還是文本標(biāo)簽化處理, 都有較成熟的技術(shù)可借鑒參考。
1. 3 述 評(píng)
綜上, 業(yè)界實(shí)踐的研究均將數(shù)據(jù)分級(jí)保護(hù)作為基本制度, 但缺失分級(jí)的定量依據(jù)。學(xué)界研究的主要領(lǐng)域中, 人社數(shù)據(jù)隱私保護(hù)側(cè)重管理對(duì)策和技術(shù)方法, 缺乏具體分級(jí)保護(hù)方案; 隱私計(jì)量均采用體現(xiàn)意愿價(jià)值的用戶調(diào)查, 結(jié)果會(huì)導(dǎo)致主觀性偏強(qiáng),產(chǎn)生假設(shè)性偏誤; 文本挖掘的對(duì)象少見人社文本報(bào)道, 但可供借鑒并進(jìn)行人社文本的適用性改造后,可用于本文的研究。
本文以“識(shí)別來源→識(shí)別模型→隱私計(jì)量” 為邏輯思路, 進(jìn)行人社數(shù)據(jù)的敏感性識(shí)別與隱私計(jì)量研究。首先調(diào)查人社隱私文本的生產(chǎn)者作為該類數(shù)據(jù)的隱私主體, 依據(jù)隱私主體生產(chǎn)的人社行業(yè)文獻(xiàn)建立隱私文本庫, 作為識(shí)別來源; 其次挖掘人社隱私文本庫, 構(gòu)建人社數(shù)據(jù)語義詞表, 作為識(shí)別模型;最后分析人社數(shù)據(jù)隱私性影響因素, 構(gòu)建計(jì)量指標(biāo),進(jìn)行人社隱私計(jì)量。計(jì)量結(jié)果彌補(bǔ)了傳統(tǒng)調(diào)查方法的主觀性導(dǎo)致假設(shè)性偏誤的不足, 可以作為人社數(shù)據(jù)隱私分級(jí)的客觀定量依據(jù)。
2 理論基礎(chǔ)
本文采用隱私界定理論構(gòu)建人社隱私文本庫,使用句法結(jié)構(gòu)理論建立人社數(shù)據(jù)敏感性識(shí)別模型,運(yùn)用情感評(píng)價(jià)理論、計(jì)量語言學(xué)理論設(shè)計(jì)隱私計(jì)量模型。
隱私界定理論: “隱私” 一詞在中國(guó)最早出現(xiàn)于周朝初年[33] , 國(guó)外于1890 年由Warren S D 等[35]提出。目前, 學(xué)術(shù)界還未形成統(tǒng)一的概念定義, 但在隱私構(gòu)成本質(zhì)上趨于一致, 即隱私的本質(zhì)是隱私主體對(duì)隱私客體的敏感性和敏感程度的認(rèn)知, 隱私計(jì)量就是對(duì)這種認(rèn)知進(jìn)行的定量測(cè)度。依據(jù)這一隱私界定理論, 本研究針對(duì)人社行業(yè)領(lǐng)域數(shù)據(jù), 調(diào)查歸納隱私主體的類型, 普查各類隱私主體生產(chǎn)的該行業(yè)領(lǐng)域文獻(xiàn), 建立人社隱私文本庫, 形成人社數(shù)據(jù)敏感性識(shí)別的來源。
漢語句法結(jié)構(gòu)理論: 由趙元任在《國(guó)語入門》首創(chuàng), 朱德熙在《語法講義》中完善[36] 。任一種句法結(jié)構(gòu)中, 句子是表達(dá)完整語義的基本單元, 主語必不可少[37] 。本研究依據(jù)該理論, 針對(duì)人社隱私文本庫進(jìn)行句法分析, 抽取包含人社敏感數(shù)據(jù)項(xiàng)的句子作為人社敏感數(shù)據(jù)單元。
情感評(píng)價(jià)理論: 又稱意見挖掘, 最早由美國(guó)MIT媒體實(shí)驗(yàn)室的Picard R W[38] 教授提出, 認(rèn)為情感計(jì)算包括3 個(gè)部分: 情感識(shí)別、情感發(fā)生、情感表達(dá)。文本情感分析涉及多個(gè)學(xué)科領(lǐng)域, 如語言學(xué)、心理學(xué)、認(rèn)知科學(xué)、數(shù)據(jù)挖掘等[39] , 目前學(xué)界借鑒該理論針對(duì)自然語言文本, 挖掘人們對(duì)不同主題、不同屬性、不同分類的觀點(diǎn)和態(tài)度[40] 。本文采用情感評(píng)價(jià)理論, 針對(duì)人社隱私程度詞進(jìn)行情感傾向和語義態(tài)度的評(píng)價(jià), 以此設(shè)置不同類型程度詞的強(qiáng)度值, 服務(wù)于人社敏感數(shù)據(jù)的隱私計(jì)量。
計(jì)量語言學(xué)理論: 于1935 年由Zipf G K 首次提出, 后來K?hler R[41] 教授提出協(xié)同語言學(xué)理論架構(gòu), 豐富其理論內(nèi)涵, 現(xiàn)學(xué)界以該理論為基礎(chǔ), 主要通過定量方法對(duì)各種語言現(xiàn)象和語義結(jié)構(gòu)進(jìn)行測(cè)量、建模與解釋。本文基于該理論, 針對(duì)建立的人社隱私語料庫, 進(jìn)行人社敏感詞匯單元結(jié)構(gòu)及其關(guān)系的語義分析, 統(tǒng)計(jì)人社敏感詞匯中數(shù)據(jù)項(xiàng)的出現(xiàn)頻率與文本占比, 計(jì)算敏感動(dòng)詞和程度詞的語義強(qiáng)度, 測(cè)度人社數(shù)據(jù)的隱私值。
3 人社數(shù)據(jù)隱私文本庫
人社數(shù)據(jù)隱私文本是對(duì)人社數(shù)據(jù)的術(shù)語界定、隱私保護(hù)、隱私泄露、開放共享、管理規(guī)范等進(jìn)行論述和探討的各類文獻(xiàn)。根據(jù)文本的側(cè)重點(diǎn)不同,確定隱私文本類型, 建立人社數(shù)據(jù)隱私文本庫。
3. 1 隱私文本類型
不同的社會(huì)群體對(duì)人社數(shù)據(jù)隱私的學(xué)術(shù)研究和實(shí)踐探討的角度存在差異, 參考已有的研究[43] , 將人社數(shù)據(jù)文本分為以下4 種類型: 行業(yè)標(biāo)準(zhǔn)、法律法規(guī)、學(xué)術(shù)論著、泄露案例。
人社行業(yè)標(biāo)準(zhǔn)反映了人社領(lǐng)域管理者對(duì)人社數(shù)據(jù)的重要性認(rèn)知, 既是人社數(shù)據(jù)安全實(shí)踐者對(duì)人社數(shù)據(jù)的分類分級(jí)和隱私保護(hù)管理的工作指南, 又是人社數(shù)據(jù)處理者進(jìn)行這類數(shù)據(jù)采集、傳輸、保存、使用和刪除等操作的行為準(zhǔn)則, 包括人社數(shù)據(jù)的數(shù)據(jù)項(xiàng)界定、安全分級(jí)規(guī)則、數(shù)據(jù)共享開放屬性與條件等。
法律法規(guī)反映了法學(xué)理論界對(duì)人社數(shù)據(jù)的敏感性認(rèn)知, 既是人社數(shù)據(jù)的數(shù)據(jù)主體、使用者和擁有者等利益相關(guān)方處理該類數(shù)據(jù)的法律依據(jù), 也是國(guó)家為保護(hù)個(gè)人權(quán)益、維護(hù)社會(huì)穩(wěn)定和國(guó)家安全等所需要的法律保障, 包括相關(guān)國(guó)家法律、政府法規(guī)、部門規(guī)章和管理?xiàng)l例等。
學(xué)術(shù)論著反映了專家學(xué)者對(duì)人社數(shù)據(jù)的敏感性認(rèn)知, 既是學(xué)術(shù)界進(jìn)行的相關(guān)理論探討, 也是法律界制定和完善人社數(shù)據(jù)保護(hù)法律的知識(shí)來源, 因?yàn)樾录夹g(shù)使用產(chǎn)生的人社數(shù)據(jù)隱私管理新問題, 學(xué)術(shù)研究在前, 法律納入在后, 包括數(shù)字技術(shù)和數(shù)智網(wǎng)絡(luò)等應(yīng)用于人社業(yè)務(wù)數(shù)字化轉(zhuǎn)型所產(chǎn)生的人社數(shù)據(jù)安全的挑戰(zhàn)、問題與對(duì)策等。
泄露案例反映了數(shù)據(jù)竊取者對(duì)人社數(shù)據(jù)的價(jià)值認(rèn)知, 既有各類媒體發(fā)布的人社數(shù)據(jù)泄露事件的報(bào)道, 也有司法機(jī)關(guān)對(duì)人社數(shù)據(jù)泄露案件的判決文書,包括最高人民法院的指導(dǎo)性案例、高級(jí)人民法院的典型案例、中級(jí)人民法院的示范案例和基層人民法院的普通案例等。
3. 2 隱私文本庫的建立
隱私文本庫的建立包括設(shè)置文本篩選原則、確定檢索詞、構(gòu)建檢索策略、選擇檢索平臺(tái)、篩選目標(biāo)文本等步驟。
篩選原則: ①主題相關(guān)原則, 文獻(xiàn)主題限定“人社”, 包括人事管理數(shù)據(jù)、人力資源數(shù)據(jù)、社會(huì)保險(xiǎn)數(shù)據(jù)、就業(yè)服務(wù)數(shù)據(jù)等。②類型針對(duì)原則, 文獻(xiàn)類型限定為行業(yè)標(biāo)準(zhǔn)、法律法規(guī)、學(xué)術(shù)論著、泄密案例。③內(nèi)容時(shí)效原則, 行業(yè)標(biāo)準(zhǔn)和法律法規(guī)均限定為現(xiàn)行文件, 學(xué)術(shù)論著限定為近十年, 泄露案例均為官方發(fā)布。
檢索詞: “就業(yè)數(shù)據(jù)” “人力資源” “人事數(shù)據(jù)”“勞動(dòng)合同” “簡(jiǎn)歷” “社會(huì)保險(xiǎn)” “檔案管理” “學(xué)術(shù)不端” “學(xué)術(shù)失范” “隱私” 等。
檢索平臺(tái)與檢索字段: ①行業(yè)標(biāo)準(zhǔn), 《中國(guó)知網(wǎng)標(biāo)準(zhǔn)數(shù)據(jù)總庫》《全國(guó)標(biāo)準(zhǔn)信息公共服務(wù)平臺(tái)》、稻殼巴巴、百度文庫等平臺(tái)檢索, 檢索途徑為“篇關(guān)摘” (篇名+關(guān)鍵詞+摘要)。②法律法規(guī), 《北大法寶: 法律法規(guī)庫》, 檢索途徑為“標(biāo)題” 和“全文”。③學(xué)術(shù)論著, 《中國(guó)知網(wǎng)》, 檢索途徑為“主題”, 以核心期刊為主。④泄露案例, 《北大法寶:司法案例庫》、裁判文書網(wǎng), 檢索途徑為“標(biāo)題” 和“全文”, 限定法院級(jí)別。
隱私文本庫: 檢索時(shí)間為2024 年3 月10 日—12 日。上述四類文本的檢索結(jié)果分別為: 行業(yè)標(biāo)準(zhǔn)87 篇、法律法規(guī)35 篇、學(xué)術(shù)論著108 篇、泄露案例80 篇。依據(jù)篩選條件對(duì)四類文本的檢索結(jié)果進(jìn)行篩選, 篩選結(jié)果依次是: 行業(yè)標(biāo)準(zhǔn)59 篇、法律法規(guī)29 篇、學(xué)術(shù)論著100 篇、泄露案例77 篇。
4 人社數(shù)據(jù)敏感詞表構(gòu)建
人社敏感數(shù)據(jù)單元是構(gòu)建人社數(shù)據(jù)敏感詞表的基礎(chǔ), 具體流程包括人社敏感詞表框架的構(gòu)建和敏感詞提取, 具體邏輯如圖1 所示。
4. 1 人社敏感數(shù)據(jù)單元
人社敏感數(shù)據(jù)單元指人社隱私數(shù)據(jù)文本中包含人社數(shù)據(jù)項(xiàng)的句子。本文將這些句子中包含的人社數(shù)據(jù)項(xiàng)、動(dòng)詞、形容詞和副詞分別稱為人社敏感名詞、敏感動(dòng)詞、敏感程度詞。建立步驟: ①清洗人社隱私文本, 形成規(guī)范化的純文本文件; ②自編代碼識(shí)別包含人社敏感名詞的句子, 形成人社敏感數(shù)據(jù)單元集合, 示例如表3 所示。
4. 2 敏感名詞表
詞表框架。訪問人社部網(wǎng)站, 獲得人社部門的業(yè)務(wù)服務(wù)模塊; 瀏覽人社數(shù)據(jù)相關(guān)行業(yè)標(biāo)準(zhǔn), 獲得人社數(shù)據(jù)項(xiàng)的分級(jí)結(jié)構(gòu); 實(shí)地調(diào)查人社部門, 獲取實(shí)踐部門采集和制作的人社數(shù)據(jù)類型。綜合3 個(gè)來源, 歸納人社數(shù)據(jù)類型為: 個(gè)人基礎(chǔ)數(shù)據(jù)、入職流動(dòng)數(shù)據(jù)、行政工作數(shù)據(jù)、專業(yè)技術(shù)數(shù)據(jù)、工資保險(xiǎn)福利。
敏感名詞的采集。敏感名詞也即人社數(shù)據(jù)項(xiàng),來源有三: 一是國(guó)家標(biāo)準(zhǔn)《全國(guó)干部、人事管理信息系統(tǒng)指標(biāo)體系與數(shù)據(jù)結(jié)構(gòu)》中人社數(shù)據(jù)項(xiàng)。二是實(shí)地調(diào)查人社部門采集和制作的數(shù)據(jù)項(xiàng)。三是自編Python 代碼, 利用“Jieba” 分詞詞庫, 遍歷人社數(shù)據(jù)隱私文本庫, 抽取人社文本中的數(shù)據(jù)項(xiàng)。融合上述3 個(gè)來源, 形成人社敏感名詞集合。
敏感名詞的處理。一是針對(duì)人社敏感名詞集合,人工識(shí)別同義詞、多義詞和含義含糊詞, 分別進(jìn)行聚類、詞義限定和詞義加注等方式處理, 提升人社敏感名詞的語義準(zhǔn)確性。二是使用《同義詞詞林》《近義詞詞典》等詞匯工具和PMI 點(diǎn)間互信息法擴(kuò)充敏感名詞, 提高敏感名詞表的覆蓋度。三是采用詞項(xiàng)共現(xiàn)關(guān)系算法計(jì)算敏感詞匯之間的語義關(guān)聯(lián)度,判別詞匯收錄的合理性。
將采集并處理后的敏感名詞歸入名詞表框架,形成人社敏感名詞表, 如表4 所示。
4. 3 敏感動(dòng)詞表
動(dòng)詞詞表框架: 參考行業(yè)標(biāo)準(zhǔn)和相關(guān)法規(guī), 歸類總結(jié)人社敏感動(dòng)詞類型包括采集、傳輸、存儲(chǔ)、使用、共享、銷毀6 個(gè)階段。此外, 該6 個(gè)階段對(duì)人社敏感數(shù)據(jù)進(jìn)行操作時(shí)均有可能產(chǎn)生風(fēng)險(xiǎn), 或可能進(jìn)行風(fēng)險(xiǎn)規(guī)避活動(dòng), 因此, 動(dòng)詞表框架增加“風(fēng)險(xiǎn)產(chǎn)生操作” 和“風(fēng)險(xiǎn)規(guī)避操作” 兩個(gè)類型。
敏感動(dòng)詞的采集: 利用自編Python 代碼及“Jie?ba” 分詞詞庫, 遍歷人社敏感數(shù)據(jù)單元, 識(shí)別出操作敏感名詞的動(dòng)詞, 形成人社敏感動(dòng)詞集合。
敏感動(dòng)詞詞匯的強(qiáng)度: 人社敏感動(dòng)詞表中的前6 種數(shù)據(jù)類型是對(duì)人社數(shù)據(jù)隱私風(fēng)險(xiǎn)的間接操作,后兩種類型是對(duì)人社數(shù)據(jù)隱私風(fēng)險(xiǎn)的直接操作, 后者的操作強(qiáng)度高于前者, 因此, 前六類賦值“1”,后兩類賦值“2”, 如表5 所示。
4. 4 敏感程度詞表
敏感程度詞表框架: 依據(jù)敏感數(shù)據(jù)單元, 敏感程度詞包括副詞和形容詞。程度詞修飾方向有正反之分。因此, 劃分人社敏感程度詞類型為: 修飾人社敏感動(dòng)詞的正向程度詞、修飾人社敏感動(dòng)詞的負(fù)向程度詞、限定人社敏感名詞的程度詞等三類。
敏感程度詞匯的采集: 利用自編Python 代碼及“Jieba” 分詞詞庫, 遍歷人社敏感數(shù)據(jù)單元, 自動(dòng)識(shí)別出修飾操作敏感動(dòng)詞和敏感名詞的程度詞, 形成人社敏感程度詞集合。
敏感程度詞的強(qiáng)度: 依據(jù)情感評(píng)價(jià)理論, 參考已有研究中的情感評(píng)價(jià)結(jié)果[42] , 修飾人社敏感動(dòng)詞的正向和負(fù)向程度詞強(qiáng)度分別為“1” 和“2”, 修飾敏感名詞的程度詞強(qiáng)度按照輕、中、強(qiáng)3 個(gè)級(jí)別分別賦值“1” “2” “3”, 如表6 所示。
5 人社數(shù)據(jù)隱私計(jì)量
在上述構(gòu)建的人社敏感詞表基礎(chǔ)上, 分析影響因素、設(shè)計(jì)計(jì)量模型, 對(duì)人社數(shù)據(jù)隱私進(jìn)行計(jì)量。
5. 1 人社數(shù)據(jù)隱私的影響因素
隱私具有情境依賴性, 針對(duì)本項(xiàng)研究, 人社文本的語境構(gòu)成了人社數(shù)據(jù)的隱私情境。具體來說,文本類型是人社數(shù)據(jù)的宏觀語境, 人社敏感數(shù)據(jù)單元是人社數(shù)據(jù)的中觀語境, 人社數(shù)據(jù)本身是其微觀語境。因此, 可以從該3 個(gè)維度考察人社數(shù)據(jù)隱私的影響因素。
文本力度: 不同類型文本對(duì)人社數(shù)據(jù)的作用力度不同, 同一類型中不同來源文本對(duì)人社數(shù)據(jù)的作用力度也存在差異。宏觀上, 4 種類型人社文本的作用不同: 法律法規(guī)用于保護(hù)數(shù)據(jù), 行業(yè)標(biāo)準(zhǔn)用于操作數(shù)據(jù), 學(xué)術(shù)論著用于探討數(shù)據(jù), 泄露案例用于違法違規(guī)使用數(shù)據(jù); 微觀上, 法律法規(guī)的頒布機(jī)構(gòu)有全國(guó)人大、國(guó)務(wù)院、省部級(jí)單位, 頒布機(jī)構(gòu)權(quán)威性影響法律文本的效用力度。泄露案例的發(fā)布機(jī)構(gòu)有最高人民法院、中高級(jí)人民法院、基層人民法院等, 發(fā)布機(jī)構(gòu)的權(quán)威性也影響案例文本的效用力度。學(xué)術(shù)論著的影響因子有引用頻次和下載次數(shù), 體現(xiàn)了該類文本的學(xué)術(shù)質(zhì)量, 質(zhì)量高低也影響論著文本的效用力度。
語義強(qiáng)度: 在人社敏感數(shù)據(jù)單元的語境中, 圍繞人社數(shù)據(jù)項(xiàng), 敏感動(dòng)詞對(duì)其進(jìn)行直接操作, 敏感程度詞對(duì)其進(jìn)行直接和間接修飾。不同類型敏感動(dòng)詞的操作強(qiáng)度存在差異, 操作頻次高低影響操作強(qiáng)度。同樣, 不同類型敏感程度詞的修飾強(qiáng)度也有差異, 修飾頻次高低也影響修飾強(qiáng)度。操作強(qiáng)度和修飾強(qiáng)度構(gòu)成了人社敏感數(shù)據(jù)的語義強(qiáng)度。
人社數(shù)據(jù)項(xiàng)的敏感性: 針對(duì)人社數(shù)據(jù)項(xiàng)本身,影響其重要程度的因素有兩個(gè): 在隱私文本中的出現(xiàn)頻次和出現(xiàn)文本的占比。針對(duì)前者, 隱私數(shù)據(jù)項(xiàng)出現(xiàn)頻次越高, 說明數(shù)據(jù)項(xiàng)被研究討論的程度越高,反映數(shù)據(jù)項(xiàng)越重要, 體現(xiàn)數(shù)據(jù)項(xiàng)價(jià)值越大; 針對(duì)后者, 數(shù)據(jù)項(xiàng)出現(xiàn)文本占比越大, 表明數(shù)據(jù)項(xiàng)被研究討論的范圍越大, 關(guān)注的群體和人數(shù)越多, 體現(xiàn)數(shù)據(jù)項(xiàng)價(jià)值越大。
5. 2 人社隱私計(jì)量模型
根據(jù)上述對(duì)人社數(shù)據(jù)隱私的影響因素分析, 建立人社隱私計(jì)量模型, 如圖2 所示。
根據(jù)人社隱私計(jì)量模型, 結(jié)合本項(xiàng)研究對(duì)人社隱私文本相關(guān)指標(biāo)的統(tǒng)計(jì)結(jié)果分布情況, 對(duì)各個(gè)計(jì)量指標(biāo)進(jìn)行量化, 如表7 所示。
根據(jù)人社隱私計(jì)量模型, 不同指標(biāo)計(jì)量結(jié)果的融合操作需要計(jì)算指標(biāo)權(quán)值。本研究調(diào)研了3 名人社領(lǐng)域的專家和2 名數(shù)據(jù)隱私領(lǐng)域的專家, 對(duì)涉及的指標(biāo)兩兩對(duì)比, 從1~9(重要程度依次遞增)進(jìn)行三角模糊數(shù)打分。根據(jù)打分結(jié)果, 構(gòu)建模糊判斷矩陣, 表8 所示的是指標(biāo){X,Y,Z}的判斷矩陣。
運(yùn)行基于三角模糊數(shù)改進(jìn)的模糊層次分析算法, 得出權(quán)重結(jié)果{X,Y,Z}的權(quán)重為(0. 23,0. 49,0. 28)。同樣, 按照上述步驟, 計(jì)算其他指標(biāo)之間的權(quán)值結(jié)果為: {X1,X2,X3,X4}的權(quán)重為(0. 40,0. 30,0. 20,0. 10), {Y1,Y2}的權(quán)重為(0. 44,0. 56),{Z1,Z2}的權(quán)重為(0. 58,0. 42)。
5. 3 人社隱私計(jì)量結(jié)果
依據(jù)計(jì)量模型, 針對(duì)人社隱私文本進(jìn)行計(jì)量的結(jié)果如表9 所示。
5. 3. 1 基于人社數(shù)據(jù)類型的分析
人社數(shù)據(jù)類型隱私值計(jì)量。依據(jù)人社敏感數(shù)據(jù)表的三級(jí)結(jié)構(gòu)“數(shù)據(jù)類型—數(shù)據(jù)條目—數(shù)據(jù)項(xiàng)目”,結(jié)合隱私計(jì)量模型進(jìn)行數(shù)據(jù)項(xiàng)隱私值測(cè)度的結(jié)果,按照數(shù)據(jù)級(jí)別依次累加其隱私值生成上級(jí)數(shù)據(jù)的隱私值, 這樣, 數(shù)據(jù)項(xiàng)目隱私值疊加產(chǎn)生數(shù)據(jù)條目隱私值, 而數(shù)據(jù)條目隱私值相加計(jì)量出數(shù)據(jù)類型隱私值, 故數(shù)據(jù)類型隱私值大小取決于所包含數(shù)據(jù)項(xiàng)的數(shù)量和各個(gè)數(shù)據(jù)項(xiàng)隱私值。依據(jù)表4 中各數(shù)據(jù)類型所含數(shù)據(jù)項(xiàng)的數(shù)量和表9 中各數(shù)據(jù)項(xiàng)的隱私值, 計(jì)量數(shù)據(jù)類型隱私值如下(降序排列): 工資與保險(xiǎn)福利數(shù)據(jù)(214. 25)、專業(yè)技術(shù)數(shù)據(jù)(192. 86)、行政工作數(shù)據(jù)(173. 09)、個(gè)人基礎(chǔ)數(shù)據(jù)(153. 23)和入職流動(dòng)數(shù)據(jù)(150. 05), 具體分析如下:
工資與保險(xiǎn)福利數(shù)據(jù)的隱私值第一(214. 25)。工資是勞動(dòng)者提供勞動(dòng)后, 所得貨幣形式的勞動(dòng)報(bào)酬, 其支付金額通過法定用人單位依據(jù)法律規(guī)定、行業(yè)規(guī)定、與員工之間的約定等形式確定, 支付形式有時(shí)薪、月薪、年薪等; 社會(huì)保險(xiǎn)指一種為喪失勞動(dòng)能力或暫時(shí)失去勞動(dòng)崗位或因健康原因造成損失的個(gè)人提供收入或補(bǔ)償?shù)囊环N社會(huì)和經(jīng)濟(jì)制度,主要包括養(yǎng)老保險(xiǎn)、醫(yī)療保險(xiǎn)、失業(yè)保險(xiǎn); 個(gè)人福利是指在個(gè)人具備國(guó)家及所在用人單位規(guī)定的條件時(shí)可以享受的除工資和保險(xiǎn)之外的其他待遇, 包括喪葬撫恤救濟(jì)費(fèi)、冬季取暖補(bǔ)貼和生活困難補(bǔ)助等。綜上, 該類數(shù)據(jù)的內(nèi)容均為個(gè)人收入的金融性財(cái)產(chǎn),且一般不愿披露和被他人知曉。我國(guó)《中華人民共和國(guó)民法典》規(guī)定, 隱私是“自然人的私人生活安寧和不愿為他人知曉的私密空間、私密活動(dòng)、私密信息”, 因此該類數(shù)據(jù)具有隱私性。依據(jù)數(shù)據(jù)隱私的基本界定, 隱私是隱私主體對(duì)隱私客體的敏感程度認(rèn)識(shí), 隱私主體是數(shù)據(jù)中包含的能識(shí)別出自然人的數(shù)據(jù)項(xiàng), 隱私客體主要是數(shù)據(jù)內(nèi)嵌的體現(xiàn)隱私主體的人格屬性和財(cái)產(chǎn)屬性的內(nèi)容, 由此, 該類數(shù)據(jù)隱私主要反映了員工的個(gè)人財(cái)產(chǎn)屬性。員工的工資與保險(xiǎn)福利是基礎(chǔ)性的核心財(cái)產(chǎn), 其他類型財(cái)產(chǎn)(如房產(chǎn)等)大都是基于該核心財(cái)產(chǎn)的派生財(cái)產(chǎn), 故該類數(shù)據(jù)的財(cái)產(chǎn)屬性具有原始性, 其隱私性最高是合理的。已有多類型數(shù)據(jù)隱私性測(cè)度的相關(guān)研究中金融數(shù)據(jù)隱私值較高[43] , 而工資與保險(xiǎn)福利是基礎(chǔ)性金融資產(chǎn), 故驗(yàn)證了本研究的該項(xiàng)結(jié)論。
專業(yè)技術(shù)數(shù)據(jù)的隱私值位列第二(192. 86), 包括四類: 人才情況、專業(yè)技術(shù)職務(wù)、專業(yè)技術(shù)成果、專業(yè)技術(shù)違規(guī)。其中, 前三類都是個(gè)人學(xué)術(shù)成就的客觀呈現(xiàn), 集中在收獲的學(xué)術(shù)技術(shù)榮譽(yù)稱號(hào)、擔(dān)任的學(xué)術(shù)技術(shù)崗位、發(fā)表的學(xué)術(shù)技術(shù)論著、主持的科學(xué)技術(shù)項(xiàng)目、獲得的科學(xué)技術(shù)獎(jiǎng)勵(lì)、申請(qǐng)的科學(xué)技術(shù)專利等, 均為公開數(shù)據(jù), 直接個(gè)人人格和財(cái)產(chǎn)屬性的呈現(xiàn)性都不顯著, 隱私性均不大。第四類數(shù)據(jù)是事業(yè)單位(尤其學(xué)校和科研機(jī)構(gòu))專業(yè)技術(shù)人員的職業(yè)操守, 國(guó)家和相關(guān)部門頒布了相應(yīng)法律法規(guī)和制度規(guī)范進(jìn)行約束和處理, 政治紀(jì)律違規(guī)、教育教學(xué)失職、學(xué)術(shù)道德不端、工作作風(fēng)懈怠、生活作風(fēng)敗壞、廉潔從教從業(yè)失責(zé)等違法違規(guī)與失范行為都會(huì)受到嚴(yán)肅處理, 處分結(jié)果將給個(gè)人造成嚴(yán)重的負(fù)面影響, 產(chǎn)生巨大的精神和人格傷害甚至財(cái)產(chǎn)損失,故這類數(shù)據(jù)敏感性非常顯著。綜上, 專業(yè)技術(shù)數(shù)據(jù)的隱私值測(cè)度結(jié)果較高, 位列第二。
行政工作數(shù)據(jù)的隱私值位列第三(173. 09)。行政事業(yè)單位(國(guó)企參照該類單位進(jìn)行管理, 故合并一起)干部隊(duì)伍是核心。干部管理包括后備干部動(dòng)議、考察考核、公示任免、獎(jiǎng)勵(lì)處分等流程, 每個(gè)環(huán)節(jié)都可能包含個(gè)人重要內(nèi)容事項(xiàng), 如后備干部的選拔、培養(yǎng)和使用, 考察考核的意見和結(jié)果, 彼時(shí)個(gè)人身份和職務(wù), 警告處分、降職降級(jí)和免職撤職的原因等。這些管理活動(dòng)中采集、調(diào)用和制作大量的個(gè)人數(shù)據(jù), 其中不少數(shù)據(jù)內(nèi)容屬于數(shù)據(jù)主體不愿披露和被他人知曉的私密信息, 尤其是對(duì)個(gè)人產(chǎn)生較大負(fù)面作用、較為嚴(yán)重?fù)p傷個(gè)人人格的數(shù)據(jù)項(xiàng),如重要政治歷史活動(dòng)中的個(gè)人污點(diǎn)行為、擔(dān)任重要職務(wù)遭遇降職和撤職的原因, 這些數(shù)據(jù)項(xiàng)對(duì)數(shù)據(jù)主體具有較強(qiáng)的人格敏感性, 屬于人格性隱私。但是個(gè)人違規(guī)違法行為導(dǎo)致的經(jīng)濟(jì)和刑事犯罪問題就需移交給公安機(jī)關(guān)進(jìn)行偵查, 進(jìn)而產(chǎn)生的刑偵經(jīng)偵數(shù)據(jù)屬于隱私性更高的個(gè)人公安數(shù)據(jù), 不在人社數(shù)據(jù)范疇之中, 故行政工作數(shù)據(jù)的隱私值位列第三。
個(gè)人基礎(chǔ)數(shù)據(jù)(153.23)與入職流動(dòng)數(shù)據(jù)(150.05)的隱私值位列最后。個(gè)人基礎(chǔ)數(shù)據(jù)有四類: 標(biāo)識(shí)數(shù)據(jù)、半標(biāo)識(shí)數(shù)據(jù)、聯(lián)系數(shù)據(jù)、家庭成員及社會(huì)關(guān)系數(shù)據(jù)。前兩類數(shù)據(jù)分別承載著直接和間接的社會(huì)識(shí)別作用, 第三類數(shù)據(jù)提供社會(huì)聯(lián)系功能, 這三類數(shù)據(jù)都是個(gè)體融入社會(huì)成為社會(huì)一員的必要條件, 可能會(huì)成為“個(gè)體被外界打擾” 的原因(尤其聯(lián)系數(shù)據(jù))進(jìn)而產(chǎn)生早期含義的“隱私”[35] , 但它們體現(xiàn)的人格屬性和財(cái)產(chǎn)屬性較弱, 與現(xiàn)代管理學(xué)視角下的“數(shù)據(jù)主體對(duì)數(shù)據(jù)客體的敏感性認(rèn)知” 的“隱私” 界定契合程度不高, 它們的泄露導(dǎo)致數(shù)據(jù)主體的人格傷害和財(cái)產(chǎn)損失不大, 故這三類數(shù)據(jù)的隱私性較小; 第四類數(shù)據(jù)涉及關(guān)聯(lián)隱私, 即關(guān)注的對(duì)象是個(gè)人家庭和社會(huì)關(guān)系成員的“隱私”[12] , 但所具有的人格性和財(cái)產(chǎn)性也不大, 隱私性也較小。工作入職與工作流動(dòng)數(shù)據(jù)中, 前者包括錄聘和試用, 涉及的入職考試成績(jī)和試用期滿的考核具有一定敏感性;后者包括工作交流和崗位變化, 涉及的被“辭退”和被“開除” 可能會(huì)比較嚴(yán)重負(fù)面影響員工的人格; 其他數(shù)據(jù)的泄露對(duì)人格和財(cái)產(chǎn)造成的影響均甚微。綜上, 個(gè)人基礎(chǔ)數(shù)據(jù)和入職流動(dòng)數(shù)據(jù)的敏感性均不太顯著, 其隱私值均位于行政工作數(shù)據(jù)之后。
5. 3. 2 基于人社隱私文本的分析
人社隱私文本類型隱私值的計(jì)量。文本類型隱私值是一類文本中包含的所有敏感數(shù)據(jù)項(xiàng)隱私值的累加, 也是該類文本敏感程度的呈現(xiàn)。故, 文本中所含敏感數(shù)據(jù)項(xiàng)的出現(xiàn)頻次和隱私值是該類文本隱私值的兩個(gè)影響因素: 數(shù)據(jù)項(xiàng)出現(xiàn)頻次越高, 單項(xiàng)數(shù)據(jù)隱私值越大, 文本類型隱私值就越高, 反之,就越低; 文本數(shù)據(jù)項(xiàng)的出現(xiàn)頻次與文本體量息息相關(guān), 故后者也間接影響文本類型隱私值。依據(jù)表4統(tǒng)計(jì)各類文本中敏感數(shù)據(jù)項(xiàng)的出現(xiàn)頻次, 結(jié)合表9計(jì)量文本類型隱私值, 結(jié)果為(降序排列): 人社行業(yè)標(biāo)準(zhǔn)(314. 80)、相關(guān)法律法規(guī)(227. 24)、泄露案例(208. 90)、學(xué)術(shù)論著(179. 24), 具體分析如下:
行業(yè)標(biāo)準(zhǔn)的隱私值最高(314. 80)?!度珖?guó)干部、人事管理信息系統(tǒng)指標(biāo)體系與數(shù)據(jù)結(jié)構(gòu)》規(guī)范了人社數(shù)據(jù)的類型和數(shù)據(jù)項(xiàng), 通用性強(qiáng)。已有一些領(lǐng)域建立了對(duì)應(yīng)領(lǐng)域人社數(shù)據(jù)規(guī)范, 如公安領(lǐng)域的《全國(guó)公安人事管理信息結(jié)構(gòu)體系—第1 部分: 指標(biāo)體系分類與代碼》(GA393. 1-2002)和社保國(guó)家標(biāo)準(zhǔn)《社會(huì)保險(xiǎn)術(shù)語》及其《養(yǎng)老保險(xiǎn)術(shù)語》《醫(yī)療保險(xiǎn)術(shù)語》等, 專業(yè)特色比較鮮明。這些雖為現(xiàn)行標(biāo)準(zhǔn),但年久還未修訂, 新出現(xiàn)的數(shù)據(jù)項(xiàng)還未及時(shí)納入,且針對(duì)人社數(shù)據(jù)隱私及其保護(hù)的行業(yè)標(biāo)準(zhǔn)缺失。盡管如此, 這些文本界定的數(shù)據(jù)項(xiàng)仍是人社數(shù)據(jù)的核心。這些文本的關(guān)注重點(diǎn)是人社部門采集數(shù)據(jù)項(xiàng)的描述科學(xué)性和準(zhǔn)確性, 如社會(huì)關(guān)系、處分原因、專家待遇、工資總額、保險(xiǎn)福利等。
相關(guān)法律法規(guī)的隱私值次之(227. 24)。人力資源管理和社會(huì)保險(xiǎn)的法律法規(guī)較多, 如我國(guó)的《中華人民共和國(guó)社會(huì)保險(xiǎn)法》《人力資源市場(chǎng)暫行條例》《事業(yè)單位人事管理?xiàng)l例》等, 但針對(duì)人社數(shù)據(jù)隱私及其保護(hù)的法律法規(guī)缺失。涉及人社管理的相關(guān)法律法規(guī)較多, 如教育領(lǐng)域人事管理的國(guó)家《中華人民共和國(guó)教師法》和教育部《教師職業(yè)行為準(zhǔn)則及師德失范處理辦法》等, 但針對(duì)人社數(shù)據(jù)管理的法律法規(guī)缺乏。盡管如此, 統(tǒng)計(jì)這些文本中人社數(shù)據(jù)項(xiàng)仍能反映數(shù)據(jù)的價(jià)值。這些文本的關(guān)注重點(diǎn)是工作入職和師德師風(fēng)負(fù)面清單, 如學(xué)術(shù)道德不端、科研誠(chéng)信違規(guī)、學(xué)術(shù)造假、上崗方式、辭退原因等。
泄露案例的隱私值再次之(208. 90)。不法分子竊取個(gè)人隱私數(shù)據(jù)的核心目的不外乎兩個(gè)方面: 損害名譽(yù)和盜竊財(cái)產(chǎn), 在人社數(shù)據(jù)泄露案件中, 兩者的呈現(xiàn)也非常顯著。前者分散在入職流動(dòng)數(shù)據(jù)的試用考核結(jié)果和辭退原因、行政工作中的降職免職和撤職及其原因、專業(yè)技術(shù)工作中的師德師風(fēng)失范和學(xué)術(shù)不端及其處理結(jié)果, 這些數(shù)據(jù)的泄露都可能造成個(gè)體受到歧視乃至侮辱人格和遭遇勒索; 后者集中在工資與保險(xiǎn)福利數(shù)據(jù)中, 包含工資、獎(jiǎng)金、津貼以及社保金額和福利類型等, 這些均為個(gè)人金融性財(cái)產(chǎn), 其泄露和被盜可能導(dǎo)致個(gè)人財(cái)產(chǎn)的損失,嚴(yán)重時(shí)可能危害社會(huì)。
學(xué)術(shù)論著的隱私值最低(175. 47)。一般來講,法律法規(guī)和行業(yè)標(biāo)準(zhǔn)的主要作用是規(guī)范人們已達(dá)成共識(shí)的行為規(guī)則, 修訂周期較長(zhǎng); 學(xué)術(shù)論著的主要功能是探討新生事物, 發(fā)表周期短。所以, 對(duì)于新理論新方法產(chǎn)生的新型數(shù)據(jù)保護(hù)問題, 學(xué)者們探索在先, 法律法規(guī)納入在后。因此, 從出版時(shí)差角度,學(xué)術(shù)論著可以彌補(bǔ)法律滯后的缺憾; 從內(nèi)容成熟度視角, 學(xué)術(shù)論著可以作為法律法規(guī)的質(zhì)量把關(guān)者。結(jié)合人社數(shù)據(jù), 該類文本的關(guān)注重點(diǎn)在于出現(xiàn)較晚的師德規(guī)范問題, 如師德師風(fēng)、學(xué)術(shù)誠(chéng)信、學(xué)術(shù)不端等, 驗(yàn)證了學(xué)術(shù)論著與法律法規(guī)的關(guān)系。
6 結(jié)束語
本項(xiàng)研究的結(jié)論包含兩個(gè)方面: 人社數(shù)據(jù)的敏感性識(shí)別上, 本文采集人社數(shù)據(jù)隱私文本, 依據(jù)計(jì)量語言學(xué)理論, 劃分人社敏感詞匯類型為敏感名詞、敏感動(dòng)詞和敏感程度詞, 挖掘隱私文本, 編制對(duì)應(yīng)敏感詞表, 實(shí)現(xiàn)人社數(shù)據(jù)的敏感性識(shí)別; 人社數(shù)據(jù)的隱私值計(jì)量上, 分析人社數(shù)據(jù)敏感性的影響因素,建立敏感性測(cè)度的指標(biāo)體系, 構(gòu)建人社數(shù)據(jù)隱私計(jì)量模型, 進(jìn)行隱私值計(jì)量, 實(shí)現(xiàn)個(gè)人人社數(shù)據(jù)的分級(jí)。
本項(xiàng)研究?jī)r(jià)值體現(xiàn)在兩個(gè)方面。理論上, 本文基于客觀存在的人社隱私文本角度, 識(shí)別敏感數(shù)據(jù)單元, 挖掘文本單元的語義元素, 測(cè)度語義元素的敏感性強(qiáng)度和文本力度, 計(jì)量數(shù)據(jù)項(xiàng)的隱私值, 補(bǔ)充完善了基于主觀視角的“調(diào)查隱私主體對(duì)隱私客體的敏感性認(rèn)知” 的隱私界定理論; 實(shí)踐上, 已有的隱私保護(hù)法律將分類分級(jí)保護(hù)作為數(shù)據(jù)隱私保護(hù)的基本制度, 但缺失分級(jí)的定量標(biāo)準(zhǔn), 本文依據(jù)數(shù)據(jù)隱私值的計(jì)量結(jié)果, 劃分個(gè)人人社數(shù)據(jù)的隱私性為4 個(gè)級(jí)別, 為該類數(shù)據(jù)的分級(jí)保護(hù)實(shí)踐提供了科學(xué)依據(jù)。
本項(xiàng)研究的局限性主要存在以下兩個(gè)方面: 人社隱私文本的質(zhì)量上, 針對(duì)性的人社數(shù)據(jù)隱私及其保護(hù)的文本較少, 相關(guān)性的文本比較豐富, 導(dǎo)致本文的隱私計(jì)量結(jié)果可能存在偏差; 人社行業(yè)標(biāo)準(zhǔn)聚焦人社數(shù)據(jù)類型和數(shù)據(jù)項(xiàng)的界定與描述, 散見于人力資源管理與服務(wù)的規(guī)則規(guī)范制定; 法律法規(guī)部門規(guī)章多為不同領(lǐng)域的人力資源管理行為的法律界定與制度約束, 少見于通用法律法規(guī)中有關(guān)人社數(shù)據(jù)保護(hù)措施的呈現(xiàn); 泄露案例比較聚集在個(gè)人金融性財(cái)產(chǎn)和人格的侵犯, 散見于人事關(guān)系的糾紛; 學(xué)術(shù)論著關(guān)注重點(diǎn)在新出現(xiàn)的人社領(lǐng)域數(shù)據(jù)項(xiàng), 也有人社管理方法的探索。盡管如此, 本文測(cè)度的人社數(shù)據(jù)隱私價(jià)值仍能體現(xiàn)現(xiàn)階段各方對(duì)數(shù)據(jù)項(xiàng)的重要性認(rèn)知, 隨著該類數(shù)據(jù)隱私文本的演化進(jìn)展, 本項(xiàng)研究將持續(xù)跟進(jìn)。隱私計(jì)量實(shí)驗(yàn)中的各項(xiàng)指標(biāo)量化等級(jí)及量化值反映了彼時(shí)的隱私文本實(shí)際, 但隱私文本是動(dòng)態(tài)的, 故本項(xiàng)研究的結(jié)論也呈現(xiàn)出時(shí)間特色,具有時(shí)代局限性, 跟蹤未來文本的變化情況, 實(shí)時(shí)調(diào)整不同指標(biāo)的量化等級(jí), 進(jìn)行基于時(shí)序和認(rèn)知角色的人社數(shù)據(jù)隱私動(dòng)態(tài)精準(zhǔn)測(cè)度。
參考文獻(xiàn)
[1] 中華人民共和國(guó)人力資源和社會(huì)保障部[EB/ OL]. [2024-07-11]. http:/ / www.mohrss.gov.cn/ .
[2] 張凱亮, 臧國(guó)全. 泄露概率情境下的個(gè)人數(shù)據(jù)隱私計(jì)量研究[J]. 圖書情報(bào)工作, 2021, 65 (9): 62-69.
[3] 中華人民共和國(guó)中央人民政府. 《“十四五” 國(guó)家信息化規(guī)劃》專家談: 加快數(shù)字化轉(zhuǎn)型 構(gòu)建“ 十四五” 人力資源和社會(huì)保障信息化發(fā)展新格局[ EB/ OL]. [ 2024-07-11]. http: / /www.cac.gov.cn/2022-03/17/ c_1649124768926971.htm.
[4] 搜狐網(wǎng). 大數(shù)據(jù)爬蟲黑產(chǎn)調(diào)查: 數(shù)百元網(wǎng)購(gòu)數(shù)據(jù)采集器, 各行業(yè)信息訂制可查[EB/ OL]. [2024-07-11]. https:/ / www.sohu.com/ a/331920385_161795.
[5] 澎湃新聞. 常州法院2021 年度十大典型案例發(fā)布[ EB/ OL].[2024-07-11]. https: / / m.thepaper.cn/ baijiahao_16798337.
[6] 徐芳璐. 基層綜合檔案館個(gè)人信息保護(hù)問題研究[ D]. 沈陽:遼寧大學(xué), 2024.
[7] 康曉虹, 樊橋. 論大數(shù)據(jù)時(shí)代的檔案管理與隱私保護(hù)[ J]. 科學(xué)咨詢(科技·管理), 2017 (5): 36.
[8] 張麗娜. 大數(shù)據(jù)時(shí)代高校人事檔案信息化建設(shè)中的個(gè)人信息隱私權(quán)保護(hù)[J]. 山西檔案, 2018 (2): 70-72.
[9] 邵同銘. 人事檔案數(shù)字管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 信息技術(shù)與信息化, 2023 (11): 62-65.
[10] Li J C, Chen G Q. A Personalized Trajectory Privacy ProtectionMethod [J]. Computers & Security, 2021, 108: 102323.
[11] Ning B, Sun Y H, Tao X Y, et al. Differential Privacy Protec?tion on Weighted Graph in Wireless Networks [ J]. Ad Hoc Net?works, 2021, 110: 102303.
[12] 臧國(guó)全, 周曉倩. 社交網(wǎng)絡(luò)中關(guān)聯(lián)隱私的價(jià)值計(jì)量與分析[J]. 圖書情報(bào)工作, 2020, 64 (14): 85-93.
[13] 臧國(guó)全, 賈瑞瑩. 醫(yī)療數(shù)據(jù)中病種隱私的計(jì)量與分析[J]. 現(xiàn)代情報(bào), 2020, 40 (5): 161-168.
[14] 張坤. 基于聯(lián)合分析法的用戶隱私保護(hù)策略偏好研究[D]. 北京: 北京郵電大學(xué), 2011.
[15] 張磊. 基于聯(lián)合分析法的APP 隱私信息采集策略研究[ D].武漢: 武漢大學(xué), 2020.
[16] Egelman S, Felt A P, Wagner D. Choice Architecture and Smar?tphone Privacy: Theres a Price for That [ M]. The Economics ofInformation Security and Privacy. Heidelberg: Springer, 2013.
[17] 鄧勝利, 趙海平. 信息泄露情境下的個(gè)人信息價(jià)值評(píng)估及個(gè)體差異: 基于離散選擇模型的實(shí)證研究[ J]. 情報(bào)學(xué)報(bào), 2019,38 (3): 266-276.
[18] 趙楊, 范圣悅. 適老化背景下老年用戶App 隱私偏好實(shí)證研究———基于離散選擇實(shí)驗(yàn)[J/ OL]. 情報(bào)科學(xué): 1-28 [2024-07- 25]. http: / / kns. cnki. net/ kcms/ detail/22. 1264. G2. 20240506.1706.022.html.
[19] 石磊. 考慮不同使用場(chǎng)景的APP 用戶隱私交換行為研究[D].大連: 大連海事大學(xué), 2022.
[20] 黃逸珺, 陸桐, 閆強(qiáng). 電子商務(wù)網(wǎng)站個(gè)人信息價(jià)值評(píng)估[ J].北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2017, 19 (5): 33-41.
[21] 陳海燕. 政府?dāng)?shù)據(jù)開放中的個(gè)人隱私價(jià)值計(jì)量與保護(hù)研究[D].南昌: 南昌大學(xué), 2022.
[22] 張凱亮, 臧國(guó)全. 泄露概率情境下的個(gè)人數(shù)據(jù)隱私計(jì)量研究[J]. 圖書情報(bào)工作, 2021, 65 (9): 62-69.
[23] 張根, 唐忠, 李韶陽, 等. 醫(yī)療隱私大數(shù)據(jù)泄露風(fēng)險(xiǎn)容忍度計(jì)量仿真[J]. 計(jì)算機(jī)仿真, 2021, 38 (12): 480-484.
[24] 邵寬, 張鎮(zhèn)勇, 楊科迪, 等. 基于國(guó)密SM2 的數(shù)字藏品網(wǎng)絡(luò)拍賣隱私保護(hù)方法[J]. 軟件學(xué)報(bào), 2025 (3): 1289-1303.
[25] 盧玉, 王靜宇, 劉立新, 等. 拍賣機(jī)制驅(qū)動(dòng)的數(shù)據(jù)激勵(lì)共享方案[J]. 計(jì)算機(jī)科學(xué)與探索, 2024, 18 (8): 2203-2220.
[26] 武子軒, 王燁, 于洪. 基于多尺度特征提取的層次多標(biāo)簽文本分類方法[ J]. 鄭州大學(xué)學(xué)報(bào)( 理學(xué)版), 2025, 57 (2):24-30.
[27] 穰雨辰, 馬靜. 基于圖像字幕的多模態(tài)對(duì)齊情感分析模型[J]. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn), 2025, 9 (1): 101-109.
[28] 孫令成, 肖鐵軍. 程序代碼集到特征矩陣文本特征提取算法的研究[J]. 計(jì)算機(jī)與數(shù)字工程, 2023, 51 (10): 2363-2368,2378.
[29] 吳加輝, 加云崗, 王志曉, 等. 基于深度學(xué)習(xí)的微博疫情輿情文本情感分析[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2024, 34 (7): 175-183.
[30] 唐紅濤, 余佳鵬, 陳捷. 文本分析視角下數(shù)字鄉(xiāng)村政策量化研究———基于FastText 和文本挖掘方法[J]. 知識(shí)管理論壇, 2024,9 (3): 237-252.
[31] 孫毅, 裘杭萍, 王沁雪. 網(wǎng)絡(luò)用戶自描述標(biāo)簽向量生成及標(biāo)簽層次體系構(gòu)建方法[J]. 信息技術(shù)與網(wǎng)絡(luò)安全, 2018, 37 (11):44-49.
[32] 張楊, 徐步權(quán). 基于機(jī)器學(xué)習(xí)和自然語言處理的工單自動(dòng)標(biāo)簽化技術(shù)[J]. 自動(dòng)化應(yīng)用, 2023, 64 (23): 13-15.
[33] 葉亞芬, 原德?。?基于數(shù)據(jù)化和文本檢索技術(shù)的檔案資源智能聚類研究[J]. 浙江檔案, 2023 (8): 17-19.
[34] 百度百科. 隱私[ EB/ OL]. [ 2024-07-11]. https: / / baike.so.com/ doc/5591945-5804545.html.
[35] Warren S D, Brandeis L D. The Right to Privacy [ J]. HarvardLaw Review, 1890, 4 (5): 193-220.
[36] 張伯江. 漢語的句法結(jié)構(gòu)和語用結(jié)構(gòu)[ J]. 漢語學(xué)習(xí), 2011(2): 3-12.
[37] 江騰蛟, 萬常選, 劉德喜, 等. 基于語義分析的評(píng)價(jià)對(duì)象—情感詞對(duì)抽?。郏剩荩?計(jì)算機(jī)學(xué)報(bào), 2017, 40 (3): 617-633.
[38] Picard R W. Affective Computing [M]. MIT Press, 1997.[39] 來亮, 錢屹. 文本情感分析綜述[ J]. 計(jì)算機(jī)光盤軟件與應(yīng)用, 2012, 15 (18): 74-75.
[40] Liu B. Sentiment Analysis and Opinion Mining [ M]. Berlin:Spring, 2012.
[41] K?hler R. Bibliography of Quantitative Linguistics [M]. Amster?dam & Philadelphia: John Benjamins Publishing Company, 1995:40-43.
[42] 臧國(guó)全, 張盼盼, 柴文科, 等. 個(gè)人通信數(shù)據(jù)的敏感性識(shí)別與隱私計(jì)量研究[J]. 圖書情報(bào)知識(shí), 2024, 41 (2): 110-120.
[43] 肖洋, 臧國(guó)全. 個(gè)人金融數(shù)據(jù)的敏感性識(shí)別與隱私計(jì)量研究[J]. 情報(bào)理論與實(shí)踐, 2023, 46 (9): 105-114, 86.
(責(zé)任編輯: 郭沫含)
基金項(xiàng)目: 國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“政府?dāng)?shù)據(jù)的隱私風(fēng)險(xiǎn)計(jì)量與保護(hù)機(jī)制創(chuàng)新研究” (項(xiàng)目編號(hào): 21&ZD338)。