潘亞平 王 瑋 高育棟
(國網(wǎng)甘肅省電力公司,甘肅 蘭州 730000)
企業(yè)文化是企業(yè)在長期發(fā)展過程中形成的,能決定企業(yè)生存和發(fā)展的軟實力。它是一種多元、共融的文化,最終被轉(zhuǎn)化為精神信念,是企業(yè)員工精神素養(yǎng)的重要來源。良好的企業(yè)文化建設(shè)是推動企業(yè)管理升級和企業(yè)生產(chǎn)發(fā)展的有效措施。在中國企業(yè)改革創(chuàng)新發(fā)展的新形勢下,企業(yè)應(yīng)著力將其文化內(nèi)化為企業(yè)員工尤其是青年職工的精神素養(yǎng)。
互聯(lián)網(wǎng)環(huán)境下,運用社交媒體傳播企業(yè)文化成為企業(yè)戰(zhàn)略管理的共識。當(dāng)前,面對內(nèi)外部環(huán)境變化,企業(yè)文化是推動企業(yè)轉(zhuǎn)型升級的核心內(nèi)容之一。國家電網(wǎng)甘肅省電力公司(以下簡稱“國網(wǎng)甘肅公司”)是國家電網(wǎng)有限公司的全資子公司,本研究以“國網(wǎng)甘肅省電力公司微博”為研究對象,探討新媒體環(huán)境下企業(yè)如何利用社交媒體深耕企業(yè)文化建設(shè)。
對內(nèi)溝通和對外宣傳是企業(yè)文化和企業(yè)精神素養(yǎng)的“播種機”和“放大器”。對內(nèi),通過媒體文化宣傳、社交活動等統(tǒng)一企業(yè)員工思想,形成合力;對外,發(fā)揮媒體傳播宣傳作用、開展文化交流活動、擴大品牌影響力、加強員工素質(zhì)、樹立企業(yè)形象。因此,企業(yè)的社交媒體賬號承擔(dān)著培育企業(yè)文化和企業(yè)精神素養(yǎng)的重任。與傳統(tǒng)調(diào)研或開座談會的研究方法相比,使用文本分析或主題模型更容易從大規(guī)模非結(jié)構(gòu)化文本中發(fā)現(xiàn)企業(yè)的文化優(yōu)勢,能全面挖掘反映企業(yè)文化的各個維度。如果僅依靠人工內(nèi)容編碼,研究的穩(wěn)健性容易受個人主觀判斷影響,分類結(jié)果可重復(fù)性較差。而文本主題模型依賴于機器學(xué)習(xí)的范式,可以使企業(yè)文化和企業(yè)精神素養(yǎng)的發(fā)現(xiàn)更具客觀性和一致性。此外,使用主題模型進行研究還有以下優(yōu)勢:
第一,主題模型可以發(fā)現(xiàn)隱藏的主題信息。企業(yè)文化和企業(yè)精神素養(yǎng)是一個多維的、包含隱性知識的系統(tǒng)結(jié)構(gòu)。直接通過人工識別文本中的文化維度非常困難。但主題模型通過詞頻統(tǒng)計與貝葉斯推理,可以從大量企業(yè)微博文本中發(fā)現(xiàn)潛在的主題信息,無需人工標注和監(jiān)督。這使得我們可以充分利用數(shù)據(jù)本身包含的信息自動發(fā)現(xiàn)文本集合中的主題結(jié)構(gòu),揭示企業(yè)文化和精神素養(yǎng)的多維組成。
第二,主題模型可以提取文檔—主題分布。單個企業(yè)微博文本中可能同時包含多個企業(yè)文化維度的信息。主題模型可以評估每個主題在給定文本中的生成概率,將文本對每個主題的支持度作為權(quán)重,進而可以定量分析不同企業(yè)文化主題的融合情況,這為下一步解讀企業(yè)文化的內(nèi)涵提供了量化支撐。
第三,主題模型可以獲取主題詞分布。主題模型不僅可以發(fā)現(xiàn)主題,還可以輸出每個主題的關(guān)鍵詞分布,這些詞匯可以直觀地反映主題的語義內(nèi)容。研究可以根據(jù)主題詞分布來描述主題,并與企業(yè)文化和精神素養(yǎng)的某一內(nèi)在維度或要素建立關(guān)聯(lián)。
主題提取又稱特征提取,是獲取文本有價值信息最有效的方式之一。它著眼于關(guān)鍵詞的出現(xiàn)頻率,傾向于直接從文檔中獲取關(guān)鍵詞,借助詞頻-逆文檔頻率(TF-IDF)算法獲得高權(quán)重詞,并將其列為特征選項。景麗萍(Li-Ping Jing)等采用TF-IDF作為特征選取方法,為文本數(shù)據(jù)建立向量空間模型[1]。張韋引入WordNet本體庫在Web文本間進行語義相似度計算,利用文本之間的相似度進行主題的語義級別合并,對文本進行聚類后再在各個主題內(nèi)部使用改進的TF-IDF算法提取主題關(guān)鍵詞,在Web主題提取研究上取得了良好的效果[2]。
從文本語料中發(fā)現(xiàn)隱藏在詞匯下的潛在語義,最經(jīng)典的就是LDA(Latent Dirichlet Allocation,隱含狄利克雷分布)主題模型,這一模型能夠較好地對包含多主題的文本進行分類提取[3]。LDA主題模型集合了機器學(xué)習(xí)的優(yōu)點,可以迅速從大量文本中挖掘出隱含主題信息。因此,研究人員多采用LDA模型結(jié)合TF-IDF算法作為主題提取的常規(guī)方法。
本研究以微博賬號“國網(wǎng)甘肅電力”為研究對象。截至2022年9月,該賬號共發(fā)布微博3096條(包括文章、轉(zhuǎn)發(fā)評論、視頻),使用Python爬蟲技術(shù)抓取全部微博,經(jīng)清洗篩選后獲得2718條有效微博文本,以csv的文件格式保存。
TF-IDF即“詞頻-逆文檔頻率”的英文簡寫,結(jié)合了詞頻計算公式和逆文檔頻率的計算公式。TF-IDF算法的公式為:
用TF-IDF算法從微博文本中提取關(guān)鍵詞。首先,利用Python中的jieba分詞庫進行文本清洗;然后,通過其內(nèi)置的TF-IDF算法對文本進行處理,可以獲得語料的關(guān)鍵詞。通過設(shè)置主題數(shù)量參數(shù)topK=10,獲取每篇文本語料權(quán)重得分前10位的關(guān)鍵詞。
LDA主題模型利用三層貝葉斯概率模型識別大規(guī)模文檔中潛藏的主題信息。它基于如下假設(shè):文檔集合中存在K個主題且主題之間相互獨立;每個文檔由K個主題隨機混合組成,且主題參數(shù)服從狄利克雷分布;每個主題是特征詞上的多項分布,該多項分布的參數(shù)服從狄利克雷分布。
1.主題聚類。LDA的模型計算結(jié)果可以得到文檔-主題和主題-詞語2個概率分布。文檔-主題概率分布獲得每個主題下的文檔支持權(quán)重,權(quán)重越大表示該文檔與主題的關(guān)聯(lián)度越大;主題-詞語概率分布由一系列特征詞及其在該主題中出現(xiàn)的概率值表示,反映主題的內(nèi)部結(jié)構(gòu),特征詞概率值越大,對該主題的貢獻度越高[4]。
2.參數(shù)選擇。LDA主題模型算法的起始步驟是設(shè)定參數(shù),包括狄利克雷先驗α、β參數(shù)和主題數(shù)K。本研究中,α和β分別設(shè)置為0.1和0.01[5]。由于主題的數(shù)量可以顯著影響估計的文檔主題,因此最佳主題數(shù)量(K)的選擇尤為重要。當(dāng)主題相似性中的余弦相似度跟隨主題數(shù)量增加呈下降趨勢時,可能存在過度聚類問題[6]。為減少此問題,我們引入困惑度(Perplexity)度量作為判斷最優(yōu)主題數(shù)的指標。布雷(D.M.Blei)最先采用困惑度確定最佳主題數(shù)目K。其計算方法為:
3.主題挖掘結(jié)果。利用Python的gensim庫實現(xiàn)LDA主題模型的構(gòu)建,gensim庫可以從原始的非結(jié)構(gòu)化文本中無監(jiān)督地學(xué)習(xí)到文本的主題向量表達,支持包括TF-IDF、LDA在內(nèi)的多種模型。同時,依據(jù)主題困惑度評價標準,人工設(shè)置主題數(shù)目從1到15的遍歷。一方面,要使主題一致性盡可能高,以取得模型訓(xùn)練效果;另一方面,也需要控制主題數(shù)量相對較少,以便后續(xù)對主題進行概括與解釋,最終確定主題聚類數(shù)目為7。通過LDA主題分類得到“國網(wǎng)甘肅電力”微博賬號文本內(nèi)容的7個主題以及每個主題的詞項分布,整理每個主題下排名前30的高概率特征詞,并進行場景描述,總結(jié)歸納出最符合當(dāng)前主題下高概率特征詞的主題標識。
本研究基于LDA模型的主題聚類結(jié)果,根據(jù)每個主題的詞項分布,將7個主題劃分為精神素養(yǎng)、行為責(zé)任、物質(zhì)設(shè)施和制度管理4個維度,以觀察、分析企業(yè)文化融合現(xiàn)狀。
企業(yè)精神主要表現(xiàn)為企業(yè)經(jīng)營管理中所堅持的精神,它對企業(yè)員工的行為具有規(guī)范和促進作用,在提高企業(yè)競爭力方面也有非常顯著的影響。Topic6的高概率特征詞為“甘電小科普”“火災(zāi)”“消防”“短路”等,所以將該主題標識類別定義為“火災(zāi)消防”。Topic7的高概率特征詞為“用電”“安全”“視頻”“生活”等,所以將該主題標識類別定義為“用電安全”。這兩類主題的微博文本內(nèi)容占比分別為10.6%和8.2%。
企業(yè)文化中的行為責(zé)任指企業(yè)的生產(chǎn)經(jīng)營活動和企業(yè)員工在日常工作中表現(xiàn)出來的行動力,包括企業(yè)責(zé)任、企業(yè)風(fēng)格和企業(yè)影響等諸多內(nèi)容。Topic1的高概率特征詞為“供電”“線路”“隱患”“排查”“故障”等,所以將該主題標識類別定義為“安全排查”。Topic2的高概率特征詞為“工作”“服務(wù)”“活動”“檢修”等,所以將該主題標識類別定義為“工作服務(wù)”。這兩類主題的微博文本內(nèi)容占總文本的比重最大,分別為22.4%和22.1%。2022年,國網(wǎng)甘肅公司與新華社、央視等中央媒體聯(lián)合完成國家“應(yīng)急使命·2022”高原高寒地區(qū)抗震救災(zāi)實戰(zhàn)化演習(xí)主題宣傳。
物質(zhì)文化是企業(yè)文化融合的重要組成部分,包括企業(yè)的硬件基礎(chǔ)設(shè)施(例如廠房、辦公場所等),以及企業(yè)員工的工資福利、工作舒適度。Topic3的高概率特征詞為“電網(wǎng)”“工程”“扶貧”“新能源”等,所以將該主題標識類別定義為“工程建設(shè)”。Topic4的高概率特征詞為“發(fā)展”“能源”“電力”等,所以將該主題標識類別定義為“新能源發(fā)展”。這兩類主題的微博文本內(nèi)容占比分別為14.7%和11.3%。這些內(nèi)容反映了“國網(wǎng)甘肅電力”聚焦電力保供、能源轉(zhuǎn)型、“一體四翼”發(fā)展布局建設(shè)等工作成果。
企業(yè)內(nèi)外部需要遵守的制度管理策略和組織架構(gòu)構(gòu)成企業(yè)文化軟實力不可或缺的制度維度。Topic5的高概率特征詞為“視頻”“新聞”“國家電網(wǎng)”“人民日報”“世界”等,所以將該主題標識類別定義為“時事新聞”。該類主題的微博文本內(nèi)容占總文本的比重為10.7%,其內(nèi)容多貼近生活、貼近群眾。標志著企業(yè)能深刻把握社交媒體傳播規(guī)律,圍繞公司中心工作精心策劃宣傳主題,將官方微博賬號從原有以引導(dǎo)為主的信息傳導(dǎo)媒介拓展成一個功能全面、效能強大的綜合服務(wù)平臺。通過此類主題報道,為企業(yè)中心工作的高效開展和重大項目的順利推進營造有利的輿論場,為公司和電網(wǎng)科學(xué)發(fā)展發(fā)揮制度文化“服務(wù)、保障和支撐”作用起到良好的作用。
面對海量信息和碎片化傳播的社交媒體平臺,國網(wǎng)甘肅公司官方微博新聞宣傳的形式和手段日漸豐富,但企業(yè)文化融合體系仍需完善。首先,要積極促進企業(yè)文化與企業(yè)精神素養(yǎng)的有效融合。企業(yè)要站在為黨育人、為國育才的戰(zhàn)略高度,關(guān)心青年成長、支持青年發(fā)展,將青年精神素養(yǎng)提升工作作為企業(yè)建設(shè)的重要任務(wù)。企業(yè)戰(zhàn)略管理策略要堅持黨建帶團建,切實發(fā)揮主體作用,動員企業(yè)青年廣泛參與。其次,要有效發(fā)揮企業(yè)文化在企業(yè)管理中的指導(dǎo)作用,大力構(gòu)建企業(yè)文化的融合機制,在企業(yè)文化和企業(yè)管理之間建立較強的交互性和融合性機制,使企業(yè)文化與企業(yè)戰(zhàn)略管理有效結(jié)合。進一步加強員工的教育培訓(xùn),尤其要培養(yǎng)青年員工的精神素養(yǎng),包括文化意識、文化素養(yǎng)和文化自信等,發(fā)揮企業(yè)文化在戰(zhàn)略管理策略、員工自我文化認同等方面的積極作用。在此基礎(chǔ)上,對日常的企業(yè)文化建設(shè)進行有效的管理,比如可以把企業(yè)文化建設(shè)納入企業(yè)績效考核,加強管理層和員工對企業(yè)文化建設(shè)的重視程度,切實做到知行合一。再次,企業(yè)要積極廣泛地開展宣傳,用好新媒體平臺,將開展青年精神素養(yǎng)提升工作的重大意義、工作要求,及時、準確、全面、有效地傳遞給廣大青年。還必須注重企業(yè)文化融合的科學(xué)性,把握社會主義思想時代性,彰顯企業(yè)精神文化特色,體現(xiàn)企業(yè)管理文化協(xié)調(diào),保持企業(yè)文化形象穩(wěn)定。