郭永強
用戶畫像也被稱為用戶多維分析,是獲悉用戶真實需求和指導企業(yè)產品設計的重要工具,它在很大程度上體現了用戶的真實特征和業(yè)務訴求。用戶畫像本質上是現實用戶在網絡世界中的虛擬代表,是表達用戶需求和指導產品設計方向的重要工具。
構建畫像的主要流程就是以用戶自身屬性和在互聯網上的交互數據為數據基礎,通過建模或統(tǒng)計分析得到用戶特征再映射到業(yè)務標簽上,從而形成用戶畫像。目前用戶畫像在諸多領域都有廣泛應用,例如:產品設計、信息檢索、推薦系統(tǒng)、風險控制、精準營銷等①常樂.基于用戶行為分析的用戶畫像系統(tǒng)設計與實現[D],北京郵電大學碩士論文,2020 年.。
隨著用戶畫像的廣泛應用,其相關專利申請量也出現了大幅增長。
涉及用戶畫像的發(fā)明專利申請呈現出兩個主要類型。一類是涉及用戶畫像本身的構建方法;另一類是涉及用戶畫像在各個領域的應用。由于這兩類申請的解決方案中經常均會涉及算法特征以及商業(yè)規(guī)則和方法特征,因此,該領域的發(fā)明專利申請如何才能構成專利保護的客體成為企業(yè)界、實務界乃至學術界熱議的焦點問題。
1.專利申請趨勢
筆者圍繞用戶畫像對中國專利摘要數據庫、美國專利全文數據庫、歐洲專利全文數據庫、日本專利全文數據庫、韓國專利全文數據庫進行了檢索,檢索截止時間為2021 年10 月。
參見圖1,根據從上述數據庫獲取的專利申請數據進行分析,可以發(fā)現:全球在2010-2021 年圍繞該領域的申請量呈現出上升趨勢,特別是在2019 年增長最快,比2018 年同期增長了1.5 倍,并在2020 年超過了2,400 件。
圖1 全球用戶畫像領域發(fā)明專利逐年申請量趨勢圖
國內用戶畫像相關專利申請量也同樣呈現出逐年增長的趨勢,同樣是在2019 年出現爆發(fā)式增長,申請量接近2018 年的3 倍。正是由于中國用戶畫像相關專利申請量的快速增加,帶動了五局整體的快速上升趨勢。特別是在2020 年,我國申請量超過了2,100 件,參見圖2。
圖2 中國用戶畫像領域逐年申請量
2.五局申請量對比
從中國、美國、歐洲、日本和韓國五局圍繞用戶畫像的專利申請量來看,參見圖3,中國在用戶畫像領域的專利申請量(5,761 件)居于第一,美國(802件)居于第二,日本(209 件)居于第三,歐洲僅有美國的八分之一,中國的五十分之一,韓國占比最少。
圖3 用戶畫像領域五局申請量分布
3.重點申請人分布
全球用戶畫像相關專利的各申請人的申請量從高到低次為:騰訊、百度、平安、阿里巴巴、京東、深圳壹賬通、北京三快、北京達佳互聯、奇虎、北京奇藝世紀,參見圖4。
圖4 用戶畫像領域申請量前10
可以看出,自2010-2021 年,國內在用戶畫像相關申請比國外活躍,前10 名全部來自國內;在五局中,中國相關申請量占據明顯優(yōu)勢。
4.中、美、日局授權率對比
圖5 是中、美、日三局關于用戶畫像領域的授權率對比圖??梢钥闯觯毡?、美國在用戶畫像領域的專利授權率分別為46%和43%,明顯高于中國用戶畫像領域的授權率10%。
圖5 中、美、日局用戶畫像領域授權率對比圖
從這點可以反映出,用戶畫像領域的專利申請在中國較難獲得專利權。這與我國在該領域明顯處于領跑地位的專利申請量形成了鮮明的對比。
如上所述,用戶畫像相關發(fā)明專利申請的特點就是權利要求的方案中包含算法特征或商業(yè)規(guī)則和方法特征,而算法特征以及商業(yè)規(guī)則和方法特征因不屬于技術特征,故而,當技術特征和非技術特征交織在一起時,容易給方案是否構成專利保護客體的判斷帶來難點。
《專利審查指南》第二部分第九章第6.1.2 節(jié)規(guī)定:對一項包含算法特征或商業(yè)規(guī)則和方法特征的權利要求是否屬于技術方案進行審查時,需要整體考慮權利要求中記載的全部特征。如果該項權利要求記載了對要解決的技術問題采用了利用自然規(guī)律的技術手段,并且由此獲得符合自然規(guī)律的技術效果,則該權利要求限定的解決方案屬于專利法第二條第二款所述的技術方案。如果權利要求中涉及算法的各個步驟體現出與所要解決的技術問題密切相關,如算法處理的數據是技術領域中具有確切技術含義的數據,算法的執(zhí)行能直接體現出利用自然規(guī)律解決某一技術問題的過程,并且獲得了技術效果,則通常該權利要求限定的解決方案屬于專利法第二條第二款所述的技術方案。
上述規(guī)定強調了對于包含算法特征或商業(yè)規(guī)則和方法特征的新領域、新業(yè)態(tài)相關發(fā)明專利申請,如果上述算法特征或商業(yè)規(guī)則和方法特征能夠與技術特征一起,或者能夠使方案整體上解決技術問題,那么也可以構成技術手段的一部分。特別是,對于改進在于算法的解決方案,如果該解決方案涉及的算法特征能夠體現出其具體的應用領域,并且能夠解決該領域中的技術問題,例如,該解決方案中算法處理的數據是諸如圖像領域中的像素或視頻、通信領域中的代碼、語義解析過程中的文本或詞句,亦或是其他具體領域中的技術問題,并且,權利要求中的算法各步驟要能體現出解決該技術問題的具體過程,那么,該解決方案能夠構成技術方案。
下面,筆者將結合兩個案例,從正反兩方面介紹上述審查規(guī)則的具體適用方式。
1.案例1:一種電力行業(yè)的用戶畫像構建方法
【案情概述】
目前,電力行業(yè)普遍是構建用戶價值細分體系,得到不同價值的用電客戶后,再根據某些定量的指標提供增值服務。然而,這樣的方法存在以下缺點:沒有將定性數據和定量數據相結合,得到的結論的可解釋性不高,從而不能清楚、全面地描述用戶行為的具體特征。
為此,該申請?zhí)岢隽艘环N電力行業(yè)的用戶畫像構建方法,將電力行業(yè)的用戶行為的頻度、程度、近期預測相結合,能夠多方位描述不同屬性的用電客戶的行為特征,從而有效輔助電力公司的業(yè)務人員根據用電客戶的情況提供差異化增值服務。
【權利要求】
1.一種電力行業(yè)的用戶畫像構建方法,其特征在于,包括:
根據數據庫中的字段生成用戶的基本屬性標簽,其中所述用戶的基本屬性包括地區(qū)、電壓等級、行業(yè)、用電類別、入網時長、是否為高耗能、是否為三方用戶;和/或
基于用電行為、繳費行為和交互行為分別生成用戶的基本行為標簽;
基于所述用電行為生成用戶的基本行為標簽包括:
基于安全用電行為、異常用電行為、變更用電行為、正常用電行為分別構建用戶的二級行為標簽體系;
基于所述安全用電行為構建用戶的二級行為標簽體系包括:
生成用以描述所述安全用電行為的二級行為標簽,申請文件以及審查過程
其中,所述用以描述所述安全用電行為的二級行為標簽包括:用電設備安全性高、用電設備安全性低、用電安全管理能力高、用電安全管理能力低;
所述用戶畫像構建方法還包括:生成用以描述所述用電設備安全性高/低的三級行為標簽,
其中,所述用以描述所述用電設備安全性高/低的三級行為標簽包括:頻繁出現安全隱患、偶爾出現安全隱患、從不出現安全隱患、曾出現嚴重安全隱患、未曾出現嚴重安全隱患、潛在安全用電風險低和潛在安全用電風險高;
生成用以描述所述用電設備安全性高/低的三級行為標簽包括:
從用電檢查表中獲取用戶近三年安全隱患總次數,并計算相應的近三年安全隱患頻率;若所述近三年安全隱患頻率高于行業(yè)月平均安全隱患頻率,則生成所述頻繁出現安全隱患的三級行為標簽,否則生成所述偶爾出現安全隱患或 所述從不出現安全隱患的三級行為標簽;
根據所述用電設備的安全隱患類型生成所述曾出現嚴重安全隱患或所述未曾出現嚴重安全隱患的三級行為標簽;
從所述用電檢查表中獲取用戶近三月安全隱患總次數,并計算相應的近三月安全隱患頻率;若所述近三月安全隱患頻率高于預設頻率閾值,則生成潛在安全用電風險高的三級行為標簽,否則生成潛在安全用電風險低的三級行為標簽。
【案例分析】
權利要求1 涉及一種用戶畫像構建方法,該方法所要解決的問題是當前電力行業(yè)不能清楚、全面地描述用戶行為的具體特征。為解決上述問題,該申請所采用的手段是通過人為設定的屬性信息和用電行為、繳費行為和交互行為來描述客戶的特征以構建用戶畫像,上述手段中用于描述用戶屬性信息、用戶行為信息的具體指標僅僅是人為設定的用戶畫像的信息表達方式,各級指標的設定也是人為設定的畫像構建規(guī)則,并非遵循自然規(guī)律的技術手段。因而,該申請未采用遵循自然規(guī)律的技術手段解決技術問題,所獲得的多方位描述不同屬性的用電客戶的行為特征,從而有效輔助電力公司的業(yè)務人員根據用電客戶的情況提供差異化增值服務的效果,不屬于技術效果。因此該申請的解決方案不屬于專利法第二條第二款規(guī)定的技術方案,不構成專利保護的客體。
雖然可能也有觀點會認為:該申請通過根據數據庫中的字段生成用戶的基本屬性標簽,并非依賴人為定義的標準來達到發(fā)明目的,對用戶的基本屬性和基本行為的確定是需要大數據的采集和分析才能實現的,是技術手段。對于用戶具體對應哪種基本行為標簽的確定過程,是需要預設公式對獲得的用戶數據進行計算,根據計算結果才確定,并不能通過人為定義的方式直接確定,其本質是通過計算機程序對獲得的數據按照預設規(guī)則進行處理,最終輸出計算結果存在可遵循的自然規(guī)律,并不受到人的思維的影響。
對此,筆者認為,雖然權利要求所限定的方案記載了可以使用數據庫等數據處理手段,但是數據庫的使用并不能直接構成技術手段,該申請的解決方案并不涉及數據庫技術中有何技術問題需要解決,而僅僅是利用數據庫的數據存儲的固有功能。其次,雖然該申請也可以通過計算機來運行預設公式計算獲得結果,但利用計算機進行數據處理仍是計算機固有的數據處理性能,利用計算機進行電力行業(yè)用戶畫像數據的存儲、處理,與計算機運行其他應用程序一樣,計算機作為程序的執(zhí)行載體,其硬件結構或內部性能不會發(fā)生任何技術上的改變。因而,即便該申請的方案中記載了數據庫等手段,但整體上分析可知,該申請請求保護的用戶畫像構建方法僅僅是對于電力行業(yè)用戶畫像的簡單信息表達,并未解決電力行業(yè)中的技術問題,所設定的畫像構建規(guī)則并非遵循自然規(guī)律的技術手段,無法獲得技術效果。因此,僅針對某領域通過設定畫像構建規(guī)則而未能解決任何技術問題的申請,難以獲得專利保護。
2.案例2:一種基于對話交互的畫像構建方法
【案情概述】
現有的用戶畫像方法主要是通過大數據統(tǒng)計分析對用戶畫像進行構建,用戶的屬性標簽通過對日志信息關鍵字段的提取來獲得。通常有兩種方式:一種是,存儲用戶的日志信息,當用戶日志信息達到設定閾值后,根據靜態(tài)日志構建用戶畫像;另一種是,保存用戶日志,在一定時間窗口內遍歷所有用戶日志,根據某種權重衰減函數計算得到最新的用戶畫像。第一種方式應用的最普遍,然而忽略了用戶屬性或偏好隨時間改變的性質,使得越到后期對用戶畫像的刻畫越不準確;第二種方式雖然考慮了時間因素,但推進時間窗口需要積累用戶日志,使得更新缺乏實時性,而且不同的時間窗口設定會影響用戶畫像的效果,調節(jié)參數復雜困難。
針對現有技術存在的上述不足,該申請?zhí)岢隽艘环N基于對話交互的用戶畫像的構建方法,通過語義解析器對用戶的輸入進行實時解析,并根據解析到的用戶語義對各個屬性的權重的加權分布進行更新,從而生成準確細致的畫像。
【權利要求】
1.一種基于對話交互的畫像構建方法,其特征在于,通過語義解析器對用戶的輸入進行實時解析,并根據解析到的用戶語義對各個屬性的權重的加權分布進行更新,從而生成準確細致的畫像;
所述的語義解析器,根據任務需求設計用戶畫像中的屬性標簽構建得到,具體步驟包括:
1)建立領域相關數據庫或知識庫,不同領域的信息分類存儲和分析;
2)對于所有基礎屬性和每個獨立領域,分別構建語義解析器,最終將各個語義解析器貫通,得到完整的語義解析器;
所述的屬性標簽包括基礎屬性和領域屬性;
所述的基礎屬性包括:姓名、性別、年齡、電話、家庭住址和公司地址;
所述的領域屬性包括:常去目的地、常聽的歌和常撥的號碼;
所述的語義解析器采用槽值對的方式表示語義,其中:槽即為屬性標簽的名稱,值即為該屬性標簽對應的值;所述的用戶的輸入包括:語音、文字或手勢;
所述的實時解析,是指解析語義的過程是實時的,即每得到一次用戶的完整輸入時,對該次用戶輸入作語義解析;
所述的實時解析除了解析當前對話輸入,還需對上下文對話邏輯進行解析,并且采用語義資源定制的方式構建語義解析器;
所述的更新,包括更新基礎屬性的值和領域屬性的值;
在更新基礎屬性和領域屬性的值時,進行權重和衰減因子處理;
所述的權重和衰減因子處理是指:首先設定時間窗口T,在該時間窗口內,時間越近的權重越高,含有衰減因子的權重計算公式為:wAki =e-p(t0-t),(略);
所述的基礎屬性的值,通過以下方式實現更新:設定時間窗口T1,(略);
所述的領域屬性的值,通過以下方式實現更新:設定時間窗口T2,(略)。
【案例分析】
權利要求1 請求保護一種基于對話交互的畫像構建方法,其所要解決的問題是通過語義解析器對用戶的輸入進行實時解析,降低參數調節(jié)復雜性,這屬于技術問題。為解決上述技術問題,該申請所采用的手段包括對用戶輸入的語音、文字、手勢進行語義解析,將語義解析后的屬性值的權重計算和分布更新,而語音、文字、手勢等是自然語言和圖像識別領域常用的技術數據。該申請權利要求1 中不僅提及了用戶輸入是語音、文字等,算法各步驟也緊密圍繞如何對輸入的內容進行解析,并如何對解析后的屬性值對屬性標簽進行更新的具體過程,也就是說,該申請記載的算法特征處理的數據是技術領域中具有確切技術含義的數據,且權利要求中涉及算法的各個步驟體現出與所要解決的上述技術問題密切相關,算法的執(zhí)行能直接體現出利用自然規(guī)律解決上述技術問題的過程,該申請所獲得的相應的效果屬于技術效果。因此,該申請請求保護的解決方案構成專利法第二條第二款規(guī)定的技術方案,屬于專利保護的客體。
通過對用戶畫像領域專利申請的國內外申請現狀以及國內外授權情況的對比分析,可以看出,我國在用戶畫像領域的專利申請量和申請熱度方面具有優(yōu)勢,但是,依照目前審查規(guī)則,對該領域的客體審查方面還較為嚴格。
在審查實踐中,應該客觀分析方案中涉及的算法特征或商業(yè)規(guī)則和方法特征,當它們能夠整體上使發(fā)明解決技術問題時,應承認其作為技術手段的一部分,并在創(chuàng)造性評判過程中認可其有可能對發(fā)明帶來的技術貢獻。不能武斷認為算法改進的解決方案就一概不能獲得專利保護,這樣會打擊創(chuàng)新主體對于人工智能熱點算法的研發(fā)熱情,不利于人工智能產業(yè)落地和發(fā)展,更不利于新領域、新業(yè)態(tài)創(chuàng)新成果的保護和應用。
在申請實務中,應該正確理解審查規(guī)則和適用,在撰寫用戶畫像等人工智能領域熱點算法改進的發(fā)明專利申請時,應在申請文件中寫明算法的具體應用領域,不涉及具體應用領域的,應寫明是否涉及計算機內部性能的改進,算法處理的對象是否為技術領域中具有確切技術含義的數據,權利要求記載的方案中,應寫明算法各步驟用于解決某技術問題的具體過程,而并非僅在權利要求的主題名稱或數據處理來源中表明該申請的應用場景或數據來源。
專家點評
人工智能在產業(yè)界落地的過程中,圍繞其應用層面的算法相關發(fā)明專利申請日漸增多。以協同過濾、社區(qū)發(fā)現、知識圖譜、用戶畫像、差分隱私等為代表的算法改進解決方案層出不窮。本文緊密圍繞“用戶畫像”這一熱點申請,通過對比五局專利申請態(tài)勢和審查結論差異,能夠讓讀者直觀感受到我國在專利申請數量上的優(yōu)勢和授權率方面的劣勢,進而通過用戶畫像領域兩件典型示例,為讀者解析了為何單純的畫像構建方法難以獲得專利保護,而現有規(guī)定中的“具有確切技術含義的數據”在客體判斷時如何具體適用。最后,本文在結束語中圍繞審查實踐和代理實務,給出了意見和建議,有助于促進專利審查和申請質量共同提升。