崔鵬
投資者有辦法鑒別出那些千變?nèi)f化的騙子嗎?
說實話這可真不是件容易的事。渾水的卡森·布洛克在這方面做得不錯,先于那些投資銀行和煞有介事的投資引導(dǎo)大咖發(fā)現(xiàn)了瑞幸咖啡的騙局。不過據(jù)說他為此雇傭了92名全職員工和1418名兼職員工,對瑞幸620家門店進行監(jiān)控,并記錄了流量—總共花費大概上千萬美元。
也許布洛克能通過做空瑞幸的股票把那些花銷賺回來。但可以肯定,這種布局普通人無論如何都做不到—如果識破騙局這么貴,那還是讓騙子騙我吧。
有其他更便宜、更簡單的做法嗎?數(shù)學(xué)家和行為學(xué)家為我們準備了一些,來試試下面這個。
先來個故事。大約一百年前,美國紐約有個電氣公司的工程師,叫弗蘭克·本福特。有一次工作中本福特要用到對數(shù)。在當時還沒有計算器,要知道對數(shù)值就得到圖書館用對數(shù)表來查。
你還記得高中時數(shù)學(xué)老師帶著大家查的對數(shù)表嗎?本福特要用的也就是那個。他在查表的時候有一個發(fā)現(xiàn),這種小冊子前邊的頁已經(jīng)被使用者翻得很舊了,后邊的頁卻和新的一樣。這是為什么呢?
本福特對這種現(xiàn)象有個假設(shè),就是在生活中,人們接觸到各個數(shù)字的頻率是不一樣的。為了滿足這個好奇,他對能接觸到的數(shù)字做了普查,結(jié)果還是挺驚人的。
本福特發(fā)現(xiàn)對數(shù)表前邊頁碼被用舊的速度遠大于后邊頁碼的原因是,生活中遇到的以1和2開頭的數(shù)字遠多于以8和9開頭的數(shù)字。
經(jīng)過幾位數(shù)學(xué)家對本福特發(fā)現(xiàn)的填補,他們總結(jié)出、以1到9開頭的數(shù)字,在生活中所占比例分別是:30.1%、17.6%、12.5%、9.7%、7.9%、6.7%、5.8%、5.1%、4.6%。
這個規(guī)律被命名為“本福特定律”。
但是,說了半天,這個定律對鑒別騙子有什么用呢?
有挺大的用呢。
你可以用這個定律的逆否命題,來判斷別人是不是在騙你—也就是說,如果你發(fā)現(xiàn)別人提供給你的一大堆數(shù)字,它們的首位數(shù)的所占比例分配和本福特定律所說的相差很大,那么這些數(shù)字可能就是人為編出來的。
當然,在識別騙子的游戲中應(yīng)用本福特定律,要滿足兩個條件,一個是你統(tǒng)計的數(shù)字是商業(yè)活動中隨機的,第二統(tǒng)計的數(shù)字不能太少,比如起碼要多于200個。
不過,由于“域”的問題,像成年人的年齡、體重和身高,即使?jié)M足我上邊說的兩個條件,它們也不會符合本福特定律。
本福特定律更適合的領(lǐng)域是商業(yè)問題。這不正是大家想要的嗎?
有沒有令你生疑的投資品或者上市公司的業(yè)績?可以用它來試一下。
先說下我做的。
我懷疑的公司是個明星公司,馬斯克的特斯拉。這家公司的問題除了從去年年底激增的應(yīng)收賬款,還有可能存在財務(wù)造假。用芒格的話說就是,馬斯克太想把事辦好了,但事情的難度要比馬斯克所具有的能力稍高一些。在這種情況下,人們?nèi)鲋e的概率就會增加。
如果識別騙子的成本太高,你可以試試那些有趣的數(shù)學(xué)方式。
我的方法是,從特斯拉公司的公開財務(wù)數(shù)據(jù)中搜羅了552個所謂的隨機數(shù)(它們都是生產(chǎn)、銷售、費用等運營行為產(chǎn)生的數(shù)字),這些數(shù)字覆蓋了從2018年開始的財報。
我對這些數(shù)據(jù)按照首位數(shù)字從1到9歸類,然后和本福特規(guī)律對比。
特斯拉的數(shù)據(jù)和本福特曲線相比似乎并不是特別不著邊。但它有它的問題,那就是以1開頭的數(shù)字相當多,達到了35%,比本福特曲線的比例高了5%。這種情況會發(fā)生在怎樣的公司呢?
特斯拉的這張圖有個影子版本,那就是費爾菲爾德·森特里月度回報數(shù)據(jù)基金的本福特分布圖。費爾菲爾德·森特里基金就是大名鼎鼎的麥道夫騙局基金。
伯納德·麥道夫曾經(jīng)是納斯達克主席,大約從1992年他就開始編織他的龐氏騙局基金,一直騙到了2008年年底受金融危機影響才露餡。麥道夫本人被判了150年徒刑。
麥道夫的基金的數(shù)字也有這個特點—“1”多。為什么會有這種現(xiàn)象呢?因為麥道夫的基金要給客戶平穩(wěn)贏利的印象,所以他的基金就像完成作業(yè)一樣有很多個月的收益都是1%多一點。對于對沖基金來說這幾乎是不可能的,那些數(shù)據(jù)中有很多是麥道夫和他的助手編造的,有的數(shù)字甚至是他打高爾夫球時的得分。
一般來說,人們會把自己公司的目標定立為以“1”開頭的數(shù)字。如果公司運營完成了這些目標,那么在報表中以“1”開頭的記錄就會特別多,同時以“7”“8”“9”開頭的數(shù)字會很少。
但總是能如約完成計劃的公司是非常令人懷疑的—怎么會總是這么巧呢?
當然了,只憑一張本福特表格不能構(gòu)成對一家公司的指控,但已經(jīng)可以增加投資者的懷疑了。
另外,本福特定律除了首位數(shù)字統(tǒng)計,還有更厲害的殺手锏,那就是末尾兩位數(shù)字謊言識別。
末尾兩位數(shù)字謊言識別,就是統(tǒng)計相當數(shù)量的隨機數(shù)字的末尾兩位數(shù)字,如果它們真的是隨機的,那么這種分布應(yīng)該是下面這個樣子。
從00到99一共100個數(shù)字,這些數(shù)字的末兩位出現(xiàn)的數(shù)如果是隨機的,它們出現(xiàn)的平均概率應(yīng)該是1%。
為了驗證一下末尾兩位數(shù)字的測謊功能,我找到了一份我的一個熟人和別人合伙開店的財務(wù)單子(很久以前的事了),從中搜羅了449個數(shù)據(jù),然后統(tǒng)計了它們的末尾兩位數(shù)出現(xiàn)情況的概率分布。
怎么從末尾兩位數(shù)看這些數(shù)據(jù)是不是瞎編的?
大概可以用下面三個“篩子”,看看這些數(shù)字是否異常。
① 某些末兩位數(shù)出現(xiàn)的頻率是否太高?重點關(guān)注出現(xiàn)頻率占比超過4%的兩位數(shù)。同時,根本不出現(xiàn)的兩位數(shù)是否太多?如果這種情況嚴重,數(shù)據(jù)經(jīng)過人為編造的可能性增加。
② 末兩位為重復(fù)數(shù)字的占比是否過低?如果是,數(shù)據(jù)經(jīng)過編造的可能性增加。重復(fù)數(shù)字就是00、55、99之類的數(shù)。
③ 降序數(shù)字是否過多?如果過多,其中有編造數(shù)據(jù)的可能性增加。所謂的降序數(shù)字就是32、43、54這類數(shù)。
通過分析,很遺憾,這是一份令人懷疑的報表。
① 首先,出現(xiàn)頻率超過4%的數(shù)字有3個,這有點離譜,特別是以36結(jié)尾的數(shù)字,出現(xiàn)了18次。另外有5個兩位數(shù)從未出現(xiàn)過,有13個兩位數(shù)只出現(xiàn)了1次。
總體來說,這些數(shù)字的不平均狀況有點夸張。
② 重復(fù)數(shù)字的出現(xiàn)概率比較低,10個兩位數(shù)一共出現(xiàn)了19次,比平均數(shù)低了26次。
③ 降序數(shù)頻繁出現(xiàn),一共87次,超過平均數(shù)42次。
實際上,總體來說,用本福特定律檢查數(shù)據(jù)是否真實,在民間的應(yīng)用將更有效。這是因為那些上市公司的數(shù)字即使是編造的,但大多數(shù)經(jīng)過了多重美化。但民間的這些往來報表,如果是編造的,那就是赤裸裸的編造,用本福特首數(shù)和尾數(shù)檢測法,大多可以令其原形畢露。