喻予
使用網絡搜索和社交媒體進行預測并不是最近才有的現象,經濟學家可能是研究使用大數據以預測市場動態(tài)和相關問題的較晚的職業(yè)之一。雖然存在著這樣那樣的復雜性,從股票市場到房地產市場等眾多研究,從在線大數據中獲取信息的預測能力都正在獲得廣泛的支持。雖然房地產基本面是市場的主要驅動力,情緒也在定價方面發(fā)揮作用。盡管解釋了難以解釋的真實數據,但對于作為泡沫產生和破裂根源的情緒數據來說,實際上更具挑戰(zhàn)性。
網絡信息的預測力
互聯網和社交網絡服務的出現,以及智能手機的廣泛傳播,徹底改變了我們交流和交流信息的方式。在這樣的大背景下,近年來不斷增加的用戶在線活動帶來的大數據已經成為一個熱門詞匯,因為它在市場營銷、政治預測、疾病控制、社會動態(tài)分析等多種用途上具有極大的潛力。
范里安開創(chuàng)性的研究展示了使用谷歌搜索查詢數據何以作為包括汽車銷售、旅游等在內的各種經濟活動的關鍵預測指標。前人的成果刺激了經濟學領域的后續(xù)研究,這主要集中在利用大數據來增加對涉及自身所關切利益的經濟變量的預測模型的預測能力。
Choi H. &. Varian H.(2012)認為,Google Trends每天都在產生大量與經濟發(fā)展相關的查詢結果,且這些查詢結果與當下的經濟活動之間必然存在著不容忽視的關系,或許可以對預測當下的經濟活動起到非常重要的作用。
許多機構和研究人員基于這些網略行為數據來源,對很多宏觀經濟問題做出了研究,Sun Y.(2010)研究了網絡搜索與通貨膨脹之間的相關性,Suhoy T.(2009)和DAmuri F. &. Marcucci J.(2009)分別通過網絡搜索引擎提供的數據預測了以色列與德國、意大利的失業(yè)情況。
現在,越來越多的研究在利用Google Trend進行經濟監(jiān)測和預測,除了通脹與失業(yè)的情況以外,Google Trend已被廣泛應用到房地產、旅游、零售業(yè)、個人消費、投資、金融等諸多可以反映宏觀經濟及市場景氣形勢的領域。
法國有關專家學者為該國市場構建了谷歌情緒指標,并發(fā)現了其與常用的替代情緒指標的相關性?;赩AR模型的實證檢驗表明,投資者情緒可對短期市場回報具預測,投資者情緒和股票回報率之間在兩周前的負相關性非常普遍。
另有專家學者確定了98個與股票市場相關的搜索詞,并發(fā)現在股市下跌之前,其搜索量的增長之間有聯系。研究表明,基于這些早期預警信號的交易策略明顯優(yōu)于隨機投資策略。此外,根據他們得出的結論,國家與國際SVI相比,更有效地解釋市場趨向,這可能是因為美國互聯網用戶中(私人)交易員的比例高于全球。
不過,經濟學家可能是研究使用大數據以預測市場動態(tài)和相關問題的較晚的職業(yè)之一,使用網絡搜索和社交媒體進行預測并不是最近才有的現象。
2008年成立的谷歌流感趨勢,利用谷歌的搜索引擎追蹤了25個國家流感的傳播。但隨著該項目難以做出準確預測,人們對該項目的興奮之情逐漸消退。2014年的《自然》(Nature)雜志肯定了社交媒體的“大數據”價值,但同時警告說,“我們離一個他們可以取代更傳統(tǒng)的方法或理論的地方很遠?!?/p>
搜索查詢可能包含用戶后續(xù)行動的信息的想法是基于這樣一個前提,即生活在當代社會的經濟代理人在作出重要的經濟決策(如購買耐用商品和金融投資)之前,很大程度上依賴于先前的信息搜索過程。
然而,信息需求的動機并不總是朝著這個方向發(fā)展;加強信息收集活動本身可能是對市場重大事件的簡單內生反應的表現,以尋求更多的信息,這可能會對下一輪的市場發(fā)展產生一定的影響。這些錯綜復雜的信息需求和市場結果之間的因果關系使得很難正確地評估大數據的真正重要性。
盡管存在這種復雜性,但從股票市場上到房地產市場上等的眾多研究,都支持從在線大數據中獲取信息的預測能力。
第一項在谷歌數據中單獨進行了與房地產相關的研究,調查了谷歌搜索指數對美國50個州的房價和成交量的影響。得出的結論是,搜索指數的增加與交易量和價格的上升正相關。此外,與主要類別(例如,房地產)相比,谷歌子類別(例如,房地產中介)的更高適用性通常被強烈顯示。
該研究在美國州的50個州測試了谷歌搜索引擎數據對住宅市場銷售和價格的預測能力,當他們調查以(子)類別的“房地產”和“房地產中介”來預測房屋銷售的能力時,“房地產”顯示不出任何意義。另一方面,“房地產中介”的分類似乎與銷售有很強的相關性。
“房地產”類別和房價之間沒有明顯的聯系,這可能是因為其在其所捕捉到的搜索(例如物業(yè)管理、房地產開發(fā))方面具有廣泛而未指明的性質。相比之下,房地產中介機構在未來四分之一的時間里是一個很好的預測者,但在不同的模型規(guī)范中,同期的關系是不同的。通過測試預測的準確性,該研究認為谷歌搜索指數增強模型的表現比沒有谷歌的更出色。
Kulkarni等學者基于城市層面的房地產相關關鍵字推出谷歌搜索指數,并測試其對美國20個最大的大都市統(tǒng)計區(qū)(MSAs)的“Case Shiller指數”的預測能力。通過進行雙向回歸,他們提供了谷歌搜索指數對房價有“格蘭杰”因果關聯的證據,但不是相反。Hohenstatt等學者在全美20個最大的MSAs中確認了這些結果。測試谷歌搜索數據是否為住房市場模型增加了解釋力,他們發(fā)現搜索數據顯著提高了適合度,尤其是在細分類別“房地產代理”作為交易的一個非??煽康闹笜说牡胤健?/p>
而學者Beracha和Wintoki調查了美國314個MSAs,并生成了“房地產”和“租金”的單一搜索查詢。通過對房價異常收益率的推論,他們發(fā)現,與低迷時期相比,搜索量對上漲的價格有更高的敏感度。
搜索趨勢“見”情緒
盡管有不同的理論作為依據,傳統(tǒng)觀點基本一致認為房價與交易量之間存在正向關系,當然也有一些學者如斯坦認為交易量領先于價格。所有這些理論,以及建立在這些理論基礎上的擴展,都集中在價格與交易量之間的關系以及相互作用上。然而,缺失情緒的不足業(yè)已被一系列的研究廣泛證明了。
由于房地產市場因其異質性而效率低下,而情緒因素可以描述市場變化的一部分,可這是公認的無法解釋的基本面。研究發(fā)現,雖然房地產基本面是市場的主要驅動力,情緒也在定價方面發(fā)揮作用。
隨著因特網用戶數量的增加和搜索引擎使用量的增加,利用搜索引擎提供的網絡搜索查詢數據這種收集市場數據的新方法變得越來越流行。人們通過搜索產品說明,選擇各種替代品,以及他們指定的要購買的東西,創(chuàng)造出一條線索,向搜索引擎揭示他們打算購買的東西。搜索引擎提供商可以跟蹤這些信息,Google憑借其獨特的利用Google趨勢工具公開提供的搜索查詢數據,提供了適當和強大的數據基礎。
越來越多的學術研究以谷歌搜索查詢數據為研究目的,深入于各個經濟部門,包括房地產研究領域?;谟脩魧μ囟ǜ信d趣領域信息的需求得到了很好的滿足,谷歌作為情緒指標的潛力被充分揭示了。這有助于研究人員對不久的將來作出推斷。
在越來越多的針對不同經濟部門的研究,尤其是房地產研究領域的研究成果的支撐下,谷歌的數據有可能同時考慮到消費者情緒的變化,從而能夠對現實世界近期的未來做出推斷。
這一優(yōu)勢可以很容易地用于銷售力度(例如房地產機構)的分配和時間安排。這一系列研究也為及時提供政策建議提供了一個有價值的指標,因為政策建議在其他方面取決于數據,而這些數據在報告之前往往會出現時滯。這是Google數據的主要優(yōu)勢,因為社會經濟信息只能在很長的時間內才能獲得,而且由于樣本較少,調查可能會有偏差。
谷歌搜索量數據克服了許多這樣的問題。谷歌通過其工具“谷歌趨勢2.0”(Google Trends 2.0)提供可公開訪問的搜索查詢數據,該工具是從“Google Insight for Search”發(fā)展而來的。與其他情感數據集不同的是,時間延遲幾乎可以被忽略,因為Google的數據在收集的兩天后便可獲得。此外,與基于調查的指標相比,數據收集所需的努力要少得多。還有,樣本量比較大,避免了上述問卷偏差等問題。
Hohenstatt和Kaesbauer等學者指出,盡管解釋了難以解釋的真實數據,但對于作為泡沫產生和破裂根源的情緒數據來說,甚至更具挑戰(zhàn)性。
在沒有買賣雙方匹配的情況下,純粹的買賣興趣可以通過谷歌的數據來衡量。提前還款決定的復雜動態(tài)(即利率調整、現金流出、住房周轉)取決于個人、社會經濟情況。在模擬房主決策時,跟蹤消費和儲蓄行為的變化、信用價值的變化、房主的信念是一項具有挑戰(zhàn)性的工作。個人對損失的厭惡是婚姻狀況或婚姻狀況的變化、非/就業(yè)、年齡等一系列社會經濟特征的組合。
谷歌的數據可以用來幫助監(jiān)控這些集群的情緒動態(tài)。例如,熱點可以通過谷歌搜索來識別,用來暗示有壓力的抵押貸款與失業(yè)、收入或其他傳統(tǒng)信貸市場指標等硬數據相背離,類似于谷歌潮流趨勢背后的推理。
當涉及到與房地產相關決策的聯系時,如何用不方便的工具跟蹤情緒數據的問題甚至更具挑戰(zhàn)性。谷歌的子類別房地產中介和家庭融資提供了一個答案。個人通過輸入特殊的搜索詞來顯示他們的意圖和興趣,相對來說是不偏不倚的。同時,跟蹤這些搜索詞,并基于許多不同的搜索詞創(chuàng)建索引,這些搜索詞從而指向相同的方向。這一特征通過影響給定子類別的前10個搜索查詢來證明。
對于房地產代理,搜索詞范圍從房地產經紀人、宅基地、房屋出售、地產出售到以向某些經紀公司詢問的方式查詢房產,如Zoopla,第一太平戴維斯或PrimeLocation(英國,2004—2010)。家庭理財融資子類的前10個搜索查詢詞匯是:抵押貸款、富國銀行(Wellsfargo)、抵押貸款計算器、抵押貸款利率、全國范圍、住房貸款、富國銀行、止贖、FHA和住房抵押貸款,反向抵押、FHA貸款甚至封閉性的搜索查詢量不斷增加。
商業(yè)地產中的應用
住房要么作為自有住房,要么作為創(chuàng)收資產,而商業(yè)地產通常只用作后者。這在一些時期尤為明顯,例如,出售和租賃回購交易很流行的時候。與典型的購房者不同,商業(yè)房地產買賣雙方主要是專業(yè)人士,目的是使他們的收入最大化。
商業(yè)地產比住宅少,但前者的單位價值通常要高得多,它們構成了一個不同的資產類別。因為它們在規(guī)模、價值和跨部門(零售、辦公、工業(yè)等)方面差異很大,這使得它們更難相互比較。良好的預測對商業(yè)房地產行業(yè)的重要性非常顯著。在選擇未來投資時,房地產投資者感興趣的是什么類型的房地產市場比其他類型的市場發(fā)展得更好。
機構投資者,如保險公司或房地產基金,在分配資金時通常有一個特定的投資視野。因此,它們對不同地區(qū)和部門的房地產市場表現作出了含蓄和明確的預測。房地產咨詢公司發(fā)布市場報告,其中他們給出了市場活動和運動的前景。地產發(fā)展商在進行可行性研究時,特別關注未來租金和價格的發(fā)展。銀行和其他房地產融資機構在作出信貸審批決定時,對市場走向感興趣。
商業(yè)地產的獨特屬性使得該市場的行為與普通房地產市場有所不同,這使得商業(yè)地產市場在預測方面成為一個特例。雖然有關商業(yè)房地產預測的文獻不如關于住房的文獻全面,但仍有許多研究對市場行為的預測進行了研究。
目前已達成廣泛共識的是,基本經濟指標“不能充分考慮到未來的回報變動”。這意味著有一些無法觀察到的影響市場的因素,而這些因素并沒有被基本面所捕捉到。務必引起重視的是,情緒在定價方面也發(fā)揮作用,當然,盡管房地產基本面是市場的主要驅動力。
有研究發(fā)現,從Probit方法中使用的商業(yè)趨勢調查得出的信心數據,在歐洲三大寫字樓市場產生了可接受的早期租金增長轉折點信號。這兩項研究要么使用基于調查的情緒指標,要么使用共同的領先經濟指標(例如出口訂單、零售銷售、汽車登記等)。
雖然情緒/領先指標在預測行業(yè)中的應用前景廣闊,但也存在一些不足。首先,這些指標大部分都是在兩個月內公布的。就以調查為基礎的指標而言,數據收集既昂貴又費時。此外,被指定的回答者是否總是實際回答問題單的人是值得懷疑的,如果是的話,她是否總是如實回答問題。后者也可能與擔心泄露敏感信息有關,因為缺乏匿名標準。出口訂單、汽車登記或零售銷售等領先指標不受這些問題的影響,但就其基礎而言,與房地產市場完全脫節(jié)。
德國雷根斯堡大學國際地產商學院三位教授的一項研究明確表示,利用這類指標對高度復雜的商業(yè)房地產市場進行月度預測似乎有些不盡人意,不過,谷歌搜索量數據可以克服許多此類的問題。
與其他情感數據集不同的是,時間延遲幾乎可以被忽略,因為Google的數據在收集的兩天后才能獲得。更不用說,與基于調查的指標相比,數據收集所需的努力要少得多。此外,樣本量比較大,避免了上述問卷偏差等問題。搜索量索引(SVI)可以過濾某些類別或關鍵字,以使索引的情況具體。如果使用正確,SVI應該顯示搜索者需要的信息,并且不失真。從2004到現在,GoogleTrend用戶每周都可以檢索和下載在線搜索查詢的歷史日志。
Dietzel和Braun等學者增加了羅伯茨和亨內貝里設計的交易模型,以突出投資者利用互聯網的各個階段,從而揭示他的具體興趣。不可否認,一個(大型)專業(yè)機構投資者,很難在互聯網上簡單地“谷歌”購買他想購買的房產。這當然是有道理的,因為一個大投資者很可能會直接與房地產經紀人取得聯系。不過,通過進行在線研究,就像投資/研究部門通常在為未來投資決策收集信息時所做的那樣,投資者最終還是會顯示出自己的興趣。有關專家學者堅信,越多的搜索者表現出這樣的興趣,對房地產的需求就越大。