□文/姜姝姝
人工智能創(chuàng)業(yè),向需求要效益
□文/姜姝姝
姜姝姝
本刊副總編輯
人工智能(AI)創(chuàng)業(yè)的外部條件比較有利,但是時機合適不合適還是要看自身。大公司解決人類的大問題,中小公司負責行業(yè)內(nèi)的縱深。用戶有需求的地方,就是AI落地的方向。
“它可能是歷史上最好的事情,也可能是歷史上最壞的事情。”劍橋大學應用數(shù)學及理論物理學系教授,當代最重要的廣義相對論和宇宙論家史蒂芬·霍金在劍橋大學新萊弗爾梅未來智能中心里這樣評價AI。
這并非霍金第一次在AI問題上表態(tài),但這一次霍金肯定了AI的積極影響?!叭藗兛梢酝ㄟ^創(chuàng)造智能來進入一個有積極效應同時未知的世界。我們或許可以通過新技術(shù)改革的工具來消弭工業(yè)化對自然世界的傷害。人類最終需要達到的目的是消除疾病和貧窮?!?/p>
與科學家的審慎不一樣,產(chǎn)業(yè)界盛產(chǎn)的是“野心家”、“冒險者”、技術(shù)派的初創(chuàng)團隊迅速行動。從全球創(chuàng)新中心的美國硅谷來看,自2011年以來,開發(fā)與AI相關(guān)的產(chǎn)品和技術(shù)并使之商業(yè)化的公司已獲得超過總計20億美元的風險投資,而科技巨頭更是投資數(shù)十億美元收購那些AI初創(chuàng)公司。在有著一流人才的中國,AI的創(chuàng)業(yè)大潮也大規(guī)模啟動。
“公司的正式運營是從2014年8月開始的,當時投資人和創(chuàng)始人團隊都認可智能語音是下一個風口?!睒O限元聯(lián)合創(chuàng)始人馬驥說,語音是極限元起步時做的第一個方向。一方面,深度學習技術(shù)的突破引發(fā)了語音技術(shù)的新變革,尤其是識別率和合成效果得到了大幅提升,行業(yè)中也出現(xiàn)了一些新增需求;另一方面,極限元的創(chuàng)始團隊中也有來自中科院以及清華大學的語音技術(shù)人才。
人工智能領(lǐng)域,技術(shù)創(chuàng)業(yè)者如果只定位做技術(shù)提供商,而不直接面向用戶/客戶提供整體解決方案,未來價值會越來越小,不往上游走風險非常大,甚至是死路一條。這是前段時間,迅雷創(chuàng)始人程浩振聾發(fā)聵的總結(jié)。
和程浩持有相似觀點,馬驥所在的這家公司創(chuàng)業(yè)之初就定位在以需求為導向,雖然在大AI領(lǐng)域并不高調(diào),但是三年來穩(wěn)打穩(wěn)扎,成為AI創(chuàng)業(yè)公司中明顯具備商業(yè)化能力的代表。
一開始他們就確立了to B的方向,公司在確定語音前期的產(chǎn)品化和工程化工作大概用了半年時間,2015年下半年,極限元開始交付一些語音技術(shù)項目,和語文出版社的合作是最具代表性的一例。
眾所周知,在語音智能的領(lǐng)域,前有科大訊飛等“老”公司,也有BAT、搜狗等的搶位,類似極限元這類還有機會嗎?“大公司解決人類的大問題?!瘪R驥說,AI的生意在于to B的領(lǐng)域,大公司面向to C的免費模式,和AI領(lǐng)域的創(chuàng)業(yè)不一樣,雖然深入行業(yè)的量不大,但是足以承載這些小公司的業(yè)務(wù)。
這個觀點和創(chuàng)新工場創(chuàng)始人、CEO李開復的說法很像,“人工智能是to B的生意,AI時代工程師和to B的一個協(xié)作,不可能快速帶來千萬的量,所以希望業(yè)內(nèi)不要將人工智能的估值炒得過高。”
以to B的需求為導向,是極限元對自身的定位。這樣的定位也決定了極限元能用兩年多時間,將語音和視覺等一系列技術(shù)應用于教育、電信、電力、娛樂、視頻、駕駛等眾多領(lǐng)域。
AI并不是一個新的概念和領(lǐng)域,但是重新火起來,是因為出現(xiàn)了一系列復興AI研究進程的要素,尤其是GPU、大數(shù)據(jù)、云計算和算法。
極限元聯(lián)合創(chuàng)始人馬驥
大數(shù)據(jù)是AI發(fā)展的助推劑,這是因為有些AI技術(shù)使用統(tǒng)計模型來進行數(shù)據(jù)的概率推算,比如圖像、文本或者語音,通過把這些模型暴露在數(shù)據(jù)的海洋中,使它們得到不斷優(yōu)化,或者稱之為“訓練”。無論是吳恩達曾經(jīng)選擇加盟百度還是李飛飛進入Google,一大原因都是要到“數(shù)據(jù)最大的地方去”。
而從技術(shù)發(fā)展的角度來看,隨著Google TensorFlow等生態(tài)系統(tǒng)的成熟,很多領(lǐng)域都會有訓練好的模型可以用來參考,創(chuàng)業(yè)者只要有足夠的數(shù)據(jù)來訓練參數(shù)就好了。所以數(shù)據(jù)的壁壘,似乎成了AI創(chuàng)業(yè)中難以邁過的檻。
數(shù)據(jù)壁壘有兩個方面,一個是量,一個是質(zhì)。馬驥說,在數(shù)據(jù)量上面,BAT大公司天然有一些行業(yè)優(yōu)勢,對于創(chuàng)業(yè)團隊來說,在量上面也是局限所在,而在質(zhì)上面需要有效性。極限元在這方面設(shè)立數(shù)據(jù)崗位,去獲取需要的數(shù)據(jù),另外與數(shù)據(jù)供應商合作,互換有無?!白钪匾囊稽c是我們以toB垂直行業(yè)的用戶定制化需求為主,行業(yè)用戶本身會為我們提供大量數(shù)據(jù)。”
BAT的優(yōu)勢在于通用數(shù)據(jù),但是在深入的垂直行業(yè)中,數(shù)據(jù)的優(yōu)勢可以掌握在方案提供商手中。
方案提供商其實是有別于單一技術(shù)服務(wù)的,剛剛開始創(chuàng)業(yè)時極限元也跟國內(nèi)其他一些智能語音公司類似,把語音合成和語音識別技術(shù)以SaaS服務(wù)的方式部署在云平臺上,借此吸引一些移動應用、智能硬件的開發(fā)者和創(chuàng)業(yè)團隊,從而發(fā)掘潛在的優(yōu)質(zhì)客戶。但實際情況并不如預期的順利,不僅無法獲得現(xiàn)金流支持,也不能真正接觸到優(yōu)質(zhì)客戶。
因為有切實需求的客戶要的是完整的解決方案,而單一技術(shù)只能滿足客戶局部的技術(shù)需求。理清思路后極限元迅速在直播領(lǐng)域找到了突破方向,通俗的說就是“鑒黃”。這套互聯(lián)網(wǎng)音、視頻有害信息監(jiān)測系統(tǒng)是針對互聯(lián)網(wǎng)直播平臺的涉黃監(jiān)測技術(shù)方案,通過AI圖像識別技術(shù)發(fā)現(xiàn)視頻直播中的涉黃信息并給予平臺警告,監(jiān)測系統(tǒng)除圖像識別外還加入音頻監(jiān)測技術(shù)用以監(jiān)測語言類直播內(nèi)容,音、視頻雙通道監(jiān)測方案已經(jīng)在國家網(wǎng)絡(luò)監(jiān)管部門成功應用。在這樣的方案下,極限元也積累到了真正的行業(yè)大數(shù)據(jù)。
對于語音智能、圖像識別這樣的技術(shù)服務(wù)來說,基本能服務(wù)所有行業(yè),那么如何在其中選一個行業(yè),深入扎進去做產(chǎn)業(yè)鏈的挖掘呢?極限元的想法是,會仔細分析客戶所在的行業(yè)是否存在同樣的技術(shù)需求,以及行業(yè)內(nèi)是否有一些普遍存在的行業(yè)性難題亟待解決,有針對性的為整個行業(yè)用戶提供技術(shù)解決方案,由點到面,從服務(wù)單一客戶過渡到服務(wù)于整個行業(yè)。
這就意味著不僅要完成一個客戶的需求,還要發(fā)掘行業(yè)中類似需求的共性,把成熟方案復制到同行業(yè)的其他客戶需求上,把自己研發(fā)投入的回報率做到最大化。一旦找到了這樣的可復制方案的行業(yè),就不僅能在商業(yè)上吃透這個行業(yè),還能在技術(shù)上通過橫向合作不斷獲取行業(yè)數(shù)據(jù)來夯實技術(shù)。
行業(yè)解決方案一方面可以不斷提升服務(wù)品質(zhì),保障技術(shù)服務(wù)能力,另一方面不斷將產(chǎn)品線服務(wù)的對象延伸到產(chǎn)業(yè)上游。馬驥說,誰越靠近上游的消費者,誰越接近終端消費者,誰的話語權(quán)就越高,“我從華為出來,華為都是只領(lǐng)先半步,不領(lǐng)先一步,因為領(lǐng)先半步是先進,領(lǐng)先一步是先烈?!?/p>
深入行業(yè)的解決方案也意味著靠近這個行業(yè)的用戶,從直播行業(yè)出發(fā),如何靠近用戶?極限元想到了“服務(wù)”主播,不僅提供了便于互動的“音視頻互動系統(tǒng)”,最大限度地還原人與人面對的場景;為了解決該問題,極限元推出了集美顏、動畫特效、水印、人臉道具等視覺特效增強功能。
真正的需求都是來自對行業(yè)的深入了解,極限元除了直播領(lǐng)域,還試水了疲勞駕駛檢測儀。這是針對交通行業(yè)的疲勞駕駛檢測智能硬件產(chǎn)品,它可以檢測用戶在開車時是否存在危險駕駛行為,并進行語音提醒。
但疲勞駕駛檢測儀雖然是智能硬件產(chǎn)品,但并非面向C端,而是to B的產(chǎn)品。極限元將產(chǎn)品提供給一些客運、貨運、危險品運輸公司、保險公司以及交通監(jiān)管部門,在語音提醒司機正在危險駕駛的同時,還會將圖像、GPS、時間、車況、路況等信息傳輸給大數(shù)據(jù)平臺,為用戶提供數(shù)據(jù)分析服務(wù)。
從行業(yè)到數(shù)據(jù)再到用戶,這樣的閉環(huán),對于AI創(chuàng)業(yè)公司,是一個良性的模式。而這一切的出發(fā)點,是對真實需求的挖掘?!艾F(xiàn)在人工智能面臨的問題是閉門造車,然后去市場上找對應的客戶,這樣是不對的?!弊鳛锳I領(lǐng)域的從業(yè)者、創(chuàng)業(yè)者,馬驥再次提醒著新入場者,“AI創(chuàng)業(yè)的外部條件比較有利,但是時機合適不合適還是看自身,有沒有針對行業(yè)的解決方案,能不能快速拿出可以真正落地的技術(shù)。”
手機掃碼閱讀