他是全球語音識別的破壁人,是醫(yī)療AI的拓荒者,更是海淀“從實驗室到生產(chǎn)線”創(chuàng)新生態(tài)的踐行者。
“人工智能不是冰冷的代碼,而是有溫度的服務(wù)?!痹浦曋悄芸萍紕?chuàng)始人黃偉帶領(lǐng)團隊深耕智能語音領(lǐng)域10余年,從聲紋識別技術(shù)突破到“山海”大模型研發(fā),不僅填補了國內(nèi)智能語音交互的技術(shù)空白,更讓AI真正“聽懂”了百姓需求。如今,這項技術(shù)已廣泛應(yīng)用于醫(yī)療、家居等民生領(lǐng)域,用科技溫暖千家萬戶。
讓聲紋識別走進病房與客廳
黃偉的科技之路始于中國科學(xué)技術(shù)大學(xué),這位信號與信息處理專業(yè)的博士畢業(yè)后,先后在摩托羅拉中國研究中心和盛大創(chuàng)新院積累了豐富的科研經(jīng)驗。這期間,黃偉主導(dǎo)開發(fā)出全球第一款手機聲紋認證系統(tǒng),他連續(xù)三年參加美國國家標(biāo)準(zhǔn)技術(shù)署的說話人識別評測,并三次將世界第一的桂冠攬入懷中,是至今唯一在該全球頂級評測中連續(xù)兩年做特邀發(fā)言的華人。
2012年,iPhone 4S搭載Siri語音助手引發(fā)了全球智能語音創(chuàng)業(yè)浪潮,黃偉看到了人機交互的未來機會,不惜背水一戰(zhàn),創(chuàng)立了云知聲。
云知聲率先將深度神經(jīng)網(wǎng)絡(luò)(DNN)應(yīng)用于商業(yè)語音識別系統(tǒng),構(gòu)建了國內(nèi)首個永久免費的語音平臺,成為國內(nèi)最早將深度學(xué)習(xí)算法應(yīng)用于商業(yè)語音識別的公司之一。
隨后,云知聲推出了業(yè)界首個免費語音識別公有云軟件,成功上線微信,并在白色家電(洗衣機、空調(diào)、電冰箱等)上實現(xiàn)了AI語音交互。 2016年,云知聲在格力智能語音空調(diào)上,率先完成白色家電領(lǐng)域的規(guī)?;慨a(chǎn)驗證,獲得智能家居“奧斯卡”—AWE艾普蘭核心獎。
在黃偉的科技版圖中,技術(shù)突破從來不是最終目的,如何讓AI真正服務(wù)于人類生活才是他始終思考的問題。2014年,黃偉選定物聯(lián)網(wǎng)(IoT)和智慧醫(yī)療作為云知聲商業(yè)化兩大主要場景。
在物聯(lián)網(wǎng)領(lǐng)域,黃偉認為,隨著設(shè)備智能化程度提高,語音將成為最自然的人機交互方式?!胺块g設(shè)備越來越智能化,有個弊端就是太復(fù)雜了,老人小孩都不會用。但大家都會說話,用語音是最好的交互方式?!秉S偉說?;谶@一判斷,云知聲的智能語音技術(shù)廣泛應(yīng)用于智能家居、智能車載等場景,讓科技真正融入日常生活。
2023年,云知聲與睿藍汽車合作推出的AI大模型車載系統(tǒng),能夠深度理解用戶需求,提供全場景情感化交互體驗。
在智慧醫(yī)療領(lǐng)域,2015年云知聲就將降噪、識別、理解技術(shù)融合以語音電子病歷切入醫(yī)療行業(yè),一年后與北京協(xié)和醫(yī)院合作,率先在國內(nèi)落地。
醫(yī)療領(lǐng)域是黃偉投入最多熱情的賽道。2016年,每天早上7點的北京一家三甲醫(yī)院晨會上,總能見到黃偉的身影。他與醫(yī)生們深入交流,了解醫(yī)院信息化需求,推動云知聲的語音識別技術(shù)在醫(yī)院落地。
“醫(yī)院不看產(chǎn)品的學(xué)術(shù)指標(biāo),直接拿到病房,找各種口音的人做現(xiàn)場測試?!秉S偉說。這種務(wù)實作風(fēng)讓云知聲的醫(yī)療產(chǎn)品快速成熟,從最初的電子病歷語音錄入系統(tǒng),發(fā)展到如今覆蓋醫(yī)務(wù)、醫(yī)管、醫(yī)保全流程的智慧醫(yī)療解決方案。通過電子病歷系統(tǒng)實時生成規(guī)范病歷,與打字輸入相比,這種語音輸入系統(tǒng)將病歷錄入速度提高了4至6倍,大大減輕了醫(yī)生的工作負擔(dān)。
隨著在這一場景的積累,云知聲構(gòu)建起了醫(yī)療領(lǐng)域的知識圖譜,并基于大規(guī)模醫(yī)療知識圖譜,實現(xiàn)智能病歷質(zhì)控系統(tǒng)、智能單病種質(zhì)控系統(tǒng)、智能醫(yī)保審核系統(tǒng)、智能導(dǎo)醫(yī)機器人等從感知到認知的智能化解決方案。
無論是醫(yī)療還是物聯(lián),黃偉始終堅守一個信念:技術(shù)必須服務(wù)于人?!拔覀冏非蟮牟粌H是讓AI技術(shù)像水電一樣普及,更重要的是讓技術(shù)真正滿足人的需求?!秉S偉說。
讓“雨燕”芯片到“山?!贝竽P?/p>
隨著物聯(lián)網(wǎng)設(shè)備的爆發(fā)式增長,海量終端需要在邊緣側(cè)快速處理數(shù)據(jù),同時借助云端的強大計算能力,實現(xiàn)智慧化功能。這種端云協(xié)同的需求催生了對高性能、低功耗AI芯片的迫切需求。
2014年,黃偉帶領(lǐng)團隊構(gòu)建了“云—端—芯”三位一體的技術(shù)架構(gòu),隨后開始研發(fā)芯片。對于其研制的芯片,黃偉信心十足,他曾在采訪中透露,彼時,他們團隊打造的芯片,性能比傳統(tǒng)模組提升了50倍,功耗和價格大幅降低,還支持多種深度神經(jīng)網(wǎng)絡(luò)模型。
2018年,云知聲首款A(yù)I語音芯片“雨燕”發(fā)布并量產(chǎn),推動智慧家居語音交互普及。
2019年,“蜂鳥”芯片問世,專為智慧家居設(shè)計。例如,TCL的小藍翼C7新風(fēng)空調(diào)搭載了云知聲的智能語音技術(shù)和“蜂鳥”系列芯片模組,在智能語音功能上實現(xiàn)了重大升級,新增離線自由說、多語言識別和聲紋識別三大創(chuàng)新功能,極大地提升了用戶體驗,為TCL的產(chǎn)品帶來了更高的附加值和市場競爭力,同時也為云知聲帶來了可觀的商業(yè)收入。
云知聲先后推出了十余款蜂鳥系列解決方案。截至目前,“蜂鳥”系列芯片已累計賦能近700品類家居設(shè)備,覆蓋多種日常生活場景,保持著市場占有率的領(lǐng)先地位。
2022年,業(yè)界首款車規(guī)級語音AI專用芯片“雪豹”在客戶量產(chǎn)車型上落地出貨。云知聲的車規(guī)級全棧式語音AI芯片通過了AEC-Q100認證,具備全離線AI功能,支持離線語音搜索、語音喚醒、聲源定位和多音區(qū)識別。其語音深度學(xué)習(xí)處理速度提升64倍,釋放主控算力資源近40%。在吉利博越L和星瑞項目上,“雪豹”芯片提供了多音區(qū)技術(shù)、降噪技術(shù)、藍牙通話降噪技術(shù)、離線喚醒和離線識別等技術(shù)服務(wù),為用戶帶來更加智能、安全、便捷的駕駛體驗。
數(shù)據(jù)顯示,2024年云知聲芯片出貨量達3600萬顆且預(yù)計持續(xù)增長。
2022年底以ChatGPT為代表的大語言模型發(fā)布,國內(nèi)外諸多玩家也在積極探索以大模型為基礎(chǔ)的智能體(Agent)。
2023年5月,云知聲發(fā)布參數(shù)規(guī)模達600億的“山海”大模型,交出了在AGI(通用人工智能)領(lǐng)域的第一張答卷。
為了訓(xùn)練“山海”大模型,云知聲團隊每天要處理幾十萬小時的語音數(shù)據(jù),這些數(shù)據(jù)大部分是通過數(shù)碼合成方式生成的?!安畈欢嗫梢宰龅矫刻旌铣蓭兹f小時的數(shù)據(jù)?!秉S偉說,這種腳踏實地的技術(shù)積累,讓“山?!贝竽P驮谡Z言生成、語言理解、知識問答等領(lǐng)域展現(xiàn)出強大能力。
彼時,山海大模型的語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項通用能力,及插件擴展、領(lǐng)域增強、企業(yè)定制三項行業(yè)落地能力已經(jīng)處于業(yè)界前列。
在此基礎(chǔ)上,云知聲通過快速整合具體業(yè)務(wù)場景的相關(guān)知識與規(guī)范,打造了醫(yī)療病例生成Agent、交通客服Agent、智能座艙Agent等典型的行業(yè)Agent應(yīng)用。
云知聲聯(lián)合創(chuàng)始人、副總裁李霄寒在采訪中透露,2025年云知聲將All in大模型,旨在通過新的技術(shù)路線,帶來新的體驗和價值。
從專注語音識別的初創(chuàng)企業(yè),到掌握AI芯片與大模型核心技術(shù)的行業(yè)領(lǐng)軍者,黃偉用10年時間實現(xiàn)了令人矚目的技術(shù)跨越。
“對創(chuàng)業(yè)者來講,容易走的路多半都是死路?!痹邳S偉看來,AI技術(shù)研發(fā)沒有捷徑可走,必須一步一個腳印。
AI創(chuàng)業(yè)者的情懷與擔(dān)當(dāng)
創(chuàng)業(yè)的征程如人飲水,冷暖自知。只有真正走過的人才能體會到一路艱辛。當(dāng)一路升級打怪,經(jīng)歷過千難萬難的淬煉后,成就的是創(chuàng)始人一顆強大的內(nèi)心。
2012年創(chuàng)業(yè)之初,為了支撐公司早期的發(fā)展,黃偉在把自己家底掏光之后借了200萬元,寫下了人生的第一張欠條?!拔屹I房子貸款都沒貸過這么多錢。但你追求的結(jié)果是這輩子絕大多數(shù)人都實現(xiàn)不了的一個夢想,當(dāng)然要為這個夢想付出代價?!秉S偉說。
創(chuàng)業(yè)最大的收獲是成長,也是對創(chuàng)始人學(xué)習(xí)能力的考驗。從技術(shù)管理者到創(chuàng)業(yè)公司的CEO,需要懂產(chǎn)品、懂商業(yè)、懂資本、懂人才,慢慢變成一個全能型選手。收獲的另外一面是付出的代價,在黃偉看來,孤獨就是代價。
很多時候,黃偉會選擇一個人去堅持、默默把問題解決,讓所有人看到結(jié)果。團隊也因此更有信心?!昂芏嘈睦镌挷荒芨鷪F隊說,他們不能幫你解決問題,而且你不能把負面情緒傳遞出去?!?/p>
如果時間撥回到2018年,會看到黃偉寫的PPT上有著這樣一句話:世界上最難走的路才是捷徑。“對創(chuàng)業(yè)者來講,容易走的路多半都是死路?!?/p>
“我還有一個歪理,說一件事情很難,就是它的成功概率可能只有5%,95%會失??;但是可能有95%的人選擇了容易走的路,或者因為難而放棄了,那你的成功概率就不是5%,而是 100%?!?/p>
回首創(chuàng)業(yè)路,黃偉真實感受到了在資本助推下AI公司的潮起潮落。越來越多的 AI 企業(yè)不得不嘗試探索更廣泛的行業(yè)落地場景。如何找到真正的行業(yè)痛點,滿足降本增效需求;如何讓一家靠技術(shù)驅(qū)動的公司健康發(fā)展,創(chuàng)造商業(yè)價值與社會價值,成為AI創(chuàng)業(yè)者的新考題。
“無論是大語言模型,還是多模態(tài)大模型,我們都看到了非常清晰的遠景,但是挑戰(zhàn)也非常大,對所有從業(yè)者來說,想要做更好的技術(shù)、更好的產(chǎn)品,打造更健康的商業(yè)模式,就要放棄浮躁的心態(tài),去追求產(chǎn)品落地。只有這樣,中國人工智能行業(yè)才能健康發(fā)展,而不是充滿泡沫—如果泡沫破裂的話,對中國人工智能行業(yè)將是巨大的傷害。”黃偉說道。
從實驗室到產(chǎn)業(yè)應(yīng)用,從技術(shù)創(chuàng)新到社會價值,黃偉用十余年時間詮釋了“科技向善”的深刻內(nèi)涵。在他的帶領(lǐng)下,云知聲不僅成為智能語音領(lǐng)域的領(lǐng)軍企業(yè),更探索出一條AI技術(shù)造福社會的可行路徑。
不久前,黃偉榮膺2024年度感動海淀文明人物,正如“感動海淀”頒獎詞所說:“他是機器的知音,讓機器‘知音’。用聲紋為筆,描繪‘山海’壯闊;以芯片為紙,書寫智慧生活?!?/p>
在黃偉看來,“技術(shù)最終是為了人。我們希望AI像水電一樣觸手可及,但比技術(shù)更重要的,是永遠敬畏人的需求”。
黃偉始終強調(diào)AI技術(shù)發(fā)展的倫理邊界:“既要認識到優(yōu)勢,也要預(yù)見到生成式AI潛在的風(fēng)險隱患,進而打造負責(zé)任的人工智能?!边@種審慎態(tài)度體現(xiàn)在云知聲的每一項技術(shù)應(yīng)用中。
在AI技術(shù)日新月異的今天,他將繼續(xù)帶領(lǐng)云知聲團隊,以技術(shù)創(chuàng)新滿足人類需求,用科技之光溫暖千家萬戶。這條路或許漫長,但正如黃偉所說:“人工智能是我一輩子的事業(yè)?!边@份執(zhí)著,正是海淀這座科技創(chuàng)新之城最珍貴的精神財富。