• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中國數(shù)據(jù)科學競賽現(xiàn)場“零距離”

      2021-03-24 11:06:00譚婧
      數(shù)字商業(yè)時代 2021年3期
      關鍵詞:零距離競賽工具

      譚婧

      人類正從IT走向DT(DataTechnology),這是個大背景。

      企業(yè)處在數(shù)據(jù)產(chǎn)品和AI產(chǎn)品的紅海,想活命就必須手持一本《AI避坑逃生指南》。

      個人處在競爭與內(nèi)卷的浪潮,數(shù)據(jù)思維和工具是護身符。

      在上海市徐匯區(qū)虹漕路77號C8,我見到了和鯨科技創(chuàng)始人范向偉與首席產(chǎn)品官殷自強。這是一家擁有近15萬注冊數(shù)據(jù)科學家社區(qū)的公司,同時也是在數(shù)據(jù)科學的江湖里無論如何也不會錯過的公司。

      我們曾經(jīng)從2017年就開始“聊天”。

      這次只是,無數(shù)次中的一次。

      只是這次,忠實地做了記錄。

      出發(fā)時,和鯨只是一家被稱作“對標谷歌Kaggle”的公司。到如今,和鯨是一家“走通”從競賽到社區(qū),再到產(chǎn)品的公司。在中國,乃至全球,這條路,都是獨一無二的。

      彼時,美國有,中國抄。

      那一輪,投資人拿和鯨和Kaggle做中美對標,數(shù)據(jù)競賽玩家拿“中國版Kaggle”指代和鯨。

      Kaggle是什么?是全球最大的數(shù)據(jù)科學技術分享社區(qū)(在線分享代碼、項目和數(shù)據(jù)集等),創(chuàng)立于2010年?!癒aggle大神”是數(shù)據(jù)科學競賽界頂禮膜拜的江湖稱謂,可見其地位之顯赫。

      2017年,Kaggle被谷歌收購,宣布收購消息是彼時谷歌云首席科學家李飛飛。消息漂洋過海,范向偉耳邊都是:“賣給BAT,財富就自由”。

      Kaggle被收購上岸,和鯨去向何方?

      范向偉不想“賣”公司,因為他一開始就沒有“抄”。辦競賽、搭平臺、建社區(qū)、出產(chǎn)品,全套拳法,天人合一。

      到今天,真相大白了。因為沒得抄了,反而能看出來誰在踏踏實實做數(shù)據(jù)科學的產(chǎn)品。

      既然不被收購,那接下來,路在何方?這個問題,范向偉這幾年應該被問了無數(shù)次。當年,有人說Kaggle可以推出SaaS產(chǎn)品,因為抓住了一群獨特的、技術含量極高的、小眾的群體。這群人的需求,比中情局的情報還珍貴。

      四年過去了,Kaggle始終沒有邁出這一步。被誤稱為“中國版Kaggle”的公司卻做到了。SaaS產(chǎn)品“數(shù)據(jù)科學云端協(xié)作工具”,并非誕生美國硅谷車庫,而誕生在中國人自己的數(shù)據(jù)科學社區(qū)。

      如果它有口號的話,估計會和熊貓、雪豹、金絲猴“撞稿”:“我們誕生在中國?!北藭r,數(shù)據(jù)化浪潮開天劈地,數(shù)據(jù)競賽風起云涌,范向偉從上海交通大學統(tǒng)計系的教室里緩步走出。他并不熱心于完成碩士學業(yè),而是心心念念數(shù)據(jù)競賽。興趣是最好的開始,而同行者最是惺惺相惜。社區(qū)就是吸鐵石,把同類人“吸”在一起。

      數(shù)據(jù)競賽社區(qū)高手云集,人氣高,思路廣,不乏大量活躍者,貢獻算法、案例、數(shù)據(jù)集,吸引更多數(shù)據(jù)人才,武林高手齊聚光明頂,圍攻“挑戰(zhàn)性數(shù)據(jù)問題”。

      數(shù)據(jù)競賽社區(qū)中國不止一家,阿里巴巴、百度都有,是不是論規(guī)模,定輸贏?范向偉的答案是否定的。

      和鯨不只是數(shù)據(jù)競賽舉辦方。別人僅僅是辦一場活動,和鯨團隊則在打磨產(chǎn)品——先做競賽系統(tǒng),再把整個競賽系統(tǒng)SaaS化。他們做到了從人力運營轉(zhuǎn)換到競賽產(chǎn)品。

      范向偉說:“多年前,比賽客戶就開始自辦比賽了,我們只提供競賽產(chǎn)品。比如華東師范大學,就是用和鯨的比賽系統(tǒng)直接辦比賽?!毖莼c進化都是悄然發(fā)生的。

      歌手唱:《想愛誰你就去愛誰》,范向偉說:“想辦競賽你就去辦競賽”,下半句是:“給你工具就行了?!?/p>

      中國移動、中國電信、南方電網(wǎng)、中華醫(yī)學會、鵬城實驗室、北京醫(yī)保局都來找和鯨辦數(shù)據(jù)競賽,范向偉拿出產(chǎn)品——數(shù)據(jù)競賽管理平臺。一面辦比賽,一面產(chǎn)品化。這是一件很有趣的事兒。

      數(shù)據(jù)競賽不崇尚孤膽英雄,團隊作戰(zhàn)更為常見。一起寫代碼,讓“協(xié)作”成為參賽選手的剛需。從那時開始,像種子一樣的“協(xié)作”產(chǎn)品理念,已經(jīng)發(fā)芽了。數(shù)據(jù)競賽系統(tǒng)突出競賽,數(shù)據(jù)科學云端協(xié)作工具突出協(xié)同,兩個產(chǎn)品的底層模塊有共同之處。

      首席產(chǎn)品官殷自強說:“SaaS化是因為有抓手,我們才有機會摸索產(chǎn)品化的道路?!焙亡L社區(qū)打磨產(chǎn)品的方法是獨一無二的,類似開源軟件的方法論,千手捉蟲(bug)快,和真實需求的距離最近。

      “有多近?”“和鯨團隊的辦公室,是距離中國數(shù)據(jù)科學競賽比賽現(xiàn)場最近的地方?!贝蚰?,是SaaS產(chǎn)品的必由之路。

      殷自強說:“數(shù)據(jù)競賽的價值是什么?這個問題我們思考了五年,這五年來,我們辦了100多場比賽,100個不同的場景,100家不同的機構,處理100個人工智能需求,100個機器學習需求,共性在哪?”

      “直接給到客戶的,相當于為客戶做定制開發(fā)。某一模塊可能只是客戶唯一需求。對于高速迭代的工具平臺,這種先定制開發(fā),再產(chǎn)品化的模式會遇到很大的挑戰(zhàn)?!币笞詮娬f。

      “和鯨的做法是,某個產(chǎn)品模塊上新,讓社區(qū)先使用?!鄙鐓^(qū),是和鯨得天獨厚的寶地,是孫悟空的花果山,是哪咤的陳塘關?!氨荣惤Y(jié)束,一切都結(jié)束了,那是活動營銷公司的生意?!币笞詮娧a充說。

      這時候,有人質(zhì)疑,是不是和鯨的產(chǎn)品,只用于數(shù)據(jù)競賽?答案并不是。

      產(chǎn)品要在場景無數(shù)次驗證大規(guī)模的需求,數(shù)據(jù)競賽就是這樣的場景,證明產(chǎn)品是可以支撐千人同時在線編程。若論同時使用產(chǎn)品的人數(shù),一家普通公司不可能比社區(qū)里的人多。

      所以,和鯨的產(chǎn)品對客戶的服務,變成了降維滿足客戶需求。和鯨社區(qū)里的各色需求都被提煉成產(chǎn)品的迭代需求。這既是一種“折磨”,也是一種“幸?!?。折磨受得越多,產(chǎn)品越成熟。很多時候,在和鯨辦公室里看見研發(fā)團隊誰的神情最焦灼,那人便是殷自強。

      但是他說這句話的時候充滿自信心:“從來沒有碰到過哪個公司的并發(fā),把我們給卡住了。”

      準確判斷AI的技術趨勢

      數(shù)據(jù)與AI的發(fā)展既強勢,又混沌。做數(shù)據(jù)和AI產(chǎn)品要對主流技術趨勢敏感,有判斷力。用范向偉的話說就是:“數(shù)據(jù)科學已經(jīng)發(fā)展到第三階段(3.0),數(shù)據(jù)類型、基礎設施、分析工具和工程任務中的行為,發(fā)生巨大變化?!?/p>

      一個軟件版本用N年的時代,已經(jīng)一去不復返了。殷自強自問自答:“快速擴容是一個里程碑。10臺變成100臺,1000臺變成10000臺,這種變化不能影響服務。支持大規(guī)模工程的能力,業(yè)界遲早要有,且大家都會去選最好的。這件事情,為什么不是我們來做?”當K8s剛出1.0版本的時候,CTO和技術團隊敏銳地關注了。

      第一,發(fā)現(xiàn)大廠都選K8s,主流的大廠進來,需求迅速變成現(xiàn)實。第二,K8s表現(xiàn)強勢,剛出來的時候還有一個叫Swarm的一套技術,也能解決彈性控制的問題,但還是被K8s快速淘汰掉了。第三,K8s是開源的。人工智能界的好東西,很多都開源了。

      判斷結(jié)論有了:K8s有優(yōu)勢,會帶來一波變化,那就抓住它。產(chǎn)品好是一個大概念,有很多“訣竅”是外行人難以察覺的。

      SaaS產(chǎn)品,不唯技術論英雄

      江湖有一種迷信,似乎只要算法高超,就勝券在握。但是,傳統(tǒng)機器學習算法和深度學習算法各有優(yōu)勢,各有用途。

      大規(guī)模深度學習已是貴族游戲了,只有工業(yè)界的頭部大公司才可以承受,鯉魚躍龍門般的高門檻限制了創(chuàng)新探索和整體發(fā)展。比起深度學習,數(shù)據(jù)分析“身價平平”。

      但是,江湖有云,欲練上乘劍法,不限招式多寡?!兑刑焱例堄洝樊斨?,孤鴻子和楊逍比武,楊逍奪走孤鴻子的倚天劍又扔還。殺傷力不大,侮辱性極強。

      楊逍拿著劍冷笑道:“倚天劍,好大的名氣!在我眼中,卻如廢銅廢鐵一般!”孤鴻子對兵器盲目迷信。楊逍就不信這個邪。

      算法和產(chǎn)品都是工具,工具的存在,是為了解決問題。在“解決問題”這個終極任務面前,人的智慧極為重要,不能過分夸大工具的威力。

      范向偉說:“我們判斷數(shù)據(jù)分析的場景價值更大一些,或者是說,要做AI,首先要從數(shù)據(jù)分析起步。單獨看技術難度,數(shù)據(jù)分析肯定簡單,但是不能說價值低,要做好數(shù)據(jù)分析,一樣充滿挑戰(zhàn),需要發(fā)掘人的價值、解決人的問題。”

      倚天劍不能擊敗所有對手,深度學習也不能。范向偉認為,在企業(yè)中,最難處理的問題,永遠是人的問題。他堅信,人是一切問題的根源,也是一切辦法的支點。

      所以,當和鯨團隊意識到這個問題的重要性的時候,產(chǎn)品邏輯了然于胸——數(shù)據(jù)科學云端協(xié)作工具,也就是和鯨的ModelWhale。他說:“數(shù)據(jù)科學家彼此之間的協(xié)同,是權利責任、資源分配、分工協(xié)同、過程追蹤、成果整合的問題。產(chǎn)品定位,立足于此?!?/p>

      “人才和管理,是數(shù)據(jù)產(chǎn)品和AI產(chǎn)品落地過程中隱形大坑?!边@句話應該寫在《AI避坑逃生指南》的第一頁。

      明槍易躲,暗坑難防。近幾年,最知名的數(shù)據(jù)產(chǎn)品,莫過于數(shù)據(jù)中臺。一個數(shù)據(jù)中臺的實施與落地,牽扯企業(yè)組織變革、資源變革、流程變革……一場變革尚且窮盡其力,如此多的變革,讓一款產(chǎn)品,難負其重。這是數(shù)字化改革的“深水區(qū)”,觸動了很多人的深層次利益。

      某公司中層干部的內(nèi)心獨白是:“我們部門的私有數(shù)據(jù),是私有資產(chǎn),為啥要和隔壁部門共享。年終獎拱手讓人嘛?”數(shù)據(jù)工具的先進性,并不能解決人類思維的慣性。

      產(chǎn)品邏輯的背后,是產(chǎn)品理念、企業(yè)的理念,以及創(chuàng)始團隊的信仰。數(shù)據(jù)協(xié)作工具這一類型的產(chǎn)品猛地聽起來,并不容易理解。而范向偉則認為這是最好的“工具”。

      “數(shù)據(jù)思維”狠狠告別“原始年代”,也是個體的必然選擇。培訓拯救不了焦慮,數(shù)據(jù)科學唯有從動手開始。

      殷自強說:“我們也在做拖拉拽系統(tǒng),降低門檻,降低畏懼情緒?!?/p>

      “同時,也思考用戶快速搭建分析框架(框架包括,觀察數(shù)據(jù)分布、提取特征、測試模型、評估效果),完善代碼,并調(diào)整成能提高模型準確率和業(yè)務相關性的成果(報告或模型)?!遍T檻的高度是一個比較值,不是一個絕對值。自2017年起,范向偉就一直拿學英語這件事情打比方。他說:“七八十年代,國民整體英語水平偏低,英語翻譯很吃香。近十年,英語普及得較好,英語能力不再是一種稀缺能力?!?/p>

      以前,學英語。如今,學數(shù)據(jù)科學。

      范向偉也談到了5年以來的觀察:“5年前,用戶絕大多數(shù)是計算機專業(yè)背景,因為編程是敲門磚。現(xiàn)在,很多社會科學學院、大氣科學學院、商學院、醫(yī)學院背景的人已經(jīng)離不開數(shù)據(jù)科學的工具了?!边@個變化,符合幾年前他的判斷。他說:“我們跟隨行業(yè)的腳步,很多人在社區(qū)里成長,努力培養(yǎng)數(shù)據(jù)思維,學以致用。和鯨團隊不相信,只靠類似AI全家桶的產(chǎn)品,就能解決產(chǎn)業(yè)里無法窮盡的問題?!?/p>

      將視野放寬到行業(yè),那些做數(shù)據(jù)科學產(chǎn)品與AI產(chǎn)品的中國SaaS廠商,幫客戶把算法都搞定了,變成一個普通業(yè)務員工能去用的工具。

      范向偉認為:這是過度“封裝”,容易陷入局部最優(yōu)的陷阱,長期看來,難以迭代,拓展和復用。企業(yè)業(yè)務是動態(tài)變化的,數(shù)據(jù)的用法是動態(tài)變化的。有,且只有:業(yè)務員越具備數(shù)據(jù)思維的時候,越利用得好數(shù)據(jù),才會把數(shù)據(jù)的價值滲透到毛細血管級別的場景里面去。

      《AI避坑逃生指南》認為:定位數(shù)據(jù)與人工智能類的企業(yè)級產(chǎn)品,有兩個大坑。首先是,工具類的產(chǎn)品都是賦能千行百業(yè)的,石油、電力、交通等,大多數(shù)情況下創(chuàng)業(yè)者自己不是核心用戶,你滿足的是別人的需求,無法得知客戶的真實需求,容易踏進主觀臆斷的坑。其次是,訂單合同金額較高,碰到大的項目,客戶必定有定制化的需求,標準化產(chǎn)品賣不進去。屈從定制,團隊和人力就搭進去了,容易踏進人力資源外包公司的坑。

      如今的和鯨是國家氣象信息中心國家級工程——氣象大數(shù)據(jù)云平臺(“天擎”)數(shù)據(jù)挖掘分析系統(tǒng)支撐方。和鯨做了哪些準備?第一,洞悉了客戶需求的“水晶球”,第二,做到了產(chǎn)品通用性的厚積薄發(fā)。

      猜你喜歡
      零距離競賽工具
      2020絲綢之路數(shù)學競賽
      零距離與遠距離
      和黨旗零距離
      波比的工具
      波比的工具
      與英國媒體零距離
      傳媒評論(2018年10期)2019-01-17 01:33:26
      我看競賽
      “巧用”工具
      讀者(2017年18期)2017-08-29 21:22:03
      創(chuàng)新思維競賽(3)
      觀察零距離
      學生天地(2016年16期)2016-05-17 05:46:17
      广河县| 襄垣县| 赤水市| 鄯善县| 万荣县| 邹城市| 长兴县| 平泉县| 三穗县| 静宁县| 沙湾县| 苗栗市| 崇礼县| 潮安县| 桐庐县| 轮台县| 绥江县| 仁布县| 瓦房店市| 江陵县| 叶城县| 新河县| 双城市| 扎兰屯市| 肥乡县| 金平| 汝南县| 乌鲁木齐县| 武汉市| 建德市| 河北省| 桦甸市| 新干县| 漳平市| 肥城市| 武隆县| 博爱县| 宁波市| 蒲城县| 隆子县| 嘉禾县|