
大數據初創企業 WibiData 剛剛在 B 輪(lun)獲(huo)了(le) 1500 萬美元(yuan)的融資。
此輪融資由(you) Canaan Partners 領投,原有(you)投資者 NEA 及 Google 董事會主席施密特也有(you)參與。
WibiData由大數據初創(chuang)(chuang)企業Cloudera的聯合創(chuang)(chuang)始人 Christophe Bisciglia 及 Aaron Kimball 創(chuang)(chuang)建(jian)(jian)。創(chuang)(chuang)建(jian)(jian)伊始他們并沒有什么大計劃,只是希望能成為最(zui)早(zao)為基于(yu)Hadoop的應用(yong)之商用(yong)套(tao)件提供(gong)商之一(yi)。
大(da)數(shu)據(ju)(ju)的(de)市(shi)場已經十分擁(yong)擠,Hadoop 的(de)三巨頭(Cloudera、Hortonworks 及 MapR)牢牢占據(ju)(ju)了絕大(da)部分的(de)份額。但是大(da)家用(yong) Hadoop 絕不僅(jin)僅(jin)是為(wei)了將非(fei)結(jie)構(gou)數(shu)據(ju)(ju)轉(zhuan)換為(wei)結(jie)構(gou)化數(shu)據(ju)(ju)(即(ji) ETL,數(shu)據(ju)(ju)析取),用(yong)戶開發自(zi)行的(de)定制(zhi)應用(yong)仍然是個難題。所以 WibiData 瞄準了這樣(yang)一(yi)個利(li)基市(shi)場—做專業(ye)大(da)數(shu)據(ju)(ju)軟件包(bao)。
能源(yuan)(yuan)管(guan)理(li)初創企業 Opower 就是(shi)一個用戶案例。這家(jia)公司已經(jing)(jing)是(shi) Cloudera 的(de)(de)招牌客戶了,但是(shi)當他們想讓自(zi)己的(de)(de) SaaS 工具超越批量分析和 ETL 處理(li)時,還是(shi)得找 WibiData。有(you)了新應用的(de)(de)支持,現在這家(jia)公司已經(jing)(jing)從晚間對用戶的(de)(de)能源(yuan)(yuan)使(shi)用進行數據比較分析提升到向(xiang)用戶動態推薦了。
WibiData 的核心(xin)技術是(shi)將后端的 Hadoop 環(huan)境與面向客戶(hu)的預(yu)測(ce)性(xing)應用連接到一起,包括一組 HBase(Hadoop 數(shu)據庫)、數(shu)據格式(shi)化工具以(yi)及(ji)機(ji)(ji)器(qi)學(xue)習(xi)(xi)算法(WibiData 正(zheng)在(zai)逐步將實現(xian)機(ji)(ji)器(qi)學(xue)習(xi)(xi)算法的 Kiji 開源)。此外,WibiData 還在(zai)總結其為(wei)同(tong)一領域內(nei)的客戶(hu)所開發的應用之相似性(xing),以(yi)便找出(chu)可(ke)重用的東西(xi)。比方說,零(ling)售業要想(xiang)開發推薦(jian)引擎(qing)的話,應該從何(he)開始(shi)?
WibiData 準備重點針對金融和零售業(ye)推進應用開(kai)發(fa)。預(yu)期的(de)成型產品將(jiang)會(hui)包括(kuo)數據(ju)(ju)格(ge)式化的(de)預(yu)定義模式、預(yu)置預(yu)測(ce)模型等。此外,軟件還(huan)將(jiang)根(gen)據(ju)(ju)用戶(hu)角色的(de)不同(tong)(數據(ju)(ju)科(ke)學家(jia)、系(xi)統(tong)工程(cheng)師、業(ye)務用戶(hu))而(er)展(zhan)現不同(tong)的(de)界面,根(gen)據(ju)(ju)用戶(hu)需(xu)要來提供與數據(ju)(ju)的(de)交互方式。
我們之前(qian)曾討論過,數(shu)(shu)(shu)據(ju)科學家無需太多,讓大數(shu)(shu)(shu)據(ju)好用就(jiu)行了。WibiData 的(de)專業化(hua)軟件包顯然是(shi)一種(zhong)循序漸進的(de)解決方案。此外(wai),像 Cloudera 這樣的(de) Hadoop 供應(ying)商則采(cai)取了另(ling)一種(zhong)大數(shu)(shu)(shu)據(ju)應(ying)用通用化(hua)的(de)路(lu)線(xian),即將 Hadoop 集成到現有環(huan)境(jing)中(zhong)。時間會證(zheng)明 WibiData 的(de)路(lu)線(xian)是(shi)否正確的(de)。
陜煤集團榆林化學二期項目取
國家電投集團印發水、火、風版權聲明