大數(shù)據(jù)管理公司Hortonworks今天宣布推出其核心Hortonworks Data Platform的第三代版本,并與包括谷歌、微軟和IBM等云計(jì)算領(lǐng)導(dǎo)廠商擴(kuò)大合作伙伴關(guān)系。
Hortonworks在加州圣何塞舉行的DataWorks峰會(huì)上宣布推出了HDP 3.0,讓企業(yè)能夠跨不同計(jì)算環(huán)境更輕松地運(yùn)行應(yīng)用,無論是在云中還是在本地?cái)?shù)據(jù)中心。
HDP 3.0計(jì)劃在第三季度上市,它是基于最新版本的開源Apache Hadoop平臺(tái),Hortonworks稱這將讓自己的Hadoop發(fā)行版與其他公司的區(qū)分開。
Hortonworks首席技術(shù)官Scott Gnau表示:“我們看到向現(xiàn)代數(shù)據(jù)架構(gòu)的巨大遷移,這種架構(gòu)中包含了比以往更多的云相關(guān)的內(nèi)容。這意味著客戶的數(shù)據(jù)將在數(shù)據(jù)中心、云端和這時(shí)間的任何地方。所以,要打造一種無縫的體驗(yàn)。”
特別是HDP 3.0增加了幾項(xiàng)新功能。首先,是能夠使用容器跨不同計(jì)算環(huán)境快速部署應(yīng)用,打包應(yīng)用使其可以在云中或各種數(shù)據(jù)中心中運(yùn)行。Gnau說:“如果你在Google、AWS或Azure上運(yùn)行HDP 3.0,那么應(yīng)用運(yùn)行的方式也是一樣的。”
其次是對(duì)深度學(xué)習(xí)應(yīng)用的支持,這些應(yīng)用采用人工神經(jīng)網(wǎng)絡(luò)來識(shí)別圖像和語(yǔ)音,以及其他數(shù)據(jù)密集型人工智能任務(wù)。HDP 3.0讓數(shù)據(jù)科學(xué)家能夠使用GPU共享對(duì)服務(wù)器的訪問,GPU作為一種高度并行的芯片已經(jīng)廣泛用于訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型。
Hortonworks表示,新平臺(tái)還通過使用一種實(shí)時(shí)數(shù)據(jù)庫(kù)提供改進(jìn)的查詢優(yōu)化,因此無論是在云端還是在本地,都可以獲得更多數(shù)據(jù)并加快處理速度。這項(xiàng)功能可由開源Hadoop數(shù)據(jù)倉(cāng)庫(kù)Apache Hive啟用。
此外,HDP 3.0還支持所有主要的云數(shù)據(jù)存儲(chǔ)庫(kù),包括AWS S3、微軟Azure Storage Blob和Google Cloud Storage。Gnau表示,這讓企業(yè)能夠?qū)?shù)據(jù)遷移到使用效率最高的地方,例如將數(shù)據(jù)從S3遷移回Hadoop分布式文件系統(tǒng),以為某些應(yīng)用實(shí)現(xiàn)更高的性能。
此外,Hortonworks還宣布擴(kuò)大與多家云提供商的合作關(guān)系,包括優(yōu)化HDP和針對(duì)Google Cloud Platform(GCP)的Hortonworks DataFlow(HDF)分析平臺(tái)。“我們與Hortonworks的合作伙伴關(guān)系將使客戶能夠在GCP中快速運(yùn)行數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和流式分析工作負(fù)載,同時(shí)實(shí)現(xiàn)與混合或云本地?cái)?shù)據(jù)架構(gòu)的橋接”,Google Cloud產(chǎn)品管理總
監(jiān)Sudhir Hasbe在聲明中表示。
與微軟擴(kuò)大合作伙伴關(guān)系將讓客戶能夠部署HDP、HDF和Hortonworks DataPlane Service(DPS),從而可以在Azure云平臺(tái)上本地管理不同類型和來源的數(shù)據(jù)。這些都已經(jīng)在AWS上提供。
IBM宣布將提供一個(gè)名為IBM Hosted Analytics with Hortonworks的新服務(wù),作為IBM Cloud上的一項(xiàng)集成服務(wù)。更具體地說,它結(jié)合了HDP、IBM Db2 Big SQL數(shù)據(jù)庫(kù)和IBM數(shù)據(jù)科學(xué)體驗(yàn)。IBM Analytics總經(jīng)理Rob Thomas在一篇博客文章中將IBM對(duì)數(shù)據(jù)的使用比喻為州際公路系統(tǒng)的演變。
而且,HDP 3.0改進(jìn)了安全性和治理,以符合歐盟最近實(shí)施的“通用數(shù)據(jù)保護(hù)條例”和其他數(shù)據(jù)治理規(guī)則,這意味著正在使用中的數(shù)據(jù)可以追溯到最初所駐留的數(shù)據(jù)湖。
由于一些廣為人知的數(shù)據(jù)泄露事件和數(shù)據(jù)濫用問題(如Cambridge Analytica公司未經(jīng)授權(quán)使用2016年美國(guó)總統(tǒng)大選期間的Facebook數(shù)據(jù)),導(dǎo)致最近那些能夠使用大量數(shù)據(jù)的公司處于被嚴(yán)密監(jiān)管的狀態(tài)。Gnau提出,Hortonworks可以在其平臺(tái)上提供集中式控制,讓企業(yè)能夠避免這類問題。
“我們可以提供共同的數(shù)據(jù)治理。我們知道數(shù)據(jù)在哪里,誰(shuí)在復(fù)制數(shù)據(jù),以及數(shù)據(jù)到達(dá)這個(gè)位置都發(fā)生了什么。21世紀(jì)數(shù)據(jù)是財(cái)富的創(chuàng)造者,”如果不對(duì)數(shù)據(jù)加以控制的話那就是“瘋了”。