足浴盆厂家
免费服务热线

Free service

hotline

010-00000000
足浴盆厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

孙博凯微软大数据战略拥抱Hadoop

发布时间:2020-02-11 07:28:26 阅读: 来源:足浴盆厂家

在移动计算、云计算以及物联网等多种技术和应用的推动下,人类世界的数据量在以惊人的速度在增长。从迅速增长的数据当中挖掘出价值,这变成了企业构筑自己核心竞争力一大利器——这直接促生了大数据的蓬勃发展。在大数据时代,微软将如何规划自身的大数据战略?执行什么样技术路线图?近日,比特网记者采访了微软亚太研发集团首席技术官孙博凯先生。

微软亚太研发集团首席技术官 孙博凯先生

Q:目前,有关大数据的技术非常多,但是现在看起来只有Hadoop被业界广泛认可。这是否意味着,未来大数据的主流模式会变成各个厂商基于例如Hadoop这类开源技术,在其上进行集中投资、开发,将其商业化之后以打包方式推向市场?

孙博凯:首先,我来说明一下目前存在的两种商业模式:传统的商业模式和开源平台结合商业化的模式。传统模式是微软公司提供收费软件,这一模式在关系型数据库、需要非常高性能的企业级软件等领域,都将继续存在。而在一些新兴的技术领域,开源社区和很多用户都希望看到非常快速的技术进步,这也促进了开源技术的实现,也就是开源平台加上商业化的这种模式。

微软会同时支持两种模式,而出发点是向用户提供多种选择。实际上,微软不仅是在大数据领域采用这种策略,在其他领域也是如此,例如微软私有云当中,微软虚拟化技术在支持Windows Server的时候,也会支持不同版本的Linux。同样,微软的公有云也会支持Windows Azure和不同版本的Linux。在微软的平台上,微软同样会支持很多开源中间件。

Q:除了Hadoop技术之外,在大数据里领域当中有很多技术空白,微软的重点研究方向是什么?

孙博凯:现在,业界有很多厂商在参与Hadoop技术领域的研发,但微软仍旧保持了一个相对领先的地位。在谈到大数据时,很重要的一点就是大数据技术方案的可实施性。在这方面,微软处于一个非常有利的位置——SQL Server的客户数量已经成为业界第一。在如此大的客户群体当中,其中已有很多客户非常喜欢使用微软的分析工具来进行数据的分析,从数据的变化做出洞察。

但是,我们也发现,客户环境当中经常有多种不同的数据:结构化数据、非结构化数据、实时数据流等。微软的目标是提供一个完整的大数据平台,这个平台有非常高的性能、非常好的扩展能力,同时能与开源的社区有很好的结合,为所有数据提供一个解决方案。目前,微软一方面会加强对Hadoop的支持;另一方面,也会加强Hadoop与其他微软产品的整合。需要指出的是,从整个微软的投入来看,微软在大数据领域的投入还处于非常早期的阶段。

Q:您提到了微软方案与Hadoop的整合。那么,Hadoop在微软的大数据解决方案扮演了什么样的角色?他们之间如何实现对接?同时,我们也发现,例如EMC、英特尔等硬件合作伙伴也在对Hadoop技术进行开发投资,微软如何与这些合作伙伴去协同、合作?

孙博凯:大数据实际上从不同的数据来源获得各种各样的数据。大数据不光是数据本身,更重要的数据和信息之间的联通,通过和传统商业智能的结合,在数据中找到价值。过去几年Hadoop变成一个非常受欢迎的和强大的数据平台,尤其是针对非结构化数据。微软决定把Hadoop整合到微软的大数据平台里,一方面是和SQL Server做一个整合,成为数据平台中的一部分;另一个方向是把它作为一个服务,整合到微软的Windows Azure这个公有云里。

微软和一些在Hadoop领域里领先的解决方案提供商有非常紧密的合作,通过这样的机制来保证我们提供的Hadoop的版本是符合业界标准的,合作伙伴或解决方案提供商在Hadoop平台上开发出的解决方案或者产品技术,在微软的Hadoop平台上也能够使用。在这一整合中,用户看到的是一个强强组合——我们把Hadoop的高性能、高可扩展与微软产品易用、易部署的传统优势融合到一起。这样做的优势不言而喻,因为普通的Hadoop部署比较复杂,很多客户不是很清楚需要部署怎样的组件,在整合上,技术挑战还是比较大。

此外,微软的Hadoop平台还被特别增强了安全性和可靠性。我们现在做的一项工作就是和Hadoop上的工具提供商进行紧密合作,让它们的分析工具、数据集成工具和应用开发工具,能够在微软的Hadoop平台上也能够使用。

微软不仅是把Hadoop融合到Windows平台上,同样也会坚持开源的原则,将Hadoop上的研发成果,回馈给整个开源社区,包括我们所做的优化工作以及一些连接件(比如连接到Hive的ODBC驱动等)等。

Q:虚拟化是目前在基础架构领域的主流。但在应用虚拟化时,往往会导致性能损失,您是如何看待Hadoop与虚拟化技术的组合?

孙博凯:正如罗素那句名言“参差多态,乃幸福之源”,微软一直向客户提供多种选择,而选择权在客户手里。

Windows Azure的主要功能是提供池化的IT资源与服务,虽然从每个节点看,虚拟层会造成每节点10%左右的性能损耗;但从整个Windows Azure资源池的角度看,架设在其上的Hadoop架构足以能够满足客户的需要。

同时,在私有云环境,微软也一样可以满足客户需求,部署其私有云平台上的Hadoop架构。

Q:大数据处理对硬件的性能是一个极大的挑战,而软硬件结合有助于充分挖掘硬件潜能。那么,一体机是否会是最合适的解决方案?

孙博凯:还是上面那句老话,是否有多种选择是最重要的。软硬件一体的模式只是选择之一,微软过去的模式是为用户提供软件,他可以用他自己硬件的选择来实现其大数据处理系统。微软给用户的新选择是云服务。在云的模式上,用户能够直接用到最终服务,而不需要担心软件和硬件。

软硬件一体机为某种特别的工作负载做了最佳优化,这种模式我们也会与合作伙伴继续提供,这也是给客户的一个选择。

不过,目前我们没有一个马上要宣布的软硬件结合的产品,特别是在Hadoop方面。以前,微软在数据仓库领域与OEM合作伙伴有过类似的合作,接下来也请业界关注微软在Hadoop上的发展潜力。

Q:您也提到了微软可以提供云服务,在其中为客户或者合作伙伴提供大数据应用或者大数据的应用支持。那么,微软会用什么方式帮助客户找到最合适的数据?

孙博凯:这就关联到数据的可发现性。现在,Windows Azure上其实有一些应用,上面可以去找与你的应用有关的数据。微软也在看是否需要投入一些新的技术,通过数据中的关联性来实现有效发现。例如,音乐或者是视频,可以根据它的级别、受欢迎程度,用户打分,这些都可以成为可发现性的一部分。最终,决定效果的是大数据上的可发现性技术的平台。

Q:除了微软,市场上也有很多其他厂商在提供Hadoop解决方案。那么,微软Hadoop平台的优势是什么?

孙博凯:微软大数据平台能对所有数据进行全方位管理、处理,并最终从数据中获取价值。在微软的大数据平台上,客户可以对关系型数据、非关系型数据、实时数据流等进行整合,并兼具易用性、易部署、高性能、高扩展性、高安全性。此外,用户还能通过熟悉的工具与界面,来浏览和使用大数据,这是由微软的特殊战略地位带来的优势。

此外,微软的Hadoop平台解决了开源版本中的一些不足,而不是把Hadoop简单迁移到微软平台上。其中包括了高可用性、安全性的改进,以及和微软管理工具体系的整合。例如,在高可用性方面的一个改进例子是:基于Windows Azure的Hadoop架构,就意味着Hadoop都架设在一个高可用的超大规模虚拟集群上。微软把Hadoop集群和微软虚拟层进行结合,可以将Hadoop的Name Node作为服务同步到其他虚拟页面,通过Windows Azure和Windows Server自带的对每个节点的备份保护,实现降低Name Node故障率,从而提升Hadoop可用性。

所以,微软的Hadoop平台的最大优势是二者的高度融合,而非简单迁移。

外资设立

深圳工商税务网站

深圳代理记账代理报税

深圳工商税务合作

中山工商税务代理记账

税收筹划哪家好

上市并购顾问流程图

广州代理记账多少钱