盛兴彩票网-Hadoop教程 - 初学者的综合指南

这个Hadoop教程提供了盛兴彩票对Hadoop的全面介绍。本教程涵盖什么是Hadoop,Hadoop的需求,Hadoop最受欢迎的原因,Hadoop架构,数据流,Hadoop守护进程,不同的风格,Hadoop组件的引入,如hdfs,MapReduce,Yarn等。

Hadoop是ASF - Apache软件基金会的开源工具。开源项目意味着它可以免费使用,甚至可以根据需要更改它的源代码。如果某些功能无法满足您的要求,您可以根据需要进行更改。大部分Hadoop代码由雅虎,IBM,Facebook和Cloudera编写。

它为在群集的多个节点上运行作业提供了一个高效的框架。群集意味着一组通过局域网连接的系统。Hadoop提供数据的并行处理,因为它可以同时在多台机器上运行。它受Google的启发,盛兴彩票Google已经撰写了关于它正在使用的技术(如Map-Reduce编程模型及其文件系统(GFS))的论文。Hadoop最初是为Nutch搜索引擎项目编写的,当时Doug cutting和他的团队正在开发这个项目,但很快它就成为顶级项目,因为它的广泛流行。

Hadoop是一个用Java编写的开源框架。但这并不意味着你只能用Java编写代码。你可以用C,C ++,perl,python,ruby等进行编码。你可以用任何语言编码,但是建议用java代码,因为你可以对代码进行较低级别的控制。

它有效地处理大量商品硬件上的大量数据。Hadoop开发用于处理大量数据。商品硬件是低端硬件,它们是非常经济的廉价设备。所以hadoop非常经济。

Hadoop可以  但Hadoop的实际功能带有一组机器,盛兴彩票它可以在运行中缩放到一千个节点,即没有任何停机时间。我们不需要制造任何系统来在集群中添加更多的系统。

Hadoop由三个关键部分组成:  HDFS是存储层,Map Reduce是处理层,YARN是资源管理层。现在让我们来了解为什么Hadoop非常受欢迎,为什么Hadoop已经占据了超过90%的大数据市场。

Hadoop不仅是一个存储系统,而且是一个数据存储和处理的平台。盛兴彩票它具有可扩展性(可以随时添加更多节点),容错(即使节点停机,数据可以由其他节点处理)和开源(可根据需要修改源代码)。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.gdjxjy.com.cn/a/shengxingcaipiaowang/187.html