HDFS 有如下几个特点
• 高容错性
HDFS假设系统故障是常态而非异常。它提供了许多保障数据可靠性的方法。例如,当数据被输入时,它会根据自定义的复制方案被复制多次并分布到不同的服务器中。
• 高扩展性
数据块的分布式信息保存在NameNode服务器中。所以,当系统容量需要扩充时,你只需要增加NameNode的个数,系统会自动将新的服务器加入数列中。
• 高吞吐率
通过使用分布式计算算法,HDFS可以均衡地将数据存取分配到每个服务器的数据复制进程中,这可以成倍提高吞吐率
• 价位低廉
HDFS由低成本服务器构成。