当前位置:
张祖平中文主页
>>
数据科学与大数据技术导论PPT
第四章 大数据环境与技术
发布时间:2019-04-22
点击次数:
资源介绍:本章主要介绍大数据运行环境及典型技术。一般称大数据技术生态是指从数据采集、数据整理、存储、运算、数据展示以及系统维护等各个层面所用到的各类相互关联的技术、软件、工具等的集合,如以Hadoop来说,维护的工具是Ambari,采集工具是ETL工具,管理用Sqoop,Nifi,Phoenix等,存储为HDFS,HBase,Hive等,然后运算是MapReduce,Spark等,再往后推,包括Kylin也是的OLAP分析的关键工具,最后的数据展示就包括很多技术或工具了,Hadoop自带的是Zeeplin。
资源类型:PPT
附件: