熟練的大數(shù)據(jù)技術(shù)類型有七類:大數(shù)據(jù)框架、分布式文件系統(tǒng)、大數(shù)據(jù)數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能工具、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)工具、大數(shù)據(jù)可視化工具以及其他數(shù)據(jù)工程工具。具體類型包括:hadoop、spark、flink、hive、hdfs、gfs、s3、data lake store、cassandra、mongodb、hbase、dynamodb、impala、presto、tableau、power bi、mahout、spark mllib、tensorflow、scikit-learn、zeppel
熟練大數(shù)據(jù)技術(shù)的類型
熟練的大數(shù)據(jù)技術(shù)包括以下類型:
1. 大數(shù)據(jù)框架
2. 分布式文件系統(tǒng)
- Hadoop分布式文件系統(tǒng) (hdfs)
- Google文件系統(tǒng) (GFS)
- Amazon S3
- Azure Data Lake Store
3. 大數(shù)據(jù)數(shù)據(jù)庫(kù)
- Apache Cassandra
- Apache mongodb
- Apache HBase
- Amazon DynamoDB
4. 數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能 (BI) 工具
- Apache Impala
- Apache Presto
- Tableau
- Power BI
5. 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)工具
- Apache Mahout
- Apache Spark MLlib
- TensorFlow
- Scikit-learn
6. 大數(shù)據(jù)可視化工具
- Apache Zeppelin
- Jupyter Notebooks
- Kibana
- Grafana
7. 其他