大數(shù)據(jù)處理涉及多種核心技術(shù):分布式存儲(chǔ):hdfs、cassandra、mongodb分布式計(jì)算:mapreduce、spark、flink大數(shù)據(jù)分析:hive、pig、r、python數(shù)據(jù)可視化:tableau、power bi、qlikview數(shù)據(jù)集成:talend、informatica、microsoft sql server integration services流式數(shù)據(jù)處理:kafka、storm、flink人工智能和機(jī)器學(xué)習(xí):tensorflow、pytorch、scikit-le
大數(shù)據(jù)相關(guān)技術(shù)
大數(shù)據(jù)處理涉及廣泛的技術(shù),以下列舉一些核心相關(guān)技術(shù):
1. 分布式存儲(chǔ)
2. 分布式計(jì)算
- MapReduce
- Spark
- Flink
3. 大數(shù)據(jù)分析
- Hive
- Pig
- R
- Python
4. 數(shù)據(jù)可視化
- Tableau
- Power BI
- QlikView
5. 數(shù)據(jù)集成
6. 流式數(shù)據(jù)處理
- Kafka
- Storm
- Flink
7. 人工智能和機(jī)器學(xué)習(xí)
- TensorFlow
- PyTorch
- Scikit-learn
8. 數(shù)據(jù)庫(kù)技術(shù)
- 關(guān)系型數(shù)據(jù)庫(kù)(如 mysql、oracle)
- nosql 數(shù)據(jù)庫(kù)(如 MongoDB、Cassandra)
9. 云計(jì)算
- Amazon web services(AWS)
- Microsoft Azure
- Google Cloud Platform
10. 數(shù)據(jù)安全和合規(guī)性
- 加密
- 訪問(wèn)控制
- 審計(jì)