大數(shù)據(jù)存儲技術(shù)(微課版)
定 價:45 元
叢書名:高等職業(yè)教育大數(shù)據(jù)工程技術(shù)系列教材
- 作者:徐自力
- 出版時間:2025/9/1
- ISBN:9787121511462
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:192
- 紙張:
- 版次:01
- 開本:16開
隨著數(shù)據(jù)量的爆炸式增長,大數(shù)據(jù)存儲技術(shù)在數(shù)據(jù)科學(xué)、人工智能、云計算等領(lǐng)域的重要性日益凸顯。大數(shù)據(jù)不僅為個人生活、企業(yè)經(jīng)營,以及國家與社會的發(fā)展帶來了機遇,也帶來了挑戰(zhàn)。本書是一本大數(shù)據(jù)入門圖書,主要介紹了Hive、HBase、Sqoop等內(nèi)容。本書采用理論與實踐相結(jié)合的講解方式,旨在幫助讀者擺脫枯燥的理論學(xué)習(xí),注重實際動手能力的培養(yǎng)。通過本書的學(xué)習(xí),讀者可以掌握Hadoop生態(tài)圈中常用組件的大數(shù)據(jù)存儲技術(shù),如HDFS、Hive、HBase。本書不僅注重理論知識的講解,更強調(diào)實踐能力的培養(yǎng),適合高職學(xué)生使用,可以幫助讀者快速入門大數(shù)據(jù)領(lǐng)域,提升自己的實踐能力和就業(yè)競爭力。
徐自力,男,浙江安防職業(yè)技術(shù)學(xué)院大數(shù)據(jù)技術(shù)專任教師,ACM競賽教練,大數(shù)據(jù)技術(shù)與應(yīng)用競賽教練,2018年畢業(yè)于浙江工業(yè)大學(xué),碩士研究生學(xué)歷。
項目一 大數(shù)據(jù)存儲 1
任務(wù)1 數(shù)據(jù)倉庫介紹 3
1.1.1 數(shù)據(jù)倉庫概念 3
1.1.2 數(shù)據(jù)倉庫的構(gòu)建 4
1.1.3 數(shù)據(jù)倉庫的主要特點 5
1.1.4 數(shù)據(jù)倉庫和數(shù)據(jù)庫的區(qū)別 5
1.1.5 數(shù)據(jù)倉庫應(yīng)用場景 6
任務(wù)2 NoSQL數(shù)據(jù)庫介紹 7
1.2.1 NoSQL數(shù)據(jù)庫概念 7
1.2.2 NoSQL數(shù)據(jù)庫的基本原理 7
1.2.3 NoSQL數(shù)據(jù)庫的常見存儲結(jié)構(gòu)類型 8
1.2.4 NoSQL數(shù)據(jù)庫適用場景 8
1.2.5 NoSQL數(shù)據(jù)庫的關(guān)鍵技術(shù) 9
項目二 Hadoop基礎(chǔ)介紹 11
任務(wù)1 基于VMware創(chuàng)建CentOS 7虛擬機 14
2.1.1 VMware軟件安裝 14
2.1.2 創(chuàng)建CentOS 7虛擬機 16
2.1.3 虛擬機網(wǎng)絡(luò)配置 23
任務(wù)2 Hadoop環(huán)境搭建 29
2.2.1 Java環(huán)境配置 29
2.2.2 Hadoop偽分布式環(huán)境搭建 30
項目三 HDFS操作與MapReduce基礎(chǔ) 36
任務(wù)1 HDFS的操作命令 39
3.1.1 環(huán)境準備 39
3.1.2 HDFS操作 40
任務(wù)2 第一個MapReduce程序WordCount 43
3.2.1 創(chuàng)建MapReduce工程 43
3.2.2 編寫代碼 46
3.2.3 MapReduce程序運行 50
項目四 Hive基礎(chǔ)介紹 55
任務(wù)1 Hive安裝 60
4.1.1 基礎(chǔ)環(huán)境準備 60
4.1.2 Hive安裝步驟 60
任務(wù)2 Hive數(shù)據(jù)庫操作 62
任務(wù)3 Hive數(shù)據(jù)表操作 65
項目五 Hive數(shù)據(jù)類型 72
任務(wù)1 Hive原始數(shù)據(jù)類型應(yīng)用 75
5.1.1 數(shù)值類型 75
5.1.2 字符串類型 76
5.1.3 布爾類型與時間類型 77
5.1.4 插入演示數(shù)據(jù) 78
任務(wù)2 Hive復(fù)雜數(shù)據(jù)類型應(yīng)用 79
5.2.1 array 79
5.2.2 map 80
5.2.3 struct 81
5.2.4 union 82
項目六 Hive表操作 84
任務(wù)1 Hive內(nèi)部表與外部表 86
6.1.1 Hive內(nèi)部表 86
6.1.2 Hive外部表 88
任務(wù)2 Hive分區(qū)表 91
任務(wù)3 Hive分桶表 96
項目七 Hive數(shù)據(jù)操作 100
任務(wù) Hive數(shù)據(jù)操作 102
7.1.1 使用load命令加載數(shù)據(jù) 103
7.1.2 使用insert命令插入數(shù)據(jù) 104
7.1.3 export命令與import命令 108
7.1.4 使用truncate命令刪除數(shù)據(jù) 109
項目八 Hive QL語句 111
任務(wù)1 Hive QL語句 112
8.1.1 基礎(chǔ)查詢 113
8.1.2 運算符 116
8.1.3 Hive函數(shù) 117
8.1.4 表連接 125
8.1.5 排序 128
8.1.6 分組 131
任務(wù)2 Hive JDBC操作 133
8.2.1 Hive JDBC工程搭建 133
8.2.2 通過Hive JDBC操作數(shù)據(jù)表 137
項目九 HBase基礎(chǔ)介紹 144
任務(wù) HBase安裝 147
9.1.1 基礎(chǔ)環(huán)境準備 147
9.1.2 安裝HBase 148
項目十 HBase操作 151
任務(wù)1 HBase Shell操作 154
任務(wù)2 HBase Java API 157
項目十一 Sqoop基礎(chǔ)介紹 167
任務(wù)1 Sqoop安裝 169
任務(wù)2 Sqoop應(yīng)用 170
項目十二 綜合應(yīng)用——電商會員分析 176
任務(wù)1 Sqoop會員數(shù)據(jù)采集 178
12.1.1 準備數(shù)據(jù) 178
12.1.2 數(shù)據(jù)采集 180
任務(wù)2 會員信息分析 181