數(shù)據(jù)思維與大數(shù)據(jù)基礎(chǔ)
定 價(jià):59.8 元
當(dāng)前圖書(shū)已被 2 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:陳華 柳毓松 阮宗利
- 出版時(shí)間:2025/9/1
- ISBN:9787115679765
- 出 版 社:人民郵電出版社
- 中圖法分類(lèi):TP274
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本書(shū)是面向大數(shù)據(jù)人才培養(yǎng)的高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)系列教材中的一本,通過(guò)把數(shù)據(jù)思維融入全書(shū)各章,并通過(guò) Python 實(shí)現(xiàn)相關(guān)案例,使抽象的數(shù)據(jù)思維具體化,從而加深讀者對(duì)數(shù)據(jù)的感性認(rèn)識(shí),提高讀者對(duì)數(shù)據(jù)思維的理解能力。本書(shū)首先介紹了大數(shù)據(jù)相關(guān)的概念,然后根據(jù)數(shù)據(jù)處理流程的邏輯順序,對(duì)大數(shù)據(jù)平臺(tái)和大數(shù)據(jù)開(kāi)發(fā)進(jìn)行了深入介紹?紤]到數(shù)據(jù)的價(jià)值化發(fā)展趨勢(shì),本書(shū)也討論大數(shù)據(jù)倫理與法規(guī)、大數(shù)據(jù)與人工智能大模型和數(shù)據(jù)資產(chǎn)與交易流通等內(nèi)容的討論。最后給出了基于競(jìng)賽的大數(shù)據(jù)綜合案例實(shí)踐。另外,本書(shū)免費(fèi)提供配套PPT、實(shí)驗(yàn)及程序及其講解視頻等基本教學(xué)資料。
本書(shū)可作為理工類(lèi)、經(jīng)管類(lèi)等專業(yè)學(xué)生學(xué)習(xí)大數(shù)據(jù)知識(shí)的基礎(chǔ)教材,也可供科技工作者參考。
(1)內(nèi)容全面,結(jié)構(gòu)合理:每章內(nèi)容分導(dǎo)讀案例、理論知識(shí)、應(yīng)用、習(xí)題各部分。
(2)取長(zhǎng)補(bǔ)短,講清原理:力圖在通俗易懂講解理論知識(shí)的基礎(chǔ)上,豐富實(shí)用性案例,清晰、全面地介紹大數(shù)據(jù)技術(shù)與應(yīng)用知識(shí)。
(3)深入介紹數(shù)據(jù)思維內(nèi)容。
(1)內(nèi)容全面,結(jié)構(gòu)合理:每章內(nèi)容分導(dǎo)讀案例、理論知識(shí)、應(yīng)用、習(xí)題各部分。
(2)取長(zhǎng)補(bǔ)短,講清原理:力圖在通俗易懂講解理論知識(shí)的基礎(chǔ)上,豐富實(shí)用性案例,清晰、全面地介紹大數(shù)據(jù)技術(shù)與應(yīng)用知識(shí)。
(3)深入介紹數(shù)據(jù)思維內(nèi)容。
陳華 青島市西海岸大數(shù)據(jù)智庫(kù)專家,全國(guó)高校人工智能與大數(shù)據(jù)創(chuàng)新聯(lián)盟理事,山東省大數(shù)據(jù)研究會(huì)理事,現(xiàn)任中國(guó)石油大學(xué)(華東)數(shù)據(jù)科學(xué)與統(tǒng)計(jì)系主任,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)負(fù)責(zé)人。目前主要從事地球物理數(shù)據(jù)處理與分析、多核計(jì)算、智能算法等方面的教學(xué)和科研工作。先后主持和參與國(guó)家自然科學(xué)基金、山東省自然科學(xué)基金等縱向課題8項(xiàng)和其它橫向課題10余項(xiàng)。在國(guó)內(nèi)外期刊發(fā)表教學(xué)和科研論文30余篇,軟件著作權(quán)4項(xiàng),教材4部。
第 1章 大數(shù)據(jù)概述 1
1.1 數(shù)據(jù) 1
1.2 大數(shù)據(jù) 5
1.3 大數(shù)據(jù)發(fā)展歷史 8
1.4 大數(shù)據(jù)研究?jī)?nèi)容 9
1.5 大數(shù)據(jù)應(yīng)用場(chǎng)景與領(lǐng)域 11
第 2章 大數(shù)據(jù)思維 15
2.1 數(shù)據(jù)科學(xué) 15
2.2 數(shù)據(jù)全生命周期管理 18
2.3 數(shù)據(jù)思維 26
2.4 數(shù)據(jù)范式 28
2.5 大數(shù)據(jù)思維 29
2.6 常見(jiàn)的大數(shù)據(jù)思維方式 29
2.7 案例 30
第3章 大數(shù)據(jù)平臺(tái) 34
3.1 大數(shù)據(jù)與云計(jì)算關(guān)系 34
3.2 Hadoop平臺(tái) 34
3.2.1 Hadoop簡(jiǎn)介 34
3.2.2 HDFS工作機(jī)制 36
3.2.3 HDFS命令 40
3.2.4 分布式并行計(jì)算框架MapReduce 40
3.3 Spark平臺(tái) 43
3.3.1 Spark 的核心組件 43
3.3.2 Spark工作機(jī)制 45
3.3.3 分布式計(jì)算模型與方式 46
3.3.4 Hadoop和Spark對(duì)比情況 48
第4章 大數(shù)據(jù)開(kāi)發(fā) 50
4.1 大數(shù)據(jù)開(kāi)發(fā)流程 50
4.2 需求分析 51
4.3 數(shù)據(jù)獲取 53
4.4 探索性數(shù)據(jù)分析 59
4.4.1 探索性數(shù)據(jù)分析概念 59
4.4.2 探索性數(shù)據(jù)分析理論與技術(shù) 59
4.4.3 青島空氣質(zhì)量探索性數(shù)據(jù)分析 69
4.5 數(shù)據(jù)加工 77
4.5.1 數(shù)據(jù)加工的內(nèi)容 77
4.5.2 數(shù)據(jù)清洗 78
4.5.3 數(shù)據(jù)轉(zhuǎn)換 85
4.5.4 數(shù)據(jù)整合 98
4.5.5 青島空氣質(zhì)量數(shù)據(jù)加工 99
4.6 特征工程 103
4.6.1 特征工程定義 103
4.6.2 特征選擇 104
4.6.3 特征提取 108
4.6.4 特征創(chuàng)建 112
4.6.5 特征提取和特征選擇、特征創(chuàng)建之間的區(qū)別 112
4.6.6 數(shù)據(jù)不平衡問(wèn)題 113
4.6.7 青島空氣質(zhì)量特征處理 117
4.7 數(shù)據(jù)建模 124
4.7.1 數(shù)據(jù)分析 125
4.7.2 統(tǒng)計(jì)方法 126
4.7.3 機(jī)器學(xué)習(xí)方法 132
4.7.4 青島空氣數(shù)據(jù)建模 139
4.7.5 大作業(yè) 144
第5章 大數(shù)據(jù)倫理與法規(guī) 145
5.1 大數(shù)據(jù)倫理概念 145
5.2 大數(shù)據(jù)倫理產(chǎn)生原因 147
5.3 大數(shù)據(jù)倫理治理 153
5.4 大數(shù)據(jù)倫理案例:亞馬遜AI招聘工具性別歧視事件 157
5.5 大數(shù)據(jù)倫理案例:明確零工法律定位,規(guī)范平臺(tái)算法管理 161
第6章 大數(shù)據(jù)與人工智能大模型 166
6.1 人工智能大模型 166
6.2 人工智能大模型的核心技術(shù)與訓(xùn)練方法 167
6.3 大數(shù)據(jù)與人工智能大模型的關(guān)系 170
6.4 大數(shù)據(jù)與人工智能大模型技術(shù)發(fā)展趨勢(shì) 171
6.5 人工智能大模型應(yīng)用領(lǐng)域 172
第7章 數(shù)據(jù)資產(chǎn)與交易流通 177
7.1 國(guó)家政策 177
7.2 數(shù)據(jù)資產(chǎn) 179
7.3 數(shù)據(jù)確權(quán) 184
7.4 數(shù)據(jù)資產(chǎn)評(píng)估 187
7.5 數(shù)據(jù)交易 195
7.6 數(shù)據(jù)流通 196
7.7 可信數(shù)據(jù)空間 198
第8章 大數(shù)據(jù)綜合案例實(shí)踐 203
8.1 問(wèn)題提出 203
8.2 數(shù)據(jù)處理 204
8.3 數(shù)據(jù)分析 213
8.4 天氣預(yù)測(cè) 218
附錄 225
參考文獻(xiàn) 233