本書詳細闡述了培養(yǎng)具有數(shù)據(jù)素養(yǎng)的技術技能型人才所需要的大數(shù)據(jù)相關基礎知識。本書在確定知識布局時,秉持的一個基本原則是,緊緊圍繞大數(shù)據(jù)通識教育核心理念,培養(yǎng)學生的數(shù)據(jù)意識、數(shù)據(jù)思維、數(shù)據(jù)安全和數(shù)據(jù)分析能力。全書共7章,內容包括大數(shù)據(jù)概述,大數(shù)據(jù)思維,數(shù)據(jù)庫基礎知識,大數(shù)據(jù)分析技術及相關應用,數(shù)據(jù)可視化概論,大數(shù)據(jù)安全,大
本書系統(tǒng)、全面地介紹大數(shù)據(jù)技術的基礎知識。全書共13章,首先介紹大數(shù)據(jù)行業(yè)與技術趨勢;然后介紹大數(shù)據(jù)生態(tài)圈的各項技術,包括分布式文件系統(tǒng)、Hive分布式數(shù)據(jù)倉庫、HBase技術原理、MapReduce和YARN技術原理、Spark基于內存的分布式計算、Flink流批一體分布式實時處理引擎、數(shù)據(jù)采集與數(shù)據(jù)裝載工具、Kaf
《大數(shù)據(jù)百科術語辭典》漢外對照系列叢書是全球首套系統(tǒng)研究大數(shù)據(jù)術語的多語種智能化專業(yè)辭典。本叢書對大數(shù)據(jù)知識體系進行了全面梳理,提出了九個方面的術語架構,形成了統(tǒng)一規(guī)范、符合國際通用規(guī)則的多語種學術話語體系;叢書系統(tǒng)性提供漢語與其他二十個語種的術語規(guī)范表述,以中外文對照的形式展示;叢書開創(chuàng)性融入知識圖譜、有聲點讀、平臺
Hadoop是當前熱門的大數(shù)據(jù)處理與分析平臺!禜adoop大數(shù)據(jù)開發(fā)基礎項目化教程》將大數(shù)據(jù)平臺相關內容劃分為8個項目,分別是大數(shù)據(jù)時代、Hadoop基礎環(huán)境、Hadoop環(huán)境搭建、分布式存儲HDFS、MapReduce分布式編程、Hadoop數(shù)據(jù)倉庫Hive、Hadoop數(shù)據(jù)庫HBas、協(xié)調系統(tǒng)Zookeeper,
本書介紹數(shù)據(jù)分析的統(tǒng)計基礎、種類劃分,并列舉大量實例以說明數(shù)據(jù)分析方法和算法。內容主要分為4部分,第1部分為第1章,介紹一些概念,簡單描述數(shù)據(jù)分析方法和一些實例;第2部分包括第2~7章,介紹描述性分析和數(shù)據(jù)預處理的主要方法,包括描述統(tǒng)計、多元描述分析、聚類以及頻繁模式挖掘等;第3部分包括第8~12章,介紹預測性分析的主
面對日漸復雜的大數(shù)據(jù),科技工作者很難用單一的統(tǒng)計軟件高效、完美地完成從數(shù)據(jù)挖掘、數(shù)據(jù)清洗、統(tǒng)計分析到結果呈現(xiàn)的全部工作,因此需要熟悉和掌握多種統(tǒng)計工具,各取所長、整合使用。本書立足于大數(shù)據(jù)研究的現(xiàn)狀,基于實際醫(yī)療案例,介紹數(shù)學基礎知識和統(tǒng)計學基礎知識,SAS、R語言、Stata和Python這4款大數(shù)據(jù)常用分析工具的基
大數(shù)據(jù)技術凝集了多學科的研究成果,是一門多學科的交叉融合技術。隨著科學技術的發(fā)展,大數(shù)據(jù)技術發(fā)展更為迅速,應用更為深入與廣泛,并凸顯其巨大潛力和應用價值!皵(shù)據(jù)科學與大數(shù)據(jù)技術導論”是數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的第一門專業(yè)基礎課程。這門課程可以引導數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的學生走進大數(shù)據(jù)技術的大門。本書主要介紹數(shù)據(jù)科學與
本書全面地介紹了大數(shù)據(jù)可視化的基礎知識和基本技術。全書共分為8章,內容包括大數(shù)據(jù)可視化的基本概念,可視化原則,視覺設計基礎知識,數(shù)據(jù)處理技術,對比趨勢、比例數(shù)據(jù)、關系數(shù)據(jù)等多種數(shù)據(jù)可視化方式,以及利用可視化對數(shù)據(jù)進行探索與預測,并通過綜合分析案例梳理完整大數(shù)據(jù)可視化流程。1.數(shù)據(jù)可視化設計理論以必需、夠用為度,注重實用
第3版介紹并擴展了許多主題,提供了軟件工具和數(shù)據(jù)挖掘應用程序的修訂部分;還更新了參考書目列表,供感興趣的讀者進一步研究;擴展了涉及每個章節(jié)的問題列表。 展示了如下新信息: 探索大數(shù)據(jù)和云計算論述深度學習 包括卷積神經(jīng)網(wǎng)絡(CNN)的信息提出了強化學習 包含半監(jiān)督學習