本書先簡單介紹了Spark和SparkMLlib,然后介紹標準SparkMLlib庫之外的更強大的第三方機器學習算法和庫。通過閱讀本書,你將能夠通過幾十個實際的例子和深刻的解釋,將所學到的知識應用到真實世界的用例。
本書由“數(shù)據(jù)倉庫之父”Inmon和“DataVault之父”Linstedt領銜撰寫,帶領讀者從宏觀視角了解數(shù)據(jù)架構(gòu)的基本概念和原則,是數(shù)據(jù)科學家、分析師和管理者在入門階段的必備參考讀物。本書創(chuàng)新性地提出終端狀態(tài)架構(gòu)的概念,新增了關于可視化和大數(shù)據(jù)的章節(jié),以及文本管理和分析等來自不同行業(yè)的實例。通過閱讀本書,讀者將通曉
本書主要分析Hadoop3.2.0的新特性和新功能,共5章。首先簡單介紹Hadoop,讓剛接觸Hadoop的讀者對它有個基本了解;接著介紹目前使用比較多的分布式文件系統(tǒng)HDFS,內(nèi)容涉及NameNode的原理、HA、HDFSFederation和HDFS3.0中新增的特性;然后從應用管理和資源調(diào)度這兩個方面介紹一個通用
本書是“數(shù)字系統(tǒng)設計”課程的配套教材。全書共6章,包括C8051F360單片機結(jié)構(gòu)、C8051F360的數(shù)字I/O端口、C8051F360的模擬外設、開發(fā)工具簡介、實驗平臺概述、綜合設計實例。本書提供實驗平臺所有模塊的詳細電路原理圖、設計方案、底層控制程序、例程應用等。在每個綜合設計實例后提供拓展任務,以便學生深入理解
借助于數(shù)據(jù)分析與挖掘技術能夠從龐大的、分散的數(shù)據(jù)中獲取所需要的知識,這是當前科技領域的一個重要課題研究。本書梳理了大數(shù)據(jù)分析與數(shù)據(jù)挖掘的多種研究方法,介紹了數(shù)據(jù)特征分析與數(shù)據(jù)準備,并從關聯(lián)規(guī)則、回歸分析、分類分析、聚類分析、預測與時間數(shù)據(jù)分析等方面闡述了典型數(shù)據(jù)挖掘技術及其應用,并在最后介紹了當前教育的熱點——教育大數(shù)
本書的主要目的是給讀者啟動和實施數(shù)據(jù)治理計劃提供一個堅實的基礎,同時作為其他數(shù)據(jù)治理書籍的有益補充。如果您的企業(yè)已經(jīng)開始數(shù)據(jù)治理實踐但仍搖擺不定,本書將為您提供許多建議并盡可能提供中立的立場和流程。在大量的背景、定義和推薦實踐之外,本書將展現(xiàn)開展數(shù)據(jù)治理的通用的步驟和活動,并在附件中提供了交付物和工作成果模板,可以作為
在這本書中,作者給出在過程工業(yè)中所需要的先進控制技術的概念和術語。這本書是為熟悉傳統(tǒng)控制過程卻在先進控制領域缺少相關經(jīng)驗的控制工程師編寫的。這本書的每一章的結(jié)構(gòu)允許快速了解技術及如何應用。應用大量實例來說明什么是需要處理應用程序。而且,每一章的第一段介紹相關技術的數(shù)學基礎,章末則給出探索性的內(nèi)容。讀者可通過轉(zhuǎn)到本書附帶
本書共九章,主要內(nèi)容包括:綜述、光電檢測系統(tǒng)的關鍵器件、光電信息檢測技術與系統(tǒng)、光電圖像檢測技術與系統(tǒng)、光電干涉檢測技術與系統(tǒng)、光電衍射檢測技術與系統(tǒng)、光電掃描技術工程、光纖傳感檢測技術與系統(tǒng)、光譜檢測技術與系統(tǒng)。
《數(shù)據(jù)科學導論(面向新工科專業(yè)建設計算機系列教材)》主要介紹數(shù)據(jù)科學的通識入門知識,可以作為高等院校數(shù)據(jù)科學與大數(shù)據(jù)專業(yè)的專業(yè)基礎課程教材。該書以“建立知識體系、掌握基本原理、學會初級實踐、了解前沿技術”為原則,為數(shù)據(jù)科學與大數(shù)據(jù)及相關專業(yè)的學生深入學習數(shù)據(jù)科學和大數(shù)據(jù)技術奠定基礎。該書系統(tǒng)講授數(shù)據(jù)科學的基本概念和知識
本教材在選題與整體結(jié)構(gòu)設計時,對大數(shù)據(jù)基礎知識和技術應用做了詳細的解析,同時全面介紹了如何運用方法和工具對大數(shù)據(jù)應用案例進行分析,是一本特色鮮明、理論與實踐相結(jié)合、具有廣泛使用價值的教材。使本科生從整體上了解大數(shù)據(jù)基礎的內(nèi)容與技能。