本書采用一種創(chuàng)新的模型論進(jìn)行邏輯編程,從數(shù)據(jù)集的基本概念(即閉原子集)開始。沿著這一基本概念,我們引入視圖(即虛擬關(guān)系);我們將經(jīng)典邏輯程序定義為視圖定義集,使用傳統(tǒng)的類似于Prolog的表示法編寫,但語義是根據(jù)數(shù)據(jù)集而不是根據(jù)實現(xiàn)方式給出。然后介紹了一些閉原子操作,如添加和刪除。
《大數(shù)據(jù)分析指南》是數(shù)據(jù)科學(xué)領(lǐng)域為數(shù)不多的理論與實踐相結(jié)合的基礎(chǔ)性、實用型專業(yè)圖書,它通過詳細(xì)剖析大數(shù)據(jù)分析的基礎(chǔ)理論和企業(yè)實際案例,全景展現(xiàn)了大數(shù)據(jù)分析各個階段的基礎(chǔ)知識、相關(guān)方法、關(guān)鍵技術(shù)和實用工具。全書全面、系統(tǒng)的講解了大數(shù)據(jù)分析的基礎(chǔ)理論、體系架構(gòu)、關(guān)鍵技術(shù)、各個關(guān)鍵環(huán)節(jié)(采集與存儲、數(shù)據(jù)清洗、數(shù)據(jù)挖掘
本書作者柳義筠,副教授,廣州科技貿(mào)易職業(yè)學(xué)院信息工程學(xué)院教研室主任,網(wǎng)絡(luò)工程師、嵌入式系統(tǒng)設(shè)計師、高級網(wǎng)頁考評員,長期從事計算機(jī)專業(yè)教學(xué)。本書從初學(xué)者角度出發(fā),采用理論與實踐相結(jié)合的方式,全面介紹了Hadoop大數(shù)據(jù)技術(shù)。主要內(nèi)容包括初識Hadoop大數(shù)據(jù)技術(shù)、Hadoop環(huán)境配置,分布式文件HDFS、資源調(diào)度框架YA
本書圍繞大數(shù)據(jù)應(yīng)用,從理論、相關(guān)技術(shù)和實際應(yīng)用三個層面進(jìn)行闡述,具體包括:大數(shù)據(jù)概念和發(fā)展背景、大數(shù)據(jù)采集及預(yù)處理、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)軟件基礎(chǔ)、大數(shù)據(jù)可視化、Hadoop概論、大數(shù)據(jù)安全等。
本書共12章,內(nèi)容包括:大數(shù)據(jù)簡析、大數(shù)據(jù)的數(shù)據(jù)獲取、大數(shù)據(jù)計算框架、大數(shù)據(jù)存儲技術(shù)、大數(shù)據(jù)分析與可視化、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)安全技術(shù)、數(shù)據(jù)中心及云計算應(yīng)用等。
本書屬于工學(xué)及電子信息學(xué)方面的著作,由人工智能的基本概念及原理、相應(yīng)領(lǐng)域的算法及應(yīng)用、不確定性推理、自動規(guī)劃求解系統(tǒng)、知識表示和問題求解、自然語言處理技術(shù)、智能信息處理技術(shù)、分布式人工智能和Agent技術(shù)等部分組成。全書以大數(shù)據(jù)為背景,從人工智能技術(shù)的基本理論著手編寫,與實際相結(jié)合分析它在生活中的應(yīng)用,并思考人工智能的
大數(shù)據(jù)導(dǎo)論是一門理論性和實踐性都很強(qiáng)的課程。本教材針對信息管理、經(jīng)濟(jì)管理和其他相關(guān)專業(yè)學(xué)生的發(fā)展需求,系統(tǒng)、全面地介紹了關(guān)于大數(shù)據(jù)技術(shù)與應(yīng)用的基本知識和技能,詳細(xì)介紹了大數(shù)據(jù)與大數(shù)據(jù)時代、大數(shù)據(jù)的可視化、大數(shù)據(jù)的商業(yè)規(guī)則、大數(shù)據(jù)時代的思維變革、大數(shù)據(jù)促進(jìn)醫(yī)療與健康、大數(shù)據(jù)激發(fā)創(chuàng)造力、大數(shù)據(jù)預(yù)測分析、大數(shù)據(jù)促進(jìn)學(xué)習(xí)、大數(shù)
數(shù)據(jù)治理
本書從技術(shù)實戰(zhàn)的角度,帶領(lǐng)讀者一步一步掌握大數(shù)據(jù)的相關(guān)技能。本書不僅提供相應(yīng)命令、配置文件,還提供模擬環(huán)境演示等,并盡可能通過案例和實操降低大數(shù)據(jù)學(xué)習(xí)的門檻,力求讓讀者學(xué)以致用。 本書主要內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Linux基礎(chǔ)與集群搭建、Hadoop集群配置、HDFS、MapReduce分布式編程、Hive大數(shù)據(jù)倉庫、
Spark?SQL是Spark用于處理結(jié)構(gòu)化數(shù)據(jù)的一個模塊。本書共8章內(nèi)容,由淺入深地講解Spark?SQL的基礎(chǔ)知識、安裝部署、編程基礎(chǔ)、編程進(jìn)階、函數(shù)、性能調(diào)優(yōu)技巧以及編程實踐等知識。通過本書的學(xué)習(xí),讀者能夠掌握Spark?SQL核心技術(shù)。本書每章安排了習(xí)題和總結(jié),以便使讀者能更好地學(xué)習(xí)和更牢固地掌握Spark?S