本書結(jié)合大數(shù)據(jù)技術(shù)的發(fā)展特點,沿著大數(shù)據(jù)的采集、存儲、計算、分析挖掘和可視化的脈絡(luò)逐步闡述大數(shù)據(jù)的概念和應(yīng)用方法。全面而系統(tǒng)地介紹了大數(shù)據(jù)的基本知識和應(yīng)用技能,內(nèi)容涵蓋大數(shù)據(jù)領(lǐng)域的全過程,具有較強的系統(tǒng)性、可讀性和實用性。本書秉承能力教育與思政教育同向同行的理念,將知識技能學(xué)習(xí)和思政教育融合在一起,潛移默化,激發(fā)學(xué)生的
本書基于具有實用性和普適性的案例來編寫,將數(shù)據(jù)的收集、獲取、預(yù)處理、分析與可視化貫穿其中。根據(jù)當前高職高專教學(xué)實際需要,結(jié)合企業(yè)實際需求,采用“理實結(jié)合”的思路,以“案例導(dǎo)入”的形式詳細介紹了大數(shù)據(jù)實訓(xùn)項目。包括使用requests庫獲取天氣信息,然后通過JupyterNotebook進行分析處理;使用Scrapy框架
本書主要研究決策蘊涵的邏輯理論及形式概念分析中的知識表示與推理。具體內(nèi)容包括:決策蘊涵、模糊決策蘊涵和可變決策蘊涵的邏輯理論,決策蘊涵規(guī)范基和模糊決策蘊涵規(guī)范基的邏輯理論,決策蘊涵規(guī)范基的生成方法和性能分析,決策蘊涵的知識表示能力及其與概念規(guī)則和粒規(guī)則的比較,模糊屬性約簡等。
本書結(jié)合作者在數(shù)據(jù)安全領(lǐng)域的教學(xué)和科研實踐,提出了完整的數(shù)據(jù)安全概念與體系,介紹了數(shù)據(jù)安全理論與技術(shù)知識及其前沿研究進展。本書內(nèi)容包括基礎(chǔ)篇和高級篇;A(chǔ)篇介紹數(shù)據(jù)安全密碼技術(shù)基礎(chǔ),數(shù)據(jù)保密性、完整性、認證性、訪問控制、可用性,以及數(shù)據(jù)庫安全和數(shù)據(jù)安全管理等內(nèi)容;高級篇介紹云數(shù)據(jù)存儲安全與訪問安全、數(shù)據(jù)計算安全、數(shù)據(jù)可
本書系統(tǒng)講述ApacheSpark大數(shù)據(jù)計算平臺的原理,以及如果將ApacheSpark應(yīng)用于大數(shù)據(jù)的實時流處理、批處理、圖計算等各個場景。通過原理深入學(xué)習(xí)和實踐示例、案例的學(xué)習(xí)應(yīng)用,使讀者了解并掌握ApacheSpark大數(shù)據(jù)計算平臺的基本原理和技能,接近理論與實踐的距離。全書共分為13章,主要內(nèi)容包括Spark架構(gòu)
《大數(shù)據(jù)技術(shù)概論(微課版)》以項目、任務(wù)驅(qū)動的方式組織內(nèi)容,以大數(shù)據(jù)產(chǎn)業(yè)鏈六大產(chǎn)業(yè)環(huán)節(jié)為核心構(gòu)建邏輯,采用新形態(tài)活頁的形式進行組織編寫!洞髷(shù)據(jù)技術(shù)概論(微課版)》共10個項目,包括認識大數(shù)據(jù)、了解大數(shù)據(jù)產(chǎn)業(yè)、大數(shù)據(jù)平臺與生態(tài)圈、大數(shù)據(jù)采集、大數(shù)據(jù)存儲、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化、中國信創(chuàng)與大數(shù)據(jù)中臺
本書針對智能制造中的數(shù)據(jù)技術(shù)基礎(chǔ)展開介紹,在概要闡述數(shù)據(jù)技術(shù)基本概念與發(fā)展歷程之后,圍繞智能制造中的業(yè)務(wù)數(shù)據(jù)化特點,從數(shù)據(jù)生命周期與數(shù)據(jù)管理流程角度,依次對智能制造中的主要數(shù)據(jù)技術(shù)及其應(yīng)用情況進行了詳細介紹。本書撰寫基于理論與實踐相結(jié)合的原則,注重數(shù)據(jù)技術(shù)方法體系及其在智能制造業(yè)務(wù)中的應(yīng)用介紹,能夠為智能制造工程、機械
本書詳細介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)理論和主流前沿技術(shù)。全書共分9章,分別介紹目前面臨的大數(shù)據(jù)時代、大數(shù)據(jù)系統(tǒng)的基本結(jié)構(gòu)、大數(shù)據(jù)采集與預(yù)處理、大數(shù)據(jù)處理基礎(chǔ)架構(gòu)——云計算、計算模式與處理系統(tǒng)、查詢展現(xiàn)與交互、大數(shù)據(jù)分析與數(shù)據(jù)挖掘、隱私與安全、前沿技術(shù)及應(yīng)用、行業(yè)案例研究。每一章除講解相關(guān)理論外,還講解了適用技術(shù)及案例。各章都
流計算系統(tǒng)盡可能地優(yōu)化了接收處理事件數(shù)據(jù)的間隔時間,因此能實時地提供響應(yīng)。對于金融、安全和物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用來說,幾毫秒都很關(guān)鍵,因此流計算系統(tǒng)是必要組件。而且,流計算是熱門技術(shù)!具有Spark、Heron和Kafka經(jīng)驗的工程師供不應(yīng)求。 《流計算系統(tǒng)圖解》以淺顯易懂的語言介紹了實時事件流應(yīng)用。這本引人入勝的書闡明了
本書以Hadoop3.x為主線,全面介紹Hadoop及其生態(tài)體系中常用的大數(shù)據(jù)開源項目的安裝和使用。全書共11章,分別講解大數(shù)據(jù)概念、Hadoop基礎(chǔ)知識、Hadoop集群部署、HDFS、MapReduce、YARN、ZooKeeper、Hive、Flume、Azkaban和Sqoop,并在最后開發(fā)一個完整的網(wǎng)站流量日