本書通過10個第一現(xiàn)場的案例故事,揭秘平臺流量機制的構建角度與構建過程,針對性地解決互聯(lián)網(wǎng)數(shù)據(jù)從業(yè)者面臨的棘手問題,包含觸達用戶、提升產(chǎn)品體驗、優(yōu)化內(nèi)容生態(tài)等重要運營命題的思維方式和應用方法。 全書分為3個部分,共17章。第1部分(第1~7章)為工具篇,詳細介紹互聯(lián)網(wǎng)數(shù)據(jù)分析師所應具備的基礎思維方式和方法論,互聯(lián)網(wǎng)產(chǎn)品
本書以大數(shù)據(jù)分析應用崗位職業(yè)能力遞進為主線,較為全面地介紹了Spark大數(shù)據(jù)技術的相關知識。全書共7章,內(nèi)容包括Spark生態(tài)圈中的SparkCore、SparkSQL、SparkStreaming、GraphX、MLlib等組件,以及海量離線數(shù)據(jù)的處理、基于歷史數(shù)據(jù)的交互式查詢、基于實時數(shù)據(jù)流的大數(shù)據(jù)處理、圖計算、機
數(shù)據(jù)科學的關鍵技術包括數(shù)據(jù)存儲計算、數(shù)據(jù)治理、結構化數(shù)據(jù)分析、語音分析、視覺分析、文本分析和知識圖譜等方面。本書的重點是詳細介紹文本分析和知識圖譜方面的技術。文本分析技術主要包括文本預訓練模型、多語種文本分析、文本情感分析、文本機器翻譯、文本智能糾錯、NL2SQL問答以及ChatGPT大語言模型等。知識圖譜技術主要包括
本書作為《大數(shù)據(jù)導論》(ISBN9787302500704)的配套實訓教材,旨在幫助讀者夯實基礎知識,還原企業(yè)真實業(yè)務,提升實操能力。本書從大數(shù)據(jù)開發(fā)所需要的基礎編程知識出發(fā),首先闡述Linux開發(fā)環(huán)境中常用的命令。接著介紹數(shù)據(jù)清洗工具Kettle的基礎操作以及常見的數(shù)據(jù)可視化效果,如餅圖、柱狀圖、折線圖、平行坐標圖等
本書系統(tǒng)介紹了Hadoop生態(tài)系統(tǒng)主要組件的基本概念、特點、主要組成、運行機制及存在的問題等內(nèi)容。全書共11章,內(nèi)容包含大數(shù)據(jù)基本概念、大數(shù)據(jù)處理平臺Hadoop、分布式文件系統(tǒng)HDFS、HDFS2.0新特性、分布式計算框架MapReduce、數(shù)據(jù)倉庫Hive、分布式數(shù)據(jù)庫HBase、數(shù)據(jù)遷移工具Sqoop、日志采集系
本書較完整地講解了數(shù)據(jù)挖掘和機器學習的基本概念、基本算法原理和應用技術。本書用通俗的語言和實例解釋了抽象的概念,并將抽象概念融合到具體的案例中,以便于讀者理解和掌握。本書在編寫過程中力求做到語言精練、概念清晰、取材合理、深入淺出、突出應用,為讀者進一步從事數(shù)據(jù)分析、應用、開發(fā)和研究奠定堅實的基礎。本書既可作為高等院校信
本書以數(shù)據(jù)要素化治理的理論方法與工程實踐為主線,內(nèi)容按照概念篇、原理篇和工程篇依次展開。概念篇在對數(shù)據(jù)、數(shù)據(jù)要素相關概念及其演進過程進行系統(tǒng)梳理的基礎上,首次對“數(shù)據(jù)要素”“數(shù)據(jù)要素化”進行了明確定義,并基于傳統(tǒng)生產(chǎn)要素市場化配置規(guī)律,提出數(shù)據(jù)要素化治理的基本思路。在原理篇,定義了數(shù)據(jù)元件作為連接數(shù)據(jù)供需兩端的“中間態(tài)
本書完整、全面地講述數(shù)據(jù)挖掘的概念、方法、技術和近期新研究的進展,重點論述數(shù)據(jù)預處理、頻繁模式挖掘、分類和聚類等內(nèi)容,還全面講述OLAP和數(shù)據(jù)挖掘常用算法,并研討數(shù)據(jù)挖掘體系結構及其重要的應用領域。本書共7章:第1章是數(shù)據(jù)挖掘概述;第2章對數(shù)據(jù)挖掘進行歷史回顧并介紹目前的研究現(xiàn)狀;第3章著重討論數(shù)據(jù)挖掘的常用算法和工具
本書是高等職業(yè)教育自動化類專業(yè)“智改數(shù)轉”系列新形態(tài)教材之一。本書是根據(jù)機器人工程技術人員、數(shù)字化解決方案設計師等新職業(yè)的崗位要求,結合高等職業(yè)院校裝備制造大類專業(yè)轉型升級需求編寫的理實一體化教材。本書圍繞機器人生產(chǎn)線虛擬調(diào)試技術應用設計了五個項目,分別為認識機器人生產(chǎn)線虛擬調(diào)試技術、半成品庫仿真設計、螺釘鎖付站仿真設
"本書是高等職業(yè)教育智慧財經(jīng)系列教材之一。本書分為七個項目介紹大數(shù)據(jù)的基本理論和實踐應用:項目一,主要介紹大數(shù)據(jù)的概念、發(fā)展歷程以及大數(shù)據(jù)的影響等相關內(nèi)容;項目二,主要介紹大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、人工智能的關系;項目三,主要介紹數(shù)據(jù)整理;項目四,主要介紹數(shù)據(jù)清洗;項目五,主要介紹大數(shù)據(jù)可視化分析技術,運用PowerBI