![]() ![]() |
大數(shù)據(jù)技術(shù)與應(yīng)用——Hadoop和PySpark實(shí)現(xiàn) 本書以Python為基礎(chǔ),深入講解HDFS分布式文件系統(tǒng)和PySpark3編程。全書共9章,內(nèi)容包括Docker環(huán)境下Hadoop與Spark的配置、HDFS操作技巧、RDD編程方法、Spark SQL應(yīng)用、Spark架構(gòu)及運(yùn)行機(jī)制、Pandas on Spark使用及Spark ML編程實(shí)踐。本書通過實(shí)際操作案例,幫助讀者掌握Hadoop和PySpark的環(huán)境搭建與應(yīng)用編程,附帶豐富的教學(xué)資源,包括教案、教學(xué)課件、練習(xí)題、源代碼、數(shù)據(jù)集及核心知識(shí)點(diǎn)視頻講解及實(shí)驗(yàn)指導(dǎo),為讀者提供強(qiáng)大支持。 本書適合作為全國高等學(xué)校計(jì)算機(jī)、軟件工程、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、人工智能等專業(yè)的教材,同時(shí)對(duì)大數(shù)據(jù)應(yīng)用開發(fā)者和技術(shù)從業(yè)者亦有參考價(jià)值。
你還可能感興趣
我要評(píng)論
|