R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐
定 價(jià):79 元
R語(yǔ)言是一種自由、免費(fèi)且開源的高級(jí)編程語(yǔ)言和開發(fā)環(huán)境,它提供了強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化工具。隨著數(shù)據(jù)科學(xué)的快速發(fā)展,R語(yǔ)言已成為數(shù)據(jù)分析領(lǐng)域中備受青睞的通用語(yǔ)言。《R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐》共分為15章,主要內(nèi)容包括R語(yǔ)言簡(jiǎn)介、數(shù)據(jù)讀寫、從流程控制到自定義函數(shù)、繪圖功能及基本統(tǒng)計(jì)、數(shù)據(jù)分析和常用包、監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、演化式學(xué)習(xí)、混合式學(xué)習(xí)、關(guān)聯(lián)性規(guī)則、文本挖掘、推薦系統(tǒng)、可視化數(shù)據(jù)分析、探索性數(shù)據(jù)分析以及深度學(xué)習(xí)等。《R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐》內(nèi)容通俗易懂,案例豐富,實(shí)用性強(qiáng),特別適合R語(yǔ)言的初學(xué)者和進(jìn)階讀者閱讀,同時(shí)也適合數(shù)據(jù)分析人員、數(shù)據(jù)挖掘工程師等相關(guān)數(shù)據(jù)科學(xué)從業(yè)者參考。
《R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐》是一本全面介紹使用R語(yǔ)言進(jìn)行數(shù)據(jù)分析的實(shí)用指南。作者以豐富的實(shí)例和案例,詳細(xì)介紹了R語(yǔ)言在數(shù)據(jù)挖掘、文本挖掘和可視化數(shù)據(jù)分析等領(lǐng)域的應(yīng)用。無(wú)論您是初學(xué)者還是專業(yè)人士,《R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐》都將成為您的得力助手,幫助您快速提升數(shù)據(jù)分析技能,實(shí)現(xiàn)職業(yè)目標(biāo)。閱讀《R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐》,讓您輕松掌握數(shù)據(jù)分析的精髓,成為數(shù)據(jù)分析領(lǐng)域的專家。
R語(yǔ)言是一種完全開源的程序設(shè)計(jì)語(yǔ)言,可以免費(fèi)使用。它具有豐富的生態(tài)系統(tǒng)(Comprehensive R Archive Network,CRAN),提供超過(guò)15 000個(gè)免費(fèi)套件(Package),廣泛應(yīng)用于統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、生物信息學(xué)、金融分析以及社會(huì)科學(xué)研究等多個(gè)領(lǐng)域。隨著R語(yǔ)言的流行和普及,許多學(xué)者和專家將其作為研究與開發(fā)的主要工具,因此學(xué)習(xí)R語(yǔ)言是明智的選擇。本書主要內(nèi)容如下:第1章 R簡(jiǎn)介,主要介紹R軟件的基本功能以及主要對(duì)象類型,如向量、數(shù)組、矩陣、數(shù)據(jù)框、因子、列表和對(duì)象轉(zhuǎn)換。第2章 讀寫數(shù)據(jù),主要介紹R語(yǔ)言中常用的數(shù)據(jù)讀取與寫入方法,涵蓋文本文件、Excel表格、數(shù)據(jù)庫(kù)等多種數(shù)據(jù)源的操作技巧。第3章 從流程控制到函數(shù),主要介紹R語(yǔ)言編程的基礎(chǔ)結(jié)構(gòu),包括流程控制語(yǔ)句和函數(shù)的定義與使用。通過(guò)學(xué)習(xí)本章內(nèi)容,讀者將能夠編寫結(jié)構(gòu)清晰、高效可維護(hù)的代碼,提升代碼的復(fù)用性與執(zhí)行效率。第4章 繪圖功能及基本統(tǒng)計(jì),主要介紹R語(yǔ)言中的繪圖功能,包括高級(jí)繪圖函數(shù)、低級(jí)繪圖函數(shù)及交互式繪圖函數(shù)的使用,并講解圖形參數(shù)設(shè)置方法。同時(shí),簡(jiǎn)要介紹基礎(chǔ)統(tǒng)計(jì)知識(shí),為后續(xù)統(tǒng)計(jì)建模打下基礎(chǔ)。第5章 數(shù)據(jù)分析和常用包,主要介紹R語(yǔ)言在數(shù)據(jù)分析領(lǐng)域的常見應(yīng)用場(chǎng)景,并講解機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和文本挖掘中常用的擴(kuò)展包及其基本用法。第6章 監(jiān)督式學(xué)習(xí),本章系統(tǒng)講解監(jiān)督學(xué)習(xí)的主要算法,包括決策樹、支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)以及集成學(xué)習(xí)方法,幫助讀者掌握預(yù)測(cè)建模的核心技術(shù)。第7章 非監(jiān)督式學(xué)習(xí),主要介紹非監(jiān)督式學(xué)習(xí)的基本原理與應(yīng)用,重點(diǎn)講解聚類分析方法,包括層次聚類、K均值聚類、模糊C均值聚類及其評(píng)價(jià)指標(biāo),適用于無(wú)標(biāo)簽數(shù)據(jù)的自動(dòng)分類任務(wù)。第8章 演化式學(xué)習(xí),主要介紹基于自然啟發(fā)機(jī)制的優(yōu)化算法,主要包括遺傳算法(GA)和人工蜂群算法(ABC),并探討其在優(yōu)化問(wèn)題中的應(yīng)用。第9章 混合式學(xué)習(xí),主要介紹多種智能算法的融合策略,包括人工蜂群算法與決策樹的結(jié)合、遺傳算法與人工神經(jīng)網(wǎng)絡(luò)的結(jié)合,以提升模型性能與泛化能力。第10章 關(guān)聯(lián)性規(guī)則,主要講解關(guān)聯(lián)規(guī)則的基本概念與生成方法,重點(diǎn)介紹如何從大量數(shù)據(jù)中發(fā)現(xiàn)變量之間的潛在關(guān)聯(lián)關(guān)系,并應(yīng)用于推薦系統(tǒng)等領(lǐng)域。第11章 文本挖掘,主要介紹文本挖掘的基本流程,包括中文分詞、詞頻統(tǒng)計(jì)與詞云生成等內(nèi)容,幫助讀者掌握從非結(jié)構(gòu)化文本中提取信息的方法。第12章 推薦系統(tǒng),通過(guò)Jester5k與MovieLens等經(jīng)典數(shù)據(jù)集,演示推薦系統(tǒng)的實(shí)現(xiàn)過(guò)程,涵蓋協(xié)同過(guò)濾、內(nèi)容推薦等主流方法。第13章 可視化數(shù)據(jù)分析,主要介紹數(shù)據(jù)可視化工具的使用方法,幫助讀者通過(guò)圖表形式直觀展示數(shù)據(jù)特征與分析結(jié)果,提高數(shù)據(jù)洞察力。第14章 探索性數(shù)據(jù)分析,通過(guò)實(shí)際案例引導(dǎo)讀者完成完整的探索性數(shù)據(jù)分析流程。第15章 深度學(xué)習(xí),主要介紹深度學(xué)習(xí)的核心算法,包括多層感知器(MLP)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和生成對(duì)抗網(wǎng)絡(luò)(GAN),并提供R語(yǔ)言環(huán)境下的實(shí)現(xiàn)示例。本書配套源代碼、數(shù)據(jù)、教學(xué)PPT課件,請(qǐng)用微信掃描下方的二維碼獲取,也可按掃描出來(lái)的頁(yè)面提示,把下載鏈接發(fā)送到自己的郵箱進(jìn)行下載。 源代碼 數(shù)據(jù) PPT課件如果讀者在學(xué)習(xí)過(guò)程中有任何問(wèn)題,請(qǐng)通過(guò)電子郵件聯(lián)系booksaga@126.com,郵件主題為R語(yǔ)言數(shù)據(jù)分析從入門到實(shí)踐。筆者是福州大學(xué)先進(jìn)制造學(xué)院教授,本書是筆者多年教學(xué)經(jīng)驗(yàn)的結(jié)晶,適合有意向?qū)W習(xí)數(shù)據(jù)分析的讀者閱讀。書中的范例代碼可供讀者進(jìn)行練習(xí)。本書特別適合想學(xué)R語(yǔ)言和數(shù)據(jù)分析的初學(xué)者,同時(shí)也可作為希望自我進(jìn)修的入門參考書。盡管筆者在撰寫本書時(shí)力求完美,但仍可能存在疏漏之處,歡迎各位讀者批評(píng)與指正。本書的出版,感謝李開暉教授、王量弘教授及出版社編輯的鼎力協(xié)助,同時(shí)感謝福州大學(xué)先進(jìn)制造學(xué)院領(lǐng)導(dǎo)的支持,最后也感謝家人的全力支持與協(xié)助。
李仁鐘2025年4月
李仁鐘,教授,博士,博士研究生導(dǎo)師,福建省通信學(xué)會(huì)高級(jí)會(huì)員、福建省電機(jī)工程學(xué)會(huì)專委會(huì)委員、福建能源電力專家、福建省電子學(xué)會(huì)智能信息專委會(huì)副主任、福建大數(shù)據(jù)聯(lián)盟副理事長(zhǎng)。他于2020-2023年入選全球前2%頂尖科學(xué)家終身科學(xué)影響力排行榜,并于2022年獲得第十三屆福州市自然科學(xué)優(yōu)秀學(xué)術(shù)論文三等獎(jiǎng)和優(yōu)秀獎(jiǎng),同時(shí)于2021年入選福州市長(zhǎng)樂區(qū)第三屆優(yōu)秀人才稱號(hào)。
第1 章 R簡(jiǎn)介 11.1 R軟件介紹 11.2 R對(duì)象介紹 41.2.1 向量 41.2.2 數(shù)組 61.2.3 矩陣 81.2.4 數(shù)據(jù)框 111.2.5 因子 131.2.6 列表 131.2.7 對(duì)象轉(zhuǎn)換 151.3 習(xí)題 16第2 章 讀寫數(shù)據(jù) 172.1 讀取數(shù)據(jù) 172.2 寫入數(shù)據(jù) 212.3 讀寫RData數(shù)據(jù) 222.4 讀寫Excel數(shù)據(jù) 232.5 習(xí)題 23第3章 從流程控制到函數(shù) 243.1 條件執(zhí)行 243.2 循環(huán)控制 263.3 函數(shù) 303.4 習(xí)題 31第4章 繪圖功能及基本統(tǒng)計(jì) 324.1 高級(jí)繪圖函數(shù) 324.2 低級(jí)繪圖函數(shù) 354.3 交互式繪圖函數(shù) 364.4 圖形參數(shù) 384.5 基本統(tǒng)計(jì) 404.6 習(xí)題 45第5章 數(shù)據(jù)分析和常用包 465.1 機(jī)器學(xué)習(xí) 465.2 數(shù)據(jù)挖掘 475.3 文本挖掘 475.4 常用包 47第6章 監(jiān)督式學(xué)習(xí) 566.1 決策樹 566.2 支持向量機(jī) 696.3 人工神經(jīng)網(wǎng)絡(luò) 736.4 集成學(xué)習(xí)方法 786.4.1 隨機(jī)森林 796.4.2 提升法 806.5 習(xí)題 81第7章 非監(jiān)督式學(xué)習(xí) 827.1 層次聚類法 827.2 K均值聚類算法 857.3 模糊C均值聚類算法 887.4 聚類指標(biāo) 927.5 習(xí)題 95第8章 演化式學(xué)習(xí) 968.1 遺傳算法 968.2 人工蜂群算法 101第9章 混合式學(xué)習(xí) 1059.1 人工蜂群算法混合決策樹 1059.2 遺傳算法混合人工神經(jīng)網(wǎng)絡(luò) 108第10章 關(guān)聯(lián)性規(guī)則 11510.1 產(chǎn)生關(guān)聯(lián)性規(guī)則并排序 11710.2 刪除冗余規(guī)則 12110.3 習(xí)題 127第11章 文本挖掘 12811.1 使用混合分詞并創(chuàng)建詞頻表 12811.2 使用tag分詞并創(chuàng)建詞云 12911.3 習(xí)題 131第12章 推薦系統(tǒng) 13212.1 Jester5k數(shù)據(jù)集 13212.2 MovieLense數(shù)據(jù)集 135第13章 可視化數(shù)據(jù)分析 13813.1 導(dǎo)入數(shù)據(jù) 13913.1.1 處理數(shù)據(jù)集 14213.1.2 設(shè)置變量 14313.2 探索及測(cè)試數(shù)據(jù) 14313.3 轉(zhuǎn)換數(shù)據(jù) 14713.4 建立、評(píng)估及導(dǎo)出模型 14913.5 習(xí)題 151第14章 探索性數(shù)據(jù)分析 15214.1 dplyr數(shù)據(jù)處理庫(kù)(包) 15214.2 案例分析 162第15章 深度學(xué)習(xí) 18515.1 多層感知器 18615.2 卷積神經(jīng)網(wǎng)絡(luò) 19415.3 長(zhǎng)短期記憶網(wǎng)絡(luò) 20115.4 生成對(duì)抗網(wǎng)絡(luò) 20615.5 深度學(xué)習(xí)應(yīng)用 21215.6 習(xí)題 213附錄A 安裝R 214附錄B 安裝RStudio Desktop和rattle 217附錄C R語(yǔ)言指令及用法 222