本書主要針對網絡計量分析中普遍存在的問題,例如開放獲取網絡資源的技術門檻較高、網絡內容提取和分析技術繁多且復雜、定量分析的結果解讀困難等,提出具體解決方案和技術實踐路徑,尤其是利用R語言編程的方法解決上述問題,包括網頁數據自動抓取、網絡鏈接分析和網絡文本內容分析等,以便相關專業(yè)的師生掌握網絡計量分析的方法和技能,并依據統(tǒng)計分析的原理和方法解釋定量分析的結果。
現在網絡計量學已經被廣泛理解為研究基于網絡內容和網絡現象,以實現社會科學研究目標的定量研究方法。該方法通常研究與傳統(tǒng)文獻計量學相關的問題,研究范圍包括網站鏈接、網站引用和搜索引擎評估分析方法等。網絡計量學利用更廣泛的學術對象,如專利、網頁、社交媒體等。網絡計量學已被廣泛用于研究學科的學術交流結構。本書內容是在“網絡計量分析”的教學實踐中使用的教學內容,這些內容包含了部分開放的網絡資源,如網絡數據、R語言代碼以及使用手冊等。
楊孟輝:人民大學信息資源管理學院教授,主持國家自然科學基金重大項目、面上項目、中國博士后科學基金項目等多項。在國際SCI學術期刊和國內重要學報等以第一作者發(fā)表論文40余篇;授權國家發(fā)明專利2項。國家自然科學基金項目評審專家,國家認監(jiān)委檢驗檢測機構(教育組)資質認定評審員(國家級)。
第1章
網絡計量分析
1.1 大數據理論
1.2 Web超鏈接分析
1.3 計算文本分析
1.4 網絡分析
第2章 如何找到合適的網絡數據
2.1 Google Books Ngram Viewer
2.2 Google Trends
2.3 Google Search
2.4 Google Scholar
第3章 網頁數據自動抓取
3.1 下載并安裝Data Miner到Google
Chrome中
3.2 開啟Data Miner
3.3 打開Data Miner
3.4 注冊并登錄Data Miner
3.5 創(chuàng)建Recipe
3.6 設置待爬取網頁的類型
3.7 設置待爬取網頁中行的信息
3.8 設置待爬取網頁中列的信息
3.9 設置爬取時自動翻頁
3.10 設置爬取動作
3.11 設置腳本
3.12 保存設置
3.13 開始爬取
3.14 本章小結
第4章 網絡鏈接分析
4.1 URL提取
4.2 URL分析
4.3 Domain分析
4.4 Site分析
4.5 頂級域名TLD分析
4.6 本章小結
第5章 網絡文本內容分析
5.1 R語言文本分析框架
5.2 數據準備
5.3 數據分析
5.4 高級主題
第6章 網絡分析
6.1 網絡分析基礎
6.2 R語言中的網絡數據管理
6.3 基本網絡繪圖和布局
6.4 有效的網絡圖形設計
6.5 高級網絡圖形
6.6 網絡成員的重要性評估
6.7 割點和橋
6.8 子組(子群子圖子網)
6.9 隨機網絡模型
6.10 統(tǒng)計網絡模型
結束語
參考文獻