本書針對以往人口預測中僅考慮數量化影響因素的不足,以北京市為例,進一步全面考慮對人口增長有重要影響的定性類知識性影響因素,研究建立包含數據庫、文本庫、推理規(guī)則庫和經驗知識庫的復合知識庫。綜合調動復合知識庫中的所有知識,用知識性因素動態(tài)調整數量化因素在預測中產生的誤差,挖掘出與預測目標高度相似的新的歷史數據作為輸入數據,從而形成一種基于復合知識挖掘的新的建模預處理技術;研究神經網絡優(yōu)化技術和決策樹嵌入神經網絡技術,建立能同時處理定量和定性影響因素的基于復合知識挖掘的智能優(yōu)化神經網絡預測模型。在預測技術中,難題就是如何對定性類知識性因素進行處理。而這類因素在促進北京市人口膨脹中起到重要作用。將這類因素挖掘出來帶入預測模型,提高預測精度,在理論和實踐上具有重要意義。
沈巍,女,1965年生,籍貫遼寧朝陽。博士,華北電力大學經濟與管理學院副教授,研究方向為預測理論與方法、人口預測、股指預測和智能預測。
宋玉坤,男,1989年生,籍貫遼寧丹東。華北電力大學經濟與管理學院碩士研究生,研究方向為智能預測、神經網絡和數據挖掘。
第1章 緒論 1
1.1研究背景及意義 1
1.1.1 研究背景 1
1.1.2 研究意義 2
1.2國內外研究現狀 3
1.3研究內容 5
1.4研究方法 6
1.5創(chuàng)新點 7
第2章 北京市人口增長的特點及影響因素分析 9
2.1 北京市常住人口現狀分析 9
2.1.1常住人口的增長趨勢 9
2.1.2常住人口的地區(qū)分布狀況 10
2.1.3常住人口的年齡構成狀況 12
2.1.4常住人口的文化素質特征 13
2.2 北京市人口增長的特點 13
2.3 影響北京市人口增長的因素分析 15
2.3.1影響常住人口自然增長的因素分析 15
2.3.2影響常住人口機械增長的因素分析 16
2.3.3因素分類 21
2.4 本章小結 22
第3章 人口預測模型概述 23
3.1 傳統(tǒng)的基于統(tǒng)計學原理的人口預測模型 23
3.1.1 指數模型 23
3.1.2 Logistic人口增長模型 23
3.1.3 馬爾科夫鏈模型 24
3.1.4 凱菲茨矩陣模型 24
3.1.5 萊斯利矩陣 25
3.1.6 自回歸滑動平均模型 25
3.1.7 人口發(fā)展方程 25
3.1.8 比較分析 26
3.2創(chuàng)新型智能化人口預測模型 27
3.2.1 人工神經網絡模型 27
3.2.2 灰色模型 29
3.3 兩類模型的比較 30
3.3.1 理論比較 30
3.3.2 實證比較 32
3.4 人口預測模型的功能與特點 42
3.4.1 具有并行處理大量非線性數據的功能 42
3.4.2 具有自主學習、自我調整的功能 42
3.4.3 具有多指標同時輸入的功能 43
3.4.4 具有處理非量化文本因素的功能 43
3.4.5 具有針對性 43
3.5 我國人口預測模型現狀 43
3.5.1 應用統(tǒng)計類預測模型對我國人口進行預測 43
3.5.2 應用創(chuàng)新型智能化預測模型進行人口預測 44
3.6 我國人口預測模型中存在的問題及其相應對策 45
3.6.1 我國人口預測模型中存在的問題 45
3.6.2 解決問題的相應對策 46
3.7 本章小結 47
第4章 基于生物進化算法優(yōu)化的神經網絡人口預測模型分析與實證 49
4.1 遺傳算法 49
4.1.1 遺傳算法概述 49
4.1.2 遺傳算法的基本步驟 49
4.1.3 遺傳算法的特點 50
4.1.4 建立遺傳算法優(yōu)化的神經網絡人口預測模型 50
4.2 粒子群算法 51
4.2.1 粒子群算法概述 51
4.2.2 粒子群算法的基本步驟 52
4.2.3 粒子群算法的特點 53
4.2.4 建立粒子群算法優(yōu)化的神經網絡人口預測模型 53
4.3 微分進化算法 53
4.3.1 微分進化算法概述 53
4.3.2 微分進化算法的基本步驟 54
4.3.3 微分進化算法的特點 54
4.3.4 建立微分進化算法優(yōu)化的神經網絡人口預測模型 54
4.4 三種算法的比較分析 55
4.5 基于優(yōu)化算法的RBF神經網絡人口預測實證分析 56
4.5.1 單一指標預測 56
4.5.2 多指標預測 57
4.6 本章小結 59
第5章 影響北京市人口增長的數量化因素挖掘 60
5.1 數據挖掘 60
5.1.1 數據挖掘的概念 60
5.1.2 數據挖掘的步驟 60
5.1.3 數據挖掘方法 61
5.2 基于相關分析的數據挖掘 63
5.3 基于格蘭杰因果檢驗的數據挖掘 64
5.4基于DE-RBF神經網絡模型的數據挖掘 66
5.5 結果分析 69
5.6 本章小結 70
第6章 影響北京市人口增長的文本因素挖掘 71
6.1 文本挖掘 71
6.1.1 文本挖掘的概念 71
6.1.2 文本挖掘的步驟 71
6.1.3 文本挖掘方法 72
6.2構建影響北京市人口增長的文本對象集 76
6.3文本預處理 76
6.3.1文本結構化 76
6.3.2文本因素編碼 80
6.4 基于PF-Tree關聯規(guī)則算法的影響北京市人口數量的文本挖掘 81
6.4.1建立事務數據庫 81
6.4.2構建FP-Tree 84
6.4.3數據分析與比較 85
6.5 文本因素評估 86
6.5.1文本預處理 86
6.5.2基于文本挖掘的北京市人口預測 87
6.6 本章小結 91
第7章 基于REPTree+DE-RBF模型的北京市人口預測分析 93
7.1 建立基于知識挖掘的REPTree+DE-RBF人口預測模型 93
7.2 實證分析 95
7.3基于REPTree-DERBF的北京市中長期人口預測 97
7.3.1 情景分析法 97
7.3.2基于DE-RBF神經網絡的北京市中長期人口預測 98
7.3.3 基于REPTree-DERBF模型的北京市人口動態(tài)預測分析 102
7.4 結果分析 107
7.5 本章小結 108
要想合理、有效地控制北京市人口增長速度,首先要對促進北京市人口增長的各種因素進行全面和深入的挖掘,只有挖掘到那些對北京市人口膨脹有重要影響的因素,才能做到有的放矢,針對影響因素進行調控,最終實現北京市“十二五”規(guī)劃綱要中的“遏制人口快速增長”的目的。影響北京市人口增長的因素很多,很復雜,其中,有許多是定性的知識性文本類因素,比如城市化進程、經濟增長速度、北京人口政策、環(huán)境因素,等等。恰恰是這類知識性文本類因素,對北京市人口增長起到重要影響作用,如果在預測中忽略這些因素,無論你用何種預測模型,都得不到好的預測結果。而預測理論發(fā)展到今天,面臨的最大難題就是如何處理這類知識性文本因素。為了解決上述問題,本書研究運用智能化知識挖掘技術,通過對影響北京市人口增長的知識性文本類因素進行知識發(fā)現、知識分類、知識清洗、知識提取、知識預處理等工作,挖掘出對北京市人口膨脹有重要影響的知識性因素,希望能為北京市人口的有效調控提供重要參考。
……