![]() ![]() |
大數(shù)據(jù)安全與隱私保護(hù) 石瑞生 蘭麗娜 ![]()
大數(shù)據(jù)服務(wù)已經(jīng)深入人們工作與生活的各個角落,大數(shù)據(jù)安全成為各行各業(yè)日益關(guān)心的一個問題。本書從大數(shù)據(jù)服務(wù)的系統(tǒng)架構(gòu)、算法、協(xié)議、應(yīng)用等多個角度,深入淺出地為讀者介紹大數(shù)據(jù)安全與隱私保護(hù)。本書內(nèi)容包括:大數(shù)據(jù)安全的概念、密碼學(xué)基礎(chǔ)知識、數(shù)據(jù)傳輸安全、身份管理與數(shù)據(jù)訪問控制、大數(shù)據(jù)處理與存儲及其安全隱私、保護(hù)隱私的可信計算、大數(shù)據(jù)共享及其安全隱私、大數(shù)據(jù)算法及其安全、大數(shù)據(jù)采集及其安全隱私、企業(yè)數(shù)據(jù)安全、數(shù)據(jù)流轉(zhuǎn)安全。本書適合高等院校網(wǎng)絡(luò)空間安全、信息安全專業(yè)用作專業(yè)課教材,也適合其他專業(yè)用作選修課教材,亦適合對大數(shù)據(jù)安全感興趣的讀者閱讀。
2024年北京高校優(yōu)質(zhì)本科課程、2024年北京郵電大學(xué)課程思政示范課程、北京郵電大學(xué)校級“十四五”規(guī)劃教材、北京高校優(yōu)質(zhì)本科教材課件獎。內(nèi)容包括安全多方計算、同態(tài)加密、零知識證明,Noise協(xié)議框架、ACME協(xié)議、FIDO協(xié)議、PAKE協(xié)議、本地后差分隱私等新技術(shù)。根據(jù)不同的學(xué)生情況與培養(yǎng)方案的學(xué)時要求,可以采取不同的授課方案。配套提供電子課件、習(xí)題答案、教學(xué)大綱、試卷、拓展閱讀材料。
數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)已成為核心的生產(chǎn)要素,驅(qū)動著各行業(yè)的創(chuàng)新與發(fā)展。數(shù)據(jù)作為新型生產(chǎn)力的關(guān)鍵資源,其獲取、處理、存儲和應(yīng)用對企業(yè)的競爭力、國家的經(jīng)濟(jì)發(fā)展,以及全球的科技進(jìn)步都具有重要影響。然而,隨著數(shù)據(jù)的廣泛使用,數(shù)據(jù)安全與隱私保護(hù)問題日益凸顯,成為各國政府、企業(yè)和個人必須應(yīng)對的重大挑戰(zhàn)。自2018年歐盟《通用數(shù)據(jù)保護(hù)條例》(GDPR)實施以來,數(shù)據(jù)安全與隱私保護(hù)技術(shù)在全球范圍內(nèi)引起了廣泛的關(guān)注和重視!吨腥A人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護(hù)法》頒布實施之后,國內(nèi)越來越多的學(xué)校開設(shè)大數(shù)據(jù)安全與隱私保護(hù)類課程。我們從2017年開始編寫、2019年出版的教材《大數(shù)據(jù)安全與隱私保護(hù)》是國內(nèi)首批大數(shù)據(jù)安全與隱私保護(hù)方向的教材。該教材出版后,受到廣大師生的歡迎,教材適用范圍廣,滿足了不同層次高校、不同專業(yè)的課程建設(shè)與教學(xué)需求,尤其是滿足了多個國家特設(shè)專業(yè)和國家控制布點專業(yè)的課程建設(shè)需求。近些年,數(shù)據(jù)安全與隱私保護(hù)領(lǐng)域發(fā)展日新月異,諸多曾被長期忽視的理論與技術(shù)重新受到廣泛關(guān)注,如安全多方計算、同態(tài)加密、零知識證明等;同時,Noise協(xié)議框架、ACME協(xié)議、FIDO協(xié)議、PAKE協(xié)議、本地后差分隱私等新技術(shù)也開始得到廣泛應(yīng)用。這些內(nèi)容是目前大多數(shù)教材尚未涵蓋的,也是我們在過去的教學(xué)實踐中逐步探索完善的教學(xué)內(nèi)容,此次修訂已將其全面納入本教材。本教材在2019年版《大數(shù)據(jù)安全與隱私保護(hù)》基礎(chǔ)上,深度融合6年來的教學(xué)實踐經(jīng)驗,對大數(shù)據(jù)安全與隱私保護(hù)知識體系進(jìn)行了系統(tǒng)性補(bǔ)充與更新。更新后的版本不僅教學(xué)內(nèi)容體系化程度更高、知識覆蓋更為全面,還能滿足更廣泛、更多樣化的教學(xué)需求。此外,為進(jìn)一步提升教學(xué)便利性,我們新增了習(xí)題、課后閱讀材料、教學(xué)課件、實驗課素材等配套資源,力求為授課教師提供更完善的教學(xué)支持。教材使用建議授課建議:根據(jù)不同的學(xué)生情況與培養(yǎng)方案的學(xué)時要求,可以采取不同的授課方案。方案一:32學(xué)時。對于星號(*)章節(jié),可以略去。方案二:48~64學(xué)時。對于學(xué)生基礎(chǔ)好或者學(xué)時充足的情況,可以采用本書完整的內(nèi)容。致謝感謝韓冰、張詩含、曾佳淇等同學(xué)在本書編寫過程中的辛苦付出,也再次感謝在過往教材中做出貢獻(xiàn)的馮慶玲、敖迪、姜寧等同學(xué)。本書的編寫工作得到了北京市自然科學(xué)基金項目(M21037)、北京郵電大學(xué)校級“十四五”規(guī)劃教材項目、北京高校優(yōu)質(zhì)本科教材課件(2023年重點項目)的資助和支持,在此表示感謝。我們教學(xué)團(tuán)隊在北京郵電大學(xué)開設(shè)的相關(guān)課程也被評為2024年北京高校優(yōu)質(zhì)本科課程、2024年北京郵電大學(xué)課程思政示范課程,課程的實驗案例被評為2023年北京郵電大學(xué)優(yōu)秀實驗案例,感謝北京郵電大學(xué)對我們教材編寫工作的支持,感謝北京市對我們工作成果的認(rèn)可。本書可作為高等院校網(wǎng)絡(luò)空間安全專業(yè)本科生的專業(yè)課教材,也可作為其他專業(yè)學(xué)生的選修課教材,亦可作為對大數(shù)據(jù)安全感興趣的讀者的參考書。由于編者水平有限,加之時間倉促,書中不妥之處在所難免,懇請讀者批評指正。編者建立了讀者交流群(QQ群號:330714329),方便與讀者溝通,并為讀者提供后續(xù)的服務(wù)與支持。本書和所有其他工作一樣,最重要也是最根本的使命就是服務(wù)于大眾。如果本書能夠?qū)V大師生的教與學(xué)提供一些切實的幫助,編者就十分欣慰,也就不負(fù)這一年多來無數(shù)個周末和夜晚的辛苦。希望本書能夠為“大數(shù)據(jù)安全”的課程建設(shè)盡一份綿薄之力。
石瑞生,工學(xué)博士(北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國家重點實驗室),北京郵電大學(xué)網(wǎng)絡(luò)空間安全學(xué)院副教授,美國賓州州立大學(xué)訪問學(xué)者(2018年),CCF高級會員。主持參與科研項目20余項,在IEEE S&P、NDSS、WWW、DAC、Big Data、SCC、FGCS、Cybersecurity、密碼學(xué)報、信息安全學(xué)報等主流學(xué)術(shù)會議與期刊發(fā)表學(xué)術(shù)論文40余篇,申請國家發(fā)明專利30余項(其中16項已經(jīng)授權(quán))。主編大數(shù)據(jù)安全方向的國內(nèi)第一本本科教材《大數(shù)據(jù)安全與隱私保護(hù)》(2019年5月出版),該教材獲得2023年“北京高校優(yōu)質(zhì)本科教材課件(重點)”獎,主講課程獲得2024年“北京高校優(yōu)質(zhì)本科課程”獎。
前言第1章 大數(shù)據(jù)安全的概念 11.1 大數(shù)據(jù)的概念和內(nèi)涵 11.2 大數(shù)據(jù)應(yīng)用 21.2.1 從一個小故事講起 21.2.2 谷歌流感趨勢 21.2.3 華爾街利用微博數(shù)據(jù)預(yù)測股票 31.2.4 利用大數(shù)據(jù)預(yù)測美國大選 41.3 理解大數(shù)據(jù)安全 51.4 大數(shù)據(jù)隱私與安全 61.4.1 隱私的定義 61.4.2 安全、隱私與技術(shù)進(jìn)步的關(guān)系 71.5 相關(guān)法律法規(guī) 81.5.1 隱私與法律 81.5.2 美國隱私權(quán)大事件 91.5.3 歐盟隱私權(quán)大事件 111.5.4 數(shù)字貿(mào)易協(xié)議 131.5.5 中國關(guān)于數(shù)據(jù)安全的法律法規(guī)建設(shè) 151.6 數(shù)字社會與國家安全 171.7 本章小結(jié) 181.8 習(xí)題 191.9 拓展閱讀 19第2章 密碼學(xué)基礎(chǔ)知識 202.1 引言 202.2 密碼算法 202.2.1 密碼學(xué)的歷史 202.2.2 基于密鑰的加密算法 202.2.3 香農(nóng)的密碼設(shè)計思想 212.2.4 流密碼 222.2.5 分組密碼算法 242.2.6 公鑰密碼體制 252.2.7 哈希函數(shù) 272.2.8 密碼算法的應(yīng)用 292.2.9 消息的完整性認(rèn)證加密 312.2.10 分組密碼的工作模式 312.2.11 密碼算法小結(jié) 34*2.3 攻擊模型與安全性分析 342.3.1 攻擊模型 342.3.2 安全目標(biāo) 362.3.3 安全概念 372.3.4 語義安全的公鑰密碼方案 372.3.5 語義安全的對稱加密方案 402.3.6 案例分析:QQ瀏覽器 442.4 后量子密碼 442.4.1 后量子密碼簡介 442.4.2 常見的后量子密碼體制 452.4.3 后量子密碼標(biāo)準(zhǔn)化 462.5 本章小結(jié) 472.6 習(xí)題 472.7 上機(jī)實驗 472.8 拓展閱讀 47第3章 數(shù)據(jù)傳輸安全 483.1 引言 483.2 TLS協(xié)議 483.2.1 協(xié)議架構(gòu) 493.2.2 報文結(jié)構(gòu) 503.2.3 協(xié)議流程 503.2.4 握手協(xié)議的設(shè)計 533.2.5 安全信道的建立 573.2.6 TLS 1.3簡介 593.2.7 HSTS 613.3 DTLS 633.4 數(shù)字證書安全 633.4.1 數(shù)字證書的工作原理與分類 633.4.2 免費證書(LE證書) 663.4.3 自動化證書管理環(huán)境協(xié)議 663.4.4 LE證書的自動化配置工具 673.4.5 偽造證書攻擊 683.4.6 安全機(jī)制一:證書透明化 683.4.7 安全機(jī)制二:公鑰釘扎 693.4.8 實際網(wǎng)絡(luò)的復(fù)雜性:內(nèi)容分發(fā)網(wǎng)絡(luò)與中間盒子 70*3.5 信息安全傳輸協(xié)議的設(shè)計方法(Noise協(xié)議框架) 753.6 常用的信息傳輸安全協(xié)議簡介 763.6.1 SSH協(xié)議 773.6.2 IPsec協(xié)議 773.6.3 QUIC協(xié)議 783.7 新場景與新技術(shù):端到端加密與群組加密 793.8 本章小結(jié) 813.9 習(xí)題 813.10 拓展閱讀 82第4章 身份管理與數(shù)據(jù)訪問控制 844.1 引言 844.2 身份認(rèn)證的四個基本原語及其挑戰(zhàn) 844.2.1 基于口令的身份認(rèn)證 854.2.2 基于令牌的身份認(rèn)證 874.2.3 基于生物特征的身份認(rèn)證 894.2.4 基于公鑰密碼學(xué)的身份認(rèn)證 894.2.5 挑戰(zhàn)一:口令的存儲管理問題 904.2.6 挑戰(zhàn)二:令牌安全問題 924.2.7 挑戰(zhàn)三:生物特征失竊與仿冒問題 924.2.8 挑戰(zhàn)四:私鑰安全管理與使用方便之間的矛盾 934.3 身份認(rèn)證的典型技術(shù)方案 944.3.1 基于硬件安全的數(shù)字證書 944.3.2 多因子認(rèn)證 954.3.3 FIDO協(xié)議 964.3.4 新思想:持續(xù)認(rèn)證與動態(tài)訪問控制 1034.4 單點登錄與開放訪問控制 1054.4.1 Needham-Schroeder協(xié)議 1054.4.2 Kerberos協(xié)議 1074.4.3 OAuth協(xié)議 1084.4.4 OpenID Connect協(xié)議 1134.4.5 移動端單點登錄系統(tǒng)面臨的問題 1154.5 Cookie 1154.5.1 Cookie的工作原理和安全屬性 1164.5.2 Cookie與身份認(rèn)證 1174.5.3 Cookie劫持攻擊 117*4.6 aPAKE協(xié)議 1194.6.1 SRP協(xié)議 1194.6.2 OPAQUE協(xié)議 1214.7 本章小結(jié) 1234.8 習(xí)題 1244.9 拓展閱讀 125第5章 大數(shù)據(jù)處理與存儲及其安全隱私 1275.1 引言 1275.2 大數(shù)據(jù)的計算與存儲 1275.2.1 云計算的定義與特征 1275.2.2 云計算的三種主要服務(wù)模式 1275.2.3 虛擬化技術(shù):虛擬機(jī)與容器 1285.2.4 虛擬化技術(shù)的安全問題 1345.2.5 谷歌的云計算技術(shù) 1415.2.6 NoSQL:CAP定理、BASE模型和Dynamo 1465.2.7 開源大數(shù)據(jù)處理系統(tǒng)及其安全隱私機(jī)制 1515.2.8 私有信息檢索 1535.3 大數(shù)據(jù)存儲的安全隱私 1545.3.1 云存儲的應(yīng)用及其安全問題 1545.3.2 云存儲中的數(shù)據(jù)完整性機(jī)制:POR技術(shù)原理 1565.3.3 隱私保護(hù)機(jī)制:加密數(shù)據(jù)去重技術(shù) 1575.3.4 擁有權(quán)證明 158*5.4 去中心化存儲的安全隱私問題 1595.4.1 IPFS 1595.4.2 區(qū)塊鏈 1605.5 本章小結(jié) 1605.6 習(xí)題 1615.7 拓展閱讀 162第6章 保護(hù)隱私的可信計算 1636.1 引言 1636.2 同態(tài)加密 1636.2.1 同態(tài)加密簡介 1636.2.2 Paillier加法同態(tài)加密算法 164*6.2.3 全同態(tài)加密 1676.2.4 實用性解決方案:CryptDB 1706.3 安全多方計算 1726.3.1 什么是安全多方計算 1726.3.2 起源(百萬富翁問題) 1736.3.3 安全多方計算模型 1746.3.4 基礎(chǔ)安全多方計算協(xié)議:混淆電路 1756.3.5 基礎(chǔ)安全多方計算協(xié)議:不經(jīng)意傳輸協(xié)議 1776.3.6 基礎(chǔ)安全多方計算協(xié)議:秘密共享 179*6.3.7 典型通用協(xié)議:BMR協(xié)議 181*6.3.8 典型通用協(xié)議:GMW協(xié)議 183*6.3.9 典型通用協(xié)議:BGW協(xié)議 184*6.3.10 專用協(xié)議:隱私保護(hù)集合求交 1866.3.11 應(yīng)用與挑戰(zhàn) 188*6.4 可信執(zhí)行環(huán)境(機(jī)密計算) 1906.4.1 可信執(zhí)行環(huán)境簡介 1906.4.2 華為鯤鵬CPU和TEE技術(shù) 1976.4.3 SGX 2106.4.4 可信執(zhí)行環(huán)境小結(jié) 217*6.5 零知識證明 2196.5.1 零知識證明簡介 2196.5.2 zk-SNARK 2206.5.3 Zcash:zk-SNARK的區(qū)塊鏈應(yīng)用 2216.5.4 zk-SNARK的實現(xiàn):libsnark 2246.6 本章小結(jié) 2246.7 習(xí)題 2256.8 上機(jī)實驗 2256.9 拓展閱讀 226第7章 大數(shù)據(jù)共享及其安全隱私 2277.1 引言 2277.2 隱私 2277.2.1 隱私的定義 2277.2.2 隱私的分類 2287.2.3 隱私的度量與量化表示 2287.2.4 完美隱私 2287.2.5 威脅分析 2287.3 案例分析:用戶隱私泄露事件 2297.3.1 美國在線數(shù)據(jù)發(fā)布 2297.3.2 “網(wǎng)飛獎”數(shù)據(jù)研究 2307.3.3 社交網(wǎng)絡(luò)上隱私泄露事件 2317.4 數(shù)據(jù)匿名化技術(shù) 2317.4.1 無處不在的匿名化 2317.4.2 匿名技術(shù):發(fā)布-遺忘模型 2327.5 匿名化技術(shù)與反匿名化技術(shù)的博弈 2357.5.1 k重匿名隱私保護(hù)模型 2357.5.2 l-多樣性隱私保護(hù)模型 2387.5.3 t-相近性隱私保護(hù)模型 2397.6 差分隱私技術(shù) 2397.6.1 差分隱私模型簡介 2397.6.2 工作原理 2407.6.3 拉普拉斯機(jī)制 2417.6.4 高斯機(jī)制 2437.6.5 指數(shù)機(jī)制 2457.6.6 應(yīng)用與挑戰(zhàn) 246*7.7 本地化差分隱私 2477.7.1 中心化差分隱私與本地化差分隱私 2477.7.2 隨機(jī)響應(yīng)機(jī)制 2487.7.3 一元編碼機(jī)制 2517.7.4 本地化差分隱私小結(jié) 253*7.8 差分隱私應(yīng)用 2537.8.1 差分隱私數(shù)據(jù)采集 2547.8.2 差分隱私機(jī)器學(xué)習(xí) 2557.9 本章小結(jié) 2577.10 習(xí)題 2577.11 拓展閱讀 258第8章 大數(shù)據(jù)算法及其安全 2598.1 引言 2598.2 大數(shù)據(jù)算法基礎(chǔ) 2598.2.1 數(shù)學(xué)模型 2598.2.2 搜索引擎算法的基本原理 2608.2.3 電子商務(wù)中協(xié)同過濾推薦算法 2628.2.4 大數(shù)據(jù)時代的新需求 2638.2.5 機(jī)器學(xué)習(xí)算法 2648.2.6 眾包 2678.3 對大數(shù)據(jù)算法的攻擊 2688.3.1 案例分析:通過偽造共同訪問對推薦系統(tǒng)進(jìn)行攻擊 2688.3.2 案例分析:搜索引擎優(yōu)化 2718.3.3 對抗樣本攻擊 2728.3.4 數(shù)據(jù)投毒攻擊 2748.3.5 后門攻擊 2778.3.6 機(jī)器學(xué)習(xí)隱私攻擊 283*8.4 聯(lián)邦學(xué)習(xí) 2878.4.1 聯(lián)邦學(xué)習(xí)概述 2878.4.2 聯(lián)邦學(xué)習(xí)的定義 2878.4.3 聯(lián)邦學(xué)習(xí)的分類 2898.4.4 聯(lián)邦學(xué)習(xí)的激勵機(jī)制 2908.4.5 聯(lián)邦學(xué)習(xí)的應(yīng)用前景 291*8.5 保護(hù)隱私的機(jī)器學(xué)習(xí) 2928.5.1 機(jī)器學(xué)習(xí)中的安全與隱私問題 2938.5.2 機(jī)器學(xué)習(xí)中常見的隱私保護(hù)方法 2948.5.3 保護(hù)隱私的機(jī)器學(xué)習(xí)小結(jié) 3008.6 本章小結(jié) 3008.7 習(xí)題 3018.8 閱讀材料 3028.8.1 ARMv8架構(gòu)的體系結(jié)構(gòu) 3028.8.2 ARMv8架構(gòu)的優(yōu)勢 3038.8.3 國產(chǎn)華為昇騰人工智能處理器的介紹 3048.9 拓展閱讀 305第9章 大數(shù)據(jù)采集及其安全隱私 3069.1 引言 3069.2 大數(shù)據(jù)采集與管理 3069.2.1 傳統(tǒng)的數(shù)據(jù)采集技術(shù) 3079.2.2 大數(shù)據(jù)給數(shù)據(jù)采集帶來新的挑戰(zhàn) 3079.2.3 大數(shù)據(jù)采集技術(shù) 3089.2.4 數(shù)據(jù)采集平臺軟件 3089.2.5 數(shù)據(jù)的非法采集現(xiàn)象 3089.3 匿名通信 3109.3.1 基本概念 3109.3.2 匿名通信的基本框架 3109.3.3 技術(shù)方案 3119.4 瀏覽器的DNT標(biāo)準(zhǔn) 3129.4.1 DNT的歷史 3129.4.2 DNT的困境 3139.4.3 技術(shù)方案 314*9.5 在線追蹤技術(shù) 3149.5.1 在線廣告生態(tài)系統(tǒng) 3149.5.2 基于HTTP Cookie的在線追蹤技術(shù) 3169.5.3 Cookie 同步 3189.5.4 Evercookie 3209.5.5 瀏覽器指紋 3219.5.6 跨設(shè)備跟蹤 3229.6 反跟蹤技術(shù) 3239.7 本章小結(jié) 3259.8 習(xí)題 3269.9 拓展閱讀 326第10章 企業(yè)數(shù)據(jù)安全 32710.1 引言 32710.2 數(shù)據(jù)分類分級 32710.2.1 定義 32710.2.2 意義 32910.2.3 方法 330*10.3 數(shù)據(jù)防泄露 33210.3.1 定義 33210.3.2 為什么需要數(shù)據(jù)防泄露 33210.3.3 檢測技術(shù) 33210.3.4 控制與加密技術(shù) 33410.3.5 三種主流形態(tài) 33610.4 本章小結(jié) 33710.5 習(xí)題 337第11章 數(shù)據(jù)流轉(zhuǎn)安全 33811.1 引言 33811.2 數(shù)字水印技術(shù) 33811.2.1 概述 33811.2.2 技術(shù)原理 34011.2.3 應(yīng)用 34011.2.4 攻擊手段 34111.3 區(qū)塊鏈存證技術(shù) 34111.3.1 概述 34111.3.2 技術(shù)原理 34211.3.3 應(yīng)用 342*11.4 數(shù)據(jù)訪問控制(屬性基加密) 34311.4.1 概述 34311.4.2 技術(shù)原理 34311.4.3 應(yīng)用 34311.5 本章小結(jié) 344參考文獻(xiàn) 345
我要評論
|