書單推薦
更多
新書推薦
更多

實體消解指南:使用Python進行數據匹配 [英]邁克爾·希勒

 實體消解指南:使用Python進行數據匹配 [英]邁克爾·希勒

定  價:69 元

        

  • 作者:[英]邁克爾·希勒
  • 出版時間:2025/6/1
  • ISBN:9787111783299
  • 出 版 社:機械工業(yè)出版社
  • 中圖法分類:TP312PY 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
7
8
8
7
3
1
2
1
9
1
9
在數據驅動時代,實體消解技術是打通數據孤島的核心利器。本書以Python為工具,系統(tǒng)講解從數據清洗到云端大規(guī)模部署的全流程技術:·基礎原理:解析實體消解5大步驟(數據標準化、分塊、屬性比較、匹配分類、聚類),直面姓名模糊、數據缺失、跨源匹配等實戰(zhàn)難題;·算法攻堅:詳解編輯距離、Jaro-Winkler相似度等文本匹配技術,結合貝葉斯定理、期望zui大化算法構建概率匹配模型;·工具實戰(zhàn):基于Splink實現企業(yè)級數據消解,通過谷歌云平臺擴展至百萬級數據集;·前沿拓展:引入隱私增強技術(PSI),平衡數據利用與合規(guī)風險。全書配套GitHub代碼庫,以英國公司注冊署、海事署等真實數據演示跨領域(金融風控、供應鏈管理)場景應用,助力讀者構建可復用的數據資產整合方案。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容