定 價:139 元
叢書名:計(jì)算機(jī)技術(shù)開發(fā)與應(yīng)用叢書
- 作者:于紅博
- 出版時間:2024/12/1
- ISBN:9787302696353
- 出 版 社:清華大學(xué)出版社
- 中圖法分類:TP391.413
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
Octave為GNU項(xiàng)目下的開源軟件,旨在解決線性和非線性數(shù)值計(jì)算問題。本書由淺入深,全面講解基于Octave軟件的圖像處理技術(shù),幫助讀者盡快掌握Octave圖像處理的技巧。本書共13章,將圖像處理算法按照不同的技術(shù)路線歸類,不但囊括圖像增強(qiáng)、圖像疊加、圖像濾波等傳統(tǒng)圖像處理算法,還重點(diǎn)講解先進(jìn)的AI圖像處理技術(shù),可用于創(chuàng)作出風(fēng)格各異的圖像,技術(shù)先進(jìn)。本書中的大部分圖像處理算法附帶圖像處理效果圖,可用于比較不同圖像處理算法的效果,使本書閱讀更直觀,圖像處理算法更易懂。本書適合各種基礎(chǔ)的讀者,配套數(shù)百段實(shí)戰(zhàn)程序代碼,沒有接觸過圖像處理的讀者可以通過本書快速入門,接觸過圖像處理的讀者也可以通過本書快速查找所需的圖像處理程序代碼。
本書依據(jù)真實(shí)的工業(yè)研發(fā)經(jīng)驗(yàn)和在科學(xué)計(jì)算領(lǐng)域的積累,將實(shí)際的應(yīng)用場景和理論的圖像處理算法相融合,博采其他編程語言的經(jīng)典概念,配合Octave編程的基礎(chǔ)知識進(jìn)行實(shí)戰(zhàn),力求讀者可以由淺入深地上手圖像處理技術(shù)中的各個環(huán)節(jié)。
前言
圖像處理是指對圖像進(jìn)行分析、加工和處理以滿足特定需求的技術(shù)。它涵蓋了從簡單的圖像增強(qiáng)到復(fù)雜的圖像分析等多個方面。
圖像處理在許多領(lǐng)域有廣泛的應(yīng)用。在攝影工業(yè)中,圖像處理可以應(yīng)用于直方圖均化、圖像去噪和對比度增強(qiáng)等處理和分析。在遙感與衛(wèi)星成像中,圖像處理可以應(yīng)用于地質(zhì)勘探和環(huán)境監(jiān)測等場景。在安全監(jiān)控中,圖像處理可以應(yīng)用于人臉識別、車牌識別和道路識別等場景。在商業(yè)零售中,圖像處理可以應(yīng)用于商品識別、效果圖生成和模特生成等場景。
筆者依據(jù)真實(shí)的工業(yè)研發(fā)經(jīng)驗(yàn)和在科學(xué)計(jì)算領(lǐng)域的積累,將實(shí)際的應(yīng)用場景和理論的圖像處理算法相融合,博采其他編程語言的經(jīng)典概念,配合Octave編程的基礎(chǔ)知識進(jìn)行實(shí)戰(zhàn),力求讀者可以由淺入深地上手圖像處理技術(shù)中的各個環(huán)節(jié)。
第1章和第2章講解Octave基本概念和基本圖像操作。第2章先從圖像讀取入手,然后講解查看圖像信息和圖像格式,以及圖像分割和圖像分塊處理方式,最后講解圖像顯示或保存。
第3章講解與圖像數(shù)據(jù)格式相關(guān)的知識。圖像按數(shù)據(jù)格式大致分為彩色圖像、灰度圖像、二值圖像、索引圖像和多幀圖像,并且可以在不同的數(shù)據(jù)格式之間互相轉(zhuǎn)換,還可以通過文件流進(jìn)行流式傳輸。
第4章講解與顏色相關(guān)的知識。讀者先需要理解顏色空間的理論,再領(lǐng)會圖像通道和顏色圖的概念,這樣便可管理圖像中的顏色,配合實(shí)際的顏色處理算法對圖像的顏色進(jìn)行調(diào)節(jié)。
第5章講解圖像運(yùn)算。圖像運(yùn)算可以分為像素運(yùn)算、算術(shù)運(yùn)算、鄰域運(yùn)算、幾何變換、空間變換和二值圖像打包解包。讀者在學(xué)習(xí)這些算法后,可以將原始圖像經(jīng)運(yùn)算后實(shí)現(xiàn)另外的效果。
第6章講解與圖像分析相關(guān)的知識。本章先講解了經(jīng)典且常用的直方圖理論和圖像歸一化算法,再深入講解圖像的相關(guān)性指標(biāo),從單幅圖像的指標(biāo)擴(kuò)展到兩幅圖像之間的指標(biāo)。本章還涉及邊緣檢測、霍夫變換和凸包檢測的用法,最后介紹圖像統(tǒng)計(jì)和像素對比算法。讀者可以通過圖像分析指標(biāo)進(jìn)行后期處理,調(diào)節(jié)出視覺效果更具美感的圖像。
第7章從圖像平滑算法入手,配合顏色增強(qiáng)等增強(qiáng)算法,可以直接改變圖像的整體風(fēng)格,幫助讀者創(chuàng)作出更有視覺表現(xiàn)力的圖像。
第8章講解與圖像疊加相關(guān)的知識。圖像在疊加其他元素之后,可以突出展示圖像中的某些關(guān)鍵部分。
第9章講解圖像濾波的入門知識,從知名的濾波算子入手,到使用自定義算子濾波,帶領(lǐng)讀者設(shè)計(jì)自己的濾波算法,從復(fù)雜的圖像中濾波得到需要的圖像特征。本章還介紹了好用的圖像去噪算法。讀者可以利用該算法方便地去除圖像中的噪聲或噪點(diǎn),而不需要設(shè)計(jì)自己的濾波算法。
第10章講解圖像模糊算法。圖像模糊算法可以為圖像增添一種朦朧的視覺效果,既可以用于改變圖像的視覺效果,也可以用于抹掉圖像的細(xì)節(jié)。
第11章講解圖像重建算法。圖像重建算法用于提高圖像的質(zhì)量。讀者可以通過圖像重建算法從不完整或有噪聲的測量數(shù)據(jù)中恢復(fù)出完整、清晰的圖像。
第12章講解與圖像形態(tài)學(xué)相關(guān)的知識。通過圖像形態(tài)學(xué)算法處理的圖像通常具有抽象的變化,讀者可以通過圖像形態(tài)學(xué)的相關(guān)算法創(chuàng)作出富有想象力的圖像效果。
第13章講解AI與機(jī)器學(xué)習(xí)圖像處理。國產(chǎn)AI大模型發(fā)展迅速,本章重點(diǎn)提到幾十種國產(chǎn)AI大模型的圖像處理算法,是一場國產(chǎn)AI大模型的盛宴。此外,本章還講解了經(jīng)典的Stable Diffusion模型,包括Stable Diffusion WebUI的圖像界面用法和Stable Diffusion WebUI API用法,這些也是AI工程師的工具。讀者不僅可以在本章中學(xué)習(xí)AI圖像處理和機(jī)器學(xué)習(xí)圖像處理的精要,還可以學(xué)習(xí)AI工程師的基本操作手法。
限于本人的水平和經(jīng)驗(yàn),書中難免存在疏漏之處,懇請與讀者批評指正。
于紅博2025年5月于哈爾濱
于紅博,八度信商公司總經(jīng)理,Octave中文網(wǎng)總工程師,資深Octave研發(fā)人員,研究方向主要涉及科學(xué)計(jì)算、圖像處理、自動化系統(tǒng)設(shè)計(jì)、模式識別、神經(jīng)網(wǎng)絡(luò)等分支的算法設(shè)計(jì)和程序設(shè)計(jì)領(lǐng)域。擅長編寫、審閱及完善開源軟件,對于開源軟件的發(fā)展做出了一定的貢獻(xiàn),曾創(chuàng)立互聯(lián)網(wǎng)企業(yè),深入涉及關(guān)鍵領(lǐng)域市場,致力于突破多項(xiàng)核心技術(shù)的自主研發(fā)。
目錄
本書源碼
第1章緒論
第2章基本圖像操作
2.1圖像讀取
2.2圖像信息
2.3圖像格式
2.4圖像分割
2.5圖像分塊
2.6圖像顯示
2.6.1按原分辨率顯示圖像
2.6.2縮放顯示圖像
2.7圖像保存
第3章圖像數(shù)據(jù)格式
3.1彩色圖像
3.2灰度圖像
3.3二值圖像
3.4索引圖像
3.5多幀圖像
3.6圖像數(shù)據(jù)格式轉(zhuǎn)換
3.6.1雙精度浮點(diǎn)型
3.6.2單精度浮點(diǎn)型
3.6.3半精度浮點(diǎn)型
3.6.4uint8整型
3.6.5uint16整型
3.6.6int16整型
3.7圖像和文件流
第4章顏色
4.1顏色空間
4.1.1常用顏色空間
4.1.2顏色空間轉(zhuǎn)換
4.1.3灰度轉(zhuǎn)換
4.2圖像通道
4.2.1常用圖像通道
4.2.2索引圖像通道
4.2.3抽取圖像通道
4.2.4拆分圖像通道
4.3顏色圖
4.3.1Octave的內(nèi)置顏色圖
4.3.2OpenCV庫的內(nèi)置顏色圖
4.3.3查看顏色圖
4.3.4顏色圖移位
4.4去色
4.5著色
4.6偽彩色
4.6.1灰度分層法
4.6.2灰度變換法
4.6.3智能偽彩色處理
4.7反色
4.7.1全部反色
4.7.2部分反色
4.8透明度
4.8.1修改透明度
4.8.2顏色混合
4.8.3顏色漸變
4.9對比度
4.9.1增加對比度
4.9.2減小對比度
4.10顏色查找表
4.10.1創(chuàng)建顏色查找表
4.10.2應(yīng)用顏色查找表
4.10.3用顏色查找表替換顏色
4.11顏色替換
第5章圖像運(yùn)算
5.1像素運(yùn)算
5.1.1獲取像素
5.1.2根據(jù)像素生成二值圖像
5.1.3量化生成圖像
5.1.4像素排序
5.1.5固定閾值法
5.1.6基于通道閾值更改像素
5.1.7像素?cái)U(kuò)散
5.2算術(shù)運(yùn)算
5.2.1非常差值
5.2.2圖像加法
5.2.3圖像減法
5.2.4圖像乘法
5.2.5圖像除法
5.2.6圖像冪運(yùn)算
5.2.7圖像開方運(yùn)算
5.2.8圖像指數(shù)運(yùn)算
5.2.9圖像對數(shù)運(yùn)算
5.2.10圖像求逆
5.2.11圖像轉(zhuǎn)置
5.2.12圖像按位與運(yùn)算
5.2.13圖像按位或運(yùn)算
5.2.14圖像按位非運(yùn)算
5.2.15圖像按位異或運(yùn)算
5.2.16圖像加權(quán)組合
5.2.17圖像線性變換
5.3鄰域運(yùn)算
5.4幾何變換
5.4.1高斯金字塔
5.4.2鏡像復(fù)制
5.4.3鏡像翻轉(zhuǎn)
5.4.4圖像復(fù)制
5.5空間變換
5.5.1圖像空間變換
5.5.2點(diǎn)的空間變換
5.5.3空間變換對象
5.5.4仿射變換
5.5.5透視變換
5.5.6角點(diǎn)檢測
5.6二值圖像打包解包
5.6.1二值圖像打包
5.6.2二值圖像解包
第6章圖像分析
6.1直方圖
6.1.1繪制直方圖
6.1.2直方圖均化
6.2圖像歸一化
6.3圖像相關(guān)性
6.3.1相關(guān)系數(shù)
6.3.2增強(qiáng)相關(guān)系數(shù)
6.3.3峰值信噪比
6.3.4均方誤差
6.3.5歸一化互相關(guān)性
6.3.6平均非常誤差
6.3.7峰值非常誤差
6.3.8均方根誤差
6.4邊緣檢測
6.4.1Sobel邊緣檢測
6.4.2Prewitt邊緣檢測
6.4.3Kirsch邊緣檢測
6.4.4Roberts邊緣檢測
6.4.5LoG邊緣檢測
6.4.6零交叉邊緣檢測
6.4.7Canny邊緣檢測
6.4.8Lindeberg邊緣檢測
6.4.9Andy邊緣檢測
6.4.10Scharr邊緣檢測
6.5霍夫變換
6.5.1霍夫變換峰值
6.5.2直線檢測
6.5.3線段檢測
6.5.4圓形檢測
6.5.5繪制霍夫變換曲線
6.6凸包檢測
6.6.1凸包輪廓
6.6.2凸包中的凹陷區(qū)域
6.6.3凸包輪廓的交集
6.7圖像統(tǒng)計(jì)
6.7.1均值
6.7.2標(biāo)準(zhǔn)差
6.7.3熵
6.7.4梯度
6.7.5局部最大值點(diǎn)
6.7.6非零點(diǎn)數(shù)量
6.7.7范數(shù)
6.8像素對比
第7章圖像增強(qiáng)
7.1圖像平滑
7.1.1高斯濾波平滑
7.1.2均值濾波平滑
7.1.3圓盤濾波平滑
7.1.4中值濾波平滑
7.1.5雙向?yàn)V波平滑
7.1.6Perona和Malik平滑
7.1.7自定義高斯濾波平滑
7.2顏色增強(qiáng)
7.3亮度增強(qiáng)
7.4銳度增強(qiáng)
7.5對比度增強(qiáng)
7.6灰度增強(qiáng)
7.7細(xì)節(jié)增強(qiáng)
7.8素描風(fēng)格
7.8.1黑白素描風(fēng)格
7.8.2彩色素描風(fēng)格
7.9風(fēng)格化
7.10炭筆風(fēng)格
7.11漩渦風(fēng)格
第8章圖像疊加
8.1疊加顏色
8.2疊加幾何形狀
8.2.1疊加矩形
8.2.2疊加圓形
8.2.3疊加圓弧
8.2.4疊加橢圓
8.2.5疊加橢圓弧
8.2.6疊加橢圓或橢圓弧
8.2.7疊加直線
8.2.8疊加多邊形
8.3疊加其他圖像
8.3.1圖像溶解
8.3.2將圖像繪制于另一幅圖像上
8.3.3最大值圖像和最小值圖像
8.4疊加水印
8.4.1明水印
8.4.2暗水印
8.5蒙版
8.5.1創(chuàng)建蒙版
8.5.2疊加蒙版
8.6疊加噪聲
8.6.1泊松噪聲
8.6.2高斯噪聲
8.6.3椒鹽噪聲
8.6.4斑點(diǎn)噪聲
8.6.5均勻噪聲
8.6.6乘法噪聲
8.6.7脈沖噪聲
8.6.8拉普拉斯噪聲
8.6.9隨機(jī)噪聲
8.7疊加邊框
8.8立體圖像
第9章圖像濾波
9.1濾波算子
9.2卷積濾波
9.3排序?yàn)V波
9.4熵濾波
9.5范圍濾波
9.6標(biāo)準(zhǔn)差濾波
9.7維納濾波
9.8中值濾波
9.9盒子濾波
9.10積分圖像
9.11非極大值抑制
9.12金字塔均值漂移濾波
9.13圖像去噪
9.13.1快速非局部均值去噪
9.13.2去噪
9.13.3去噪點(diǎn)
9.13.4增強(qiáng)模式去噪
第10章圖像模糊
10.1高斯模糊
10.2雙向模糊
10.3運(yùn)動模糊
10.4邊緣模糊
10.5自適應(yīng)閾值模糊
10.6stackBlur模糊
10.7像素化
10.8馬賽克
10.9抖動
10.10排序抖動
第11章圖像重建
11.1圖像插值
11.1.1二維矩陣插值
11.1.2三維矩陣插值
11.1.3任意維度矩陣插值
11.1.4傅里葉插值
11.1.5雙三次插值
11.1.6雙線性插值
11.1.7盒子插值
11.1.8漢明插值
11.1.9Lanczos插值
11.1.10最近鄰插值
11.2圖像超分辨率重建
11.3傅里葉變換重建
11.3.1快速傅里葉變換
11.3.2離散傅里葉變換
11.3.3逆快速傅里葉變換
11.3.4逆離散傅里葉變換
11.3.5將零頻分量移到變換矩陣的中心
11.3.6將零頻分量從變換矩陣的中心移回原位
11.3.7傅里葉卷積
11.4離散余弦變換重建
11.4.1離散余弦變換
11.4.2逆離散余弦變換
11.5Radon變換重建
11.5.1Radon變換
11.5.2逆Radon變換
11.5.3過濾平行光投影
11.6fanbeam變換重建
11.6.1fanbeam變換
11.6.2逆fanbeam變換
11.7維納去卷積
11.8去馬賽克
第12章圖像形態(tài)學(xué)
12.1基本形態(tài)學(xué)運(yùn)算
12.1.1結(jié)構(gòu)元素
12.1.2形態(tài)學(xué)重建
12.1.3形態(tài)學(xué)擴(kuò)展
12.1.4膨脹運(yùn)算與腐蝕運(yùn)算
12.1.5形態(tài)學(xué)梯度
12.1.6開運(yùn)算和閉運(yùn)算
12.1.7頂帽運(yùn)算和底帽運(yùn)算
12.1.8黑帽運(yùn)算
12.2連通性
12.2.1連通性矩陣
12.2.2區(qū)域極大值和極小值
12.2.3H極大值和極小值變換
12.2.4圖像空洞
12.2.5分水嶺算法
12.2.6連通域
12.3擊中或擊不中變換
12.4邊界劃分
第13章AI與機(jī)器學(xué)習(xí)圖像處理
13.1文心大模型
13.1.1AI作畫(高級版)
13.1.2AI作畫(基礎(chǔ)版)
13.1.3AI作畫(極速版)
13.1.4AI作畫(畫面擴(kuò)展)
13.2智譜清言大模型
13.2.1cogview3plus
13.2.2cogview3flash
13.3豆包大模型
13.3.1通用2.1(文生圖)
13.3.2通用2.0Pro(指令編輯)
13.3.3通用2.0Pro(文生圖)
13.3.4通用2.0(角色特征保持)
13.3.5通用2.0(文生圖)
13.3.6通用1.4(角色特征保持)
13.3.7通用1.4(文生圖)
13.3.8動漫1.3.X(文生圖/圖生圖)
13.3.9通用XL pro(圖生圖)
13.3.10通用XL pro(文生圖)
13.3.11單圖寫真
13.3.12AIGC圖像風(fēng)格化
13.3.13人像漫畫風(fēng)
13.3.14閉眼轉(zhuǎn)睜眼
13.3.15表情編輯
13.3.16智能變美
13.3.17人像特效
13.3.18三維游戲特效
13.3.19人像年齡變換
13.3.20人像畸變矯正
13.3.21智能繪圖漫畫版
13.3.22圖像超分辨率
13.3.23AI圖像增強(qiáng)
13.3.24老照片修復(fù)
13.3.25AI圖像裁剪
13.3.26圖像拉伸修復(fù)
13.3.27圖像風(fēng)格轉(zhuǎn)換
13.3.28商品識別
13.3.29通用實(shí)體識別
13.3.30車輛檢測
13.3.31車牌檢測
13.3.32圖像配文
13.3.33圖像評分
13.3.34商品圖像分割
13.3.35天空分割
13.3.36車輛分割
13.4通義大模型
13.4.1文本生成圖像
13.4.2文生圖V2版
13.4.3涂鴉作畫
13.4.4Cosplay動漫人物生成
13.4.5人像風(fēng)格重繪
13.4.6虛擬模特
13.4.7圖像畫面擴(kuò)展
13.4.8人物實(shí)例分割
13.4.9創(chuàng)意海報(bào)生成
13.4.10圖配文
13.5混元大模型
13.5.1混元生圖
13.5.2文生圖輕量版
13.6星火大模型
13.6.1圖像生成
13.6.2圖像生成HiDream
13.7Stable Diffusion
13.7.1Stable Diffusion WebUI
13.7.2WebUI文生圖
13.7.3WebUI圖生圖
13.7.4WebUI高清化
13.7.5WebUI圖像信息
13.7.6WebUI模型合并
13.7.7WebUI模型訓(xùn)練
13.7.8Stable Diffusion WebUI API
13.7.9txt2img
13.7.10img2img
13.7.11extra
13.7.12PNG info