全書共10章,內(nèi)容包括:緒論、語音產(chǎn)生與聽覺感知、語音信號(hào)特征、常用建模算法、語音編碼和質(zhì)量評(píng)估、語音識(shí)別、說話人識(shí)別、語音合成、語音增強(qiáng)、語音分離。
本書共分為9章,闡述了從單聲道到立體聲、多聲道環(huán)繞聲再到三維空間聲的技術(shù)變革歷程,并探討人耳對(duì)聲音定位的感知機(jī)制及影響因素。此外,還討論如何利用先進(jìn)的錄音技術(shù)和算法來捕捉和重現(xiàn)真實(shí)的空間聲場(chǎng),并分析不同的編碼格式和技術(shù),重點(diǎn)介紹空間音頻技術(shù)在虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)等環(huán)境下的運(yùn)用,以提升用戶體驗(yàn)的沉浸感,展示
本書系統(tǒng)地介紹了語音識(shí)別在大模型時(shí)代的新技術(shù)與新應(yīng)用。全書共16章,原理部分涵蓋聲學(xué)特征、隱馬爾可夫模型(HMM)、高斯混合模型(GMM)、深度神經(jīng)網(wǎng)絡(luò)(DNN)、語言模型和加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)、語音大模型,重點(diǎn)描述了GMM-HMM、DNN-HMM和端到端(E2E)三種語音識(shí)別框架;應(yīng)用部分包含Kaldi、W
"近年來人工智能技術(shù)突飛猛進(jìn),以語音識(shí)別為代表的音頻處理技術(shù)取得了大量突破,但該領(lǐng)域內(nèi)理論結(jié)合實(shí)戰(zhàn)的入門書籍卻較為缺乏,本書旨在為有志學(xué)習(xí)音頻信號(hào)處理的讀者提供一本實(shí)用的入門書籍。本書共13章,第1章和第2章是基礎(chǔ)部分,包括聲學(xué)基礎(chǔ)知識(shí)及Python基礎(chǔ)等內(nèi)容;第3到4章介紹了音頻信號(hào)的獲取及分析方法;第5~8章介紹了
本書是一本Hi-Fi音響入門圖書。本書從技術(shù)和藝術(shù)的角度,全面介紹了Hi-Fi音響的相關(guān)知識(shí),旨在為音樂、音響愛好者提供入門指導(dǎo),幫助讀者提高音樂欣賞水平和音響設(shè)備的使用技能。本書包括電聲基礎(chǔ)、音響釋疑、音樂與欣賞3個(gè)部分。在電聲基礎(chǔ)部分,作者介紹了音響發(fā)燒的誤區(qū),如片面追求技術(shù)指標(biāo)、忽視聽音環(huán)境等,強(qiáng)調(diào)了正確認(rèn)識(shí)和欣
本書的撰寫主要分為四個(gè)章節(jié):第一章數(shù)字音頻藝術(shù)的基本藝術(shù)體系;第二章數(shù)字音頻藝術(shù)教育;第三章廣播劇與影視動(dòng)漫聲音研究;第四章數(shù)字音頻的文化產(chǎn)業(yè)分析。主要內(nèi)容:1、理清數(shù)字音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的脈絡(luò),建立數(shù)字音頻創(chuàng)意發(fā)展編年史。2、形成數(shù)字音頻創(chuàng)意教育引導(dǎo)機(jī)制的研究報(bào)告,提出音頻創(chuàng)意產(chǎn)業(yè)發(fā)展的咨詢報(bào)告。3、綜合性分析音頻創(chuàng)意
這本書介紹了錄音的基本原理,包括聲音的傳播、拾音、錄音和混音等基本概念。它幫助讀者理解錄音過程中涉及的聲學(xué)原理和電子技術(shù),為后續(xù)的學(xué)習(xí)打下基礎(chǔ)。書中詳細(xì)介紹了各種錄音設(shè)備的工作原理和使用方法。這包括麥克風(fēng)、調(diào)音臺(tái)、均衡器、效果器等設(shè)備的選擇、安裝和使用技巧。通過學(xué)習(xí)這些內(nèi)容,讀者可以了解如何正確使用這些設(shè)備,并掌握它們
本書提出的語義信息論,依據(jù)同義映射這一語義信息的本質(zhì)特征,構(gòu)建了語義信息的度量體系,引入新的數(shù)學(xué)工具,證明了語義編碼的基本定理,論證了語義通信系統(tǒng)的性能極限,揭示了未來語義通信的巨大性能潛力。
本書共分為11個(gè)章節(jié)。第1章從數(shù)字音頻設(shè)計(jì)的概念入手,介紹了數(shù)字音頻是如何通過模數(shù)轉(zhuǎn)換實(shí)現(xiàn)由模擬聲音信號(hào)到離散數(shù)字信號(hào)的轉(zhuǎn)換過程,并回顧了音頻設(shè)計(jì)的歷史與發(fā)展。第2章著眼于AdobeAudition的基礎(chǔ)入門,介紹了音頻的不同類別,包括語音、音樂、環(huán)境音效等,以及常見的音頻文件格式。第3章介紹了AdobeAuditio
本書系統(tǒng)地闡述語音信號(hào)處理的原理、方法、技術(shù)和應(yīng)用,同時(shí)給出部分內(nèi)容對(duì)應(yīng)的MATLAB程序。全書共14章,第1~7章是基本理論部分,包括緒論、語音信號(hào)的數(shù)字模型、語音信號(hào)短時(shí)時(shí)域分析、語音信號(hào)短時(shí)頻域分析、語音信號(hào)倒譜分析、語音信號(hào)線性預(yù)測(cè)分析和矢量量化;第8~14章是應(yīng)用部分,包括語音編碼原理及應(yīng)用、語音識(shí)別原理及應(yīng)