數(shù)字音頻處理是數(shù)字媒體技術(shù)專(zhuān)業(yè)的專(zhuān)業(yè)核心課程,音頻的編輯和處理是數(shù)字媒體中不可缺少的一環(huán),對(duì)于學(xué)習(xí)者后期的游戲制作、媒體編輯等有非常重要的作用。數(shù)字媒體技術(shù)專(zhuān)業(yè)蓬勃發(fā)展,但是相關(guān)的教材卻很少,不適合數(shù)字媒體技術(shù)專(zhuān)業(yè)理論與實(shí)踐結(jié)合的方向和培養(yǎng)原則,因此編寫(xiě)了這一本教材。數(shù)字音頻處理主要講授的內(nèi)容是聲音的特性、音頻處理的過(guò)
這是第一本系統(tǒng)性地介紹聲紋識(shí)別、聲紋分割聚類(lèi)及聲紋在語(yǔ)音識(shí)別、語(yǔ)音合成、人聲分離等領(lǐng)域中應(yīng)用的技術(shù)書(shū)。本書(shū)內(nèi)容全面且緊隨時(shí)代前沿,不僅涵蓋了早至20世紀(jì)60年代的經(jīng)典方法,而且以大量篇幅著重介紹了深度學(xué)習(xí)時(shí)代的最新技術(shù)。本書(shū)注重理論與實(shí)踐的結(jié)合,除了配備大量實(shí)踐案例與習(xí)題,還有專(zhuān)門(mén)章節(jié)介紹聲紋技術(shù)在實(shí)際工程部署方面的諸
聲音可以從兩個(gè)角度來(lái)定義。首先是從物理學(xué)的角度來(lái)定義,聲音是空氣質(zhì)點(diǎn)振動(dòng)狀態(tài)由近及遠(yuǎn)的傳播,聲音即聲波;其二是從心理學(xué)的角度來(lái)定義,聲音是聲波在聽(tīng)覺(jué)上產(chǎn)生的主觀(guān)感覺(jué)。如果是從物理學(xué)的角度來(lái)了解聲音的基本性質(zhì),那么聲音就是聲波,可以用聲壓這一物理量來(lái)描述;如果要對(duì)揚(yáng)聲器重放的聲音進(jìn)行主觀(guān)音質(zhì)評(píng)價(jià),則聲音與人耳的聽(tīng)覺(jué)特性密
本書(shū)分為三篇:基礎(chǔ)理論與實(shí)踐篇、操作應(yīng)用與技能篇和數(shù)字音響技術(shù)篇,書(shū)中主要介紹音響技術(shù)的基本原理、各種音響設(shè)備的基本功能及工作原理與基本操作方法,具體介紹了音響系統(tǒng)的連接調(diào)整方法與使用技巧,重點(diǎn)介紹了調(diào)音臺(tái)與周邊設(shè)備以及功放音箱的使用調(diào)整方法和故障的檢測(cè)判斷方法。同時(shí),本書(shū)對(duì)于數(shù)字聲頻技術(shù)、數(shù)字調(diào)音臺(tái)、數(shù)字音頻信號(hào)的網(wǎng)
我們的日常離不開(kāi)說(shuō)話(huà),一個(gè)人的聲音不僅僅傳遞表達(dá)的情感,聲音也可以創(chuàng)造價(jià)值。本書(shū)分享了作者從會(huì)計(jì)工作轉(zhuǎn)行聲音領(lǐng)域創(chuàng)業(yè)的經(jīng)歷,從知識(shí)付費(fèi)入手拆解聲音付費(fèi)市場(chǎng)的剛需,解讀不同聲音形象的賣(mài)點(diǎn)與練聲技巧,從而可以自己制作聲音付費(fèi)產(chǎn)品,幫助讀者找到適合自己的聲音變現(xiàn)之路。本書(shū)以30個(gè)要點(diǎn)的形式解讀了打造聲音付費(fèi)產(chǎn)品的場(chǎng)景、過(guò)程、
Kaldi是目前語(yǔ)音識(shí)別領(lǐng)域,廣受歡迎并流行的開(kāi)源工具包。Kaldi設(shè)計(jì)之初對(duì)通用性,可拓展性等一系列源代碼層次的考量,大大降低了Kaldi作為語(yǔ)音識(shí)別工具包的門(mén)檻,同時(shí)擁有非常完整的語(yǔ)音識(shí)別系統(tǒng)訓(xùn)練腳本。本書(shū)通過(guò)對(duì)Kaldi已有訓(xùn)練腳本的梳理和引導(dǎo),幫助讀者快速搭建可用的語(yǔ)音識(shí)別系統(tǒng)。
本書(shū)以國(guó)際大型體育賽事為背景,系統(tǒng)介紹了賽事轉(zhuǎn)播組織架構(gòu)和具體技術(shù)實(shí)施方案。在第一章和第二章中主要介紹了國(guó)際信號(hào)的定義、團(tuán)隊(duì)工作流程和信號(hào)采集方法;第三章和第四章介紹了國(guó)際信號(hào)中重要的評(píng)論聲制作方式和轉(zhuǎn)播團(tuán)隊(duì)使用的內(nèi)部通訊系統(tǒng);第五章、第六章和第七章詳細(xì)介紹了各種體育比賽轉(zhuǎn)播的音頻制作方法。本書(shū)具有理論指導(dǎo)實(shí)踐的特點(diǎn),
聽(tīng)覺(jué)信息處理技術(shù)的創(chuàng)新能夠推動(dòng)實(shí)現(xiàn)高度智能化機(jī)器感知系統(tǒng)的發(fā)展,本分冊(cè)主要介紹了國(guó)內(nèi)外聽(tīng)覺(jué)信息處理方面的研究現(xiàn)狀和階段性成果,通過(guò)對(duì)人類(lèi)言語(yǔ)產(chǎn)生與聽(tīng)覺(jué)機(jī)理,聽(tīng)覺(jué)機(jī)理的計(jì)算理論與方法,語(yǔ)音信號(hào)處理,語(yǔ)音識(shí)別聲學(xué)建模,特殊場(chǎng)景語(yǔ)音識(shí)別,聲紋與語(yǔ)種識(shí)別,韻律、情緒及音樂(lè)分析,統(tǒng)計(jì)語(yǔ)音合成,口語(yǔ)對(duì)話(huà)系統(tǒng)等技術(shù)研究成果的闡述與分
《語(yǔ)音信號(hào)識(shí)別技術(shù)與實(shí)踐》內(nèi)容分為8章。第1章為語(yǔ)音識(shí)別技術(shù)概述,介紹了語(yǔ)音識(shí)別技術(shù)的原理和發(fā)展與應(yīng)用。第2章為語(yǔ)音信號(hào)處理基本技術(shù),包括數(shù)字化預(yù)處理、短時(shí)時(shí)域處理和頻域處理的內(nèi)容。第3章是語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)和分割,介紹了端點(diǎn)檢測(cè)的原理和常規(guī)檢測(cè)方法,提出了基于復(fù)雜背景條件下的端點(diǎn)檢測(cè)算法,包括算法流程和實(shí)驗(yàn)方法。第4
語(yǔ)音情感識(shí)別(SpeechEmotionRecognition,SER)是情感計(jì)算、模式識(shí)別、信號(hào)處理和人機(jī)交互領(lǐng)域的熱門(mén)研究話(huà)題,SER的研究涉及特征提取、特征優(yōu)選、分類(lèi)器改進(jìn)、特征融合等多種技術(shù)。語(yǔ)音情感識(shí)別是在同一數(shù)據(jù)庫(kù)中進(jìn)行的識(shí)別研究,主要應(yīng)用于自然的人機(jī)交互領(lǐng)域,目前大部分的人機(jī)交互方式都依賴(lài)于觸覺(jué),如觸屏、