一区二区视频免费看,在线日本色,亚洲无线码1区

本站小編為你精心準備了前向神經網絡下的音樂情感識別參考范文，愿這些范文能點燃您思維的火花，激發您的寫作靈感。歡迎深入閱讀并收藏。

前向神經網絡下的音樂情感識別

摘要:情感是音樂的固有屬性。本文通過對基于音樂多特征的比較，最終選擇旋律走勢作為情感特征，介紹了前向神經網絡運用于音樂情感識別的基本原理，對使用前向神經網絡(Feed－forwardneuralnetwork)進行音樂情感識別的結果進行分析。實驗結果顯示:前向神經網絡在音樂情感識別領域有著較高的準確性，能夠有效地對音樂情感進行識別。

關鍵詞:情感識別;前向神經網絡;特征提取

1引言

現如今多媒體技術和信號處理技術的快速發展，通過互聯網作為媒介，數字音樂借此得到了更好的發展和傳播，其中對海量在線音樂作品的管理和檢索的需求日益增加。音樂的本質性特征是情感［1］，有研究發現，檢索和描述音樂最常用的就是情感詞［2］，基于音樂情感屬性來組織和檢索音樂的需求是客觀存在的。音樂情感識別系統通過分析音樂的音頻數據和其他相關信息構建計算模型［3］，從而實現音樂情感自動判別。深度學習(deeplearning)能從數據中學習音頻的底層特征與高層概念的關系，而且機器學習在分類、回歸與特征等中也取得了較好的結果。音樂情感識別正在面臨著巨大的挑戰，挑戰產生的原因在于如何將音頻信號的特征與音樂的情感語義之間存在著難以用物理參數描述的差異［4］，通過機器學習進行情感識別，也許能夠跨越這一差異。前向神經網絡在音樂相關研究中有著較為出色的表現，因此模型采用了前向神經網絡。

2算法發展及研究現狀

音樂情感識別已經研討了很多年，音樂情感識別是涉及多個學科的跨學科領域，心理學、音樂學、機器學習、信號處理、模式識別、數據挖掘等都是音樂情感自動分析的相關領域。目前音樂情感識別主要通過機器學習的方式建立計算機模型［3］，從而進行音樂情感的識別。在2004年T．Li等［5－6］設計并實現了一種名為MARSYAS的情感檢測系統，該系統完成了對音樂情感的模糊識別，通過提取諸如音調和節拍等音樂信息，然后將這些數據輸入支持向量機(SVM)，對模型進行訓練，從而實現音樂情感識別。同年M．Wang［7］等人也實現了自動識別音樂情感的工作，經過支持向量機(SVM對音樂頻譜特征的提取，利用這些數據進行模型訓練，從而識別音樂的情感類型。2009年CyrilLaurier等人通過監督學習進行模型訓練完成音樂情感識別，運用支持向量機(SVM)進行音樂情感的主動標注，將特征提取的結果作為模型訓練的輸入。通過基因表達式編程(GEP)算法，浙江大學劉濤［8］對音樂情感表達的向量進行探索，剖析了情感語義之間的相似關系，最終完成了音樂特征空間到情感空間的映射。2014年Weninger等提出了基于循環神經網絡(RecurrentNeuralNetwork，RNN)［10］情感識別方法。該使用頻譜提取低層特征，在低層特征的輪廓上計算矩陣、百分位數和回歸系數等一般特征作為RNN的前端輸入，通過實驗認證該模型優于支持向量回歸(SVR)及前饋神經網絡(FNN)。2016年Li等提出了基于DBLSTM(DeepBidirectionalLongShort－TermMemory)［11］的音樂動態情感預測方法。該方法基于多種尺度的時間序列訓練多個DBLSTM，然后使用超限學習機(ExtremeLearningMachine，ELM)將訓練結果融合起來得出結論。3FNN模型前向神經網絡(Feed－forwardneuralnetwork)是神經網絡中基礎的網絡架構，區別于循環神經網絡(RNN)，前向神經網絡的單元之間不形成連接，通過對輸入進行各種非線性變化后對數據進行擬合。

2．1神經網絡傳播公式神經網絡的傳播方式包括前向傳播和反向傳播，前向傳播指的是模型自底向上進行傳播，根據給定的輸入進行計算。反向傳播根據向前傳播計算結果計算損失值，反向傳播錯誤使用梯度下降算法進行計算、訓練各神經元參數。

2．2Softmax分類器本文對于FNN的訓練采用Softmax作為激活函數，Softmax在多分類問題上有著不錯的表現，因為Softmax每個神經元的輸出為正且和為1，因此可將Softmax層的輸出視為概率分布。對于計算結果就能得到一個直觀的解釋。

3情感識別整體框架

基于前向神經網絡的音樂情感識別包括以下流程:(1)對音樂情感進行分類，根據種類構建數據集;(2)對數據集的數據進行特征提取，構建神經網絡模型;(3)輸入訓練樣本集訓練得到輸出值，計算誤差，反向更新模型參數，重復此過程直至誤差小于期望誤差;(4)輸入測試樣本，進行測試。

4實驗素材及分類設計

4．1音樂情感分類情感是非常主觀的東西，不同的人之間存在較大差異，并且難以用合適的量級進行評價。音樂情感識別要完成的是對音樂作品的情感內涵進行自動分析，其中最重要的前提工作是對情感進行合理的分類。連續維度情感模型雖然能夠細膩地將同類情感進行分類，但是對于音樂的分類不夠直觀，離散類別情感模型對情感的分類更接近人類體會音樂并進行描述的音樂情感，更適用于MIDI格式的符號樂曲的情感分類研究。為了研究情感分類對實驗的準確度的影響，本次試驗依據YangYH等人［15］所運用的情感模型將數據集的音樂情感粗略分為生機勃勃的(Exuber-ance)、焦慮的(Anxious)、令人滿足的(Content-ment)、喪氣的(Depression)。再次實驗時，將以上四種情感更加細致地分為活力的(Aggressive)、苦樂參半的(Bittersweet)、快樂(Happy)、幽默的(Humor-ous)、激昂的(Passionate)五種情感。

4．2數據集構成我們通過網絡爬蟲在Yoube上收集了196首多音軌MIDI文件，演奏風格多樣化，演奏樂器多樣化、情感描述準確，對于這些音樂文件按照下載時情感標簽分為四類，再根據具體需求進行更細致的分類。

5實驗結果及分析

5．1特征提取文獻［14］運用超梯度提升算法xgboost建立模型，將音樂的中高層次特征作為模型輸入實現了音樂情感自動識別。在多維空間中將音樂特征輸入結果與音樂情感進行非線性擬合，與低水平特征輸入產生的結果相比，基于中高級特征的音樂情感識別模型的識別精度所能達到的精度有明顯的提升。文中實驗還發現情感識別受中高級特征影響的情況也有所差異，根據統計可以看出，各特征對音樂情感識精度的影響情況如下:速度＞調式＞旋律走勢＞樂器＞和弦＞紋理＞節奏。音樂調式無法直接通過MIDI文件數據直接獲取，需要專業人士對音樂文件進行分析后最終確定，旋律被稱為音樂的首要要素，音樂的速度可通過MIDI文件數據直接獲取但并不是音樂構成要素中最重要的，綜合考慮特征提取的準確和難易程度，最終決定將音樂的旋律作為前向神經網絡的輸入，旋律走勢可表示為一段時間的音樂音高的變化。

5．2基于FNN的音樂情感識別結果及分析隨機選取相同數量的音頻數據對FNN模型進行50次測試。

6結論

情感識別在音樂檢索和數據服務方面有著不可動搖的地位，研究情感識別有著較高的現實意義。本文通過構建前向神經網絡對音樂情感識別進行了研究，通過研究的實驗數據可以看出，前向神經網絡對于音樂情感識別有較高的準確度，同時該準確度受到分類數、音樂情感復雜程度的影響。神經網絡的訓練時間受到CPU或者GPU運行狀態的影響，同時分類數的不同也會在一定程度上影響訓練時間。由于較為復雜的音樂在不同的“段落”所表示的情感也許并不與整體情感相符合，這帶來了識別的困難，導致前向神經網絡對于此種類型的音樂判斷準確率較低，若將同一音頻數據分為多段，將多段輸入到訓練好的神經進行“投票”，對音樂情感的判斷也許會更加準確、科學。同時通過使用更加復雜的神經網絡架構進行試驗，如與時間相關的分類問題上較為優秀的循環神經網絡(RecurrentNeuralNetworks，RNN)對音樂情感分類進行研究，也許能夠得到優于前向神經網絡的結果。

作者：趙薇；王立昊；黃敬雯；周義楠單位：中國傳媒大學理工學部

在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

前向神經網絡下的音樂情感識別范文

擴展閱讀