音乐中的两个重要元素,音乐构成和音乐表现。音乐构成关注的是音乐本身,它的指的是能
够定义一首歌曲的音符。然而这对音乐家而言只是第一步。这些乐谱如何被演奏家演奏,这
才是音乐工作的灵魂。因为演奏者演奏者演奏得各不相同,所以我们用音乐风格来描述个人
化的音乐演奏。
一、音乐风格定义
音乐风格很难定义,因为不能把音乐风格像音高一样被参数化。如果你曾听过很多经典的钢
琴 曲 , 那 么 你 会 发 现 一 个 新 手 和 一 个 资 深 的 钢 琴 家 会 奏 出 大 不 相 同 的 强 弱 力 度
(dynamics),这里指的是音乐响度的变化。一个音符的响度可以通过控制敲击琴键的轻重
程度来实现。在音乐符号中这些不同级别的强弱力度一般用意大利字母表示。这些字母被称
为情感符。不同的人会有不同的感觉,所以这里的特定的强弱集合都有着各自的情感表现。
二、强弱力度的应用
因此情感表现就意味着一组独一无二的强弱力度,而强弱力度也就成了风格的重要特征。在
一些特定的音乐风格中是存在一些规则的,因此人们可以通过强弱力度来识别音乐风格。这
也意味着人么可以用流派来归类音乐风格。
三、架构
使用了双向-长短期记忆网络(Bi-Directional LSTM)。分别用两个网络实现对音乐流派和风
格的分析,分别叫做 GenreNet 和 StyleNet。
✓ GenreNet
模型中有两个主要的层:双向 LSTM(Bi-Directional LSTM)和线性层。双向 LSTM 层结
合了 LSTM 网络的优点,它对学习相关的依赖提供了记忆,双向结构还使得模型在学习的
时候同时考虑了未来的信息。这使得模型的输出可以作为另一层网络的输入。线性层就是被
用来把双向 LSTM 的输出值的范围从 [-1,1] 变得更大。
评论0