识别乐谱并将其转录为MIDI
识别笔记的方法
在从头开始编写项目并测试了不同方法的尝试失败了几次之后,我遇到了以下:它描述了一种使用卷积网络和递归网络的组合来识别音符的方法。 该方法尤其用于文本识别。 因此,我决定采用一种光学字符识别实现方式,并训练基于便签的网络。
选择了。 解释其工作原理的。
数据集
有关音符识别数据集的最完整信息可在找到 但是,没有适合于我的任务的带有标记音符高度的数据集。 具有间距映射的唯一可用数据集是 ,这些数据来自撰写原始文章的人,上面提供了链接。 这是一个由生成的图像,带有用于每个音符和符号的适当标签。
数据集特征
94,984个随机单音序列,由52个符号组成:从C4到E5的音符,4种长度(一半,四分之一,八分之一,十六分之一),相同持续时间的4个暂停,大小符号(3 / 4、4 / 4、6 / 8) ,变更标志(清晰,平坦,bacar),高音谱号,酒吧。