文章目录
- 介绍与研究动机
- 数据集
- 方法
- 实验结果
介绍与研究动机
论文链接:AN EXPLORATION OF GENERATING SHEET MUSIC IMAGES
传统的音乐生成任务的输出格式以MIDI、WAV为主,本文研究的格式却是乐谱,那么乐谱形式的音乐相较MIDI格式的音乐有哪些优势呢?
1、作曲家的首选格式,音乐专业的学生对于打谱软件早已习以为常;
2、拥有MIDI格式音乐中没有的信息,例如time signature, measure boundaries, harmonic information。
3、MIDI的嵌入编码会十分在意低层次的信息,例如note velocity,基于乐谱的作曲则不会在这里钻牛角尖;
数据集
本文作者探究了三种格式,分别是Image format, Semantic encoding, XML code。
方法
作者对三种格式都运用了相同的语言模型,分别是AWD- LSTM,GPT-2
实验结果
作者选择的评价指标主要是一致性(cohesion)。
可以发现基于语义编码的数据格式在两个语言模型上表现差不多,而GPT在XML上的time signature cohesion表现的要好一些。但是总体结果不大理想。