Skip to content

2017.07.31 会议记录

与会人员 :吴老师、陈恺、章奕林、姬佩琳、孙时中

  1. 章奕林介绍神经网络模型:将乐曲转化为 8*8 矩阵,可通过机器学习的方法探究该矩阵和情感的关系。输入矩阵,输出情感。新的模型使用神经网络,输入转移矩阵,输出七维向量(因为乐曲标注中共有 7 种情感),有这个情感输出 1,没有为 0。神经网络模型存在的问题:1.输出结果为小数,例如输出 0.3 估计成 0 或 1 是一个问题,需要判断标准;2.数据量不足,乐曲仅有 400 多首,数据量不够多。
  2. 吴老师的建议:之前使用的聚类的方法是无监督学习,这次神经网络模型用到标注的学习过程。1.输出结果为离散向量是神经网络的大忌。处理方法:建立模糊集或粗糙集来处理离散输出。2.不用输出离散向量,建模输出成连续的数的形式,训练上更简单。3.神经网络设定神经元的结构,设定参数选取等方面有很多学问,可以尝试选择更合适的输入,如输入作者和年代,可看出年代、作者哪个因素影响更大。
  3. 章奕林提出问题:标注偏斜,如热情标注特别多,愤怒少, 导致精度过低。吴老师针对这个问题给出的建议:选择更平均的训练集;扩大数据量方法:将长曲子拆开,不光按照乐章拆,乐曲中情绪变化较大,比如按照乐句进行拆分,可扩大训练集。神经网络可以不用 BP 的方法,用 deeplearning 建模方法,这样可以借鉴 google 的方法。
  4. 陈恺继续用聚类的方法做分析,并将其与现有标注进行对照。用两个方法同时做,可以分析出问题的原因。
  5. 论文投稿方面:十月底为 deadline,跟已有的标注,用聚类的方法做比较。