Published on

DopeLearning (KDD16) を​読んだ.

http://www.kdd.org/kdd2016/subtopic/view/dopelearning-a-computational-approach-to-rap-lyrics-generation

KDD の論文をちゃんと読むのは初めてなのかも. (iPad でハイパー長文感想書いたのに投稿されていなかった…もう寝る)

ラップの Lyric の生成タスクを定義して,音韻的な特徴を評価尺度として提案し,またそれに基づく IR 的な手法による Lyric 生成手法を提案した論文.

貢献

  • ラップの歌詞生成の情報検索的アプローチを提案.(他のテキスト生成タスクにも使えそう)
  • ラップの作詞生成タスクを Line を予測する問題として定式化.また意味的な類似度をとらえるために,RNN ベースのモデルを利用した素性が有効だと示した.
  • 歌詞の技術的な質(すごさ,Dope さ)を定量化する Rhyme Density を提案.実際のラッパーにより有効性を確認.
  • deepbeat.org でデモが公開されている.(ちゃんと動く. 著者グループはフィンランド人で,このシステムのデモ版では,英語・フィンランド語で Lyric の生成ができる.)

手法

  • 歌詞は Line の連鎖だと定義
  • 前文脈が与えられたとき,つぎの Line を推薦する
  • 推薦のランク学習には RankSVM を使う
  • 素性
    • 音韻的素性
    • 構造的素性(文字数ベース.長すぎると歌えないから,全体が同じような長さになるようにする.)
    • 意味的素性(BOW, LSA)
    • 意味的素性 2 (Collobert と同様の単語 RNN)
  • 尺度
    • 歌詞の質: Rhyme Density
    • 推薦の質: Rank, MRR など

感想

タイトルに惹かれて読んだ. 脚注の解説やタスクへの取り組み,デモなど,ラップ愛が強くてよかった. 手法は堅実で効果もありそうだけど,それ自体は特にラップに特化したものではない.もう少し言語学的な特徴の議論があれば面白くなりそう. 一番の収穫は,Computational Creativity という面白そうな分野があることを知れたこと.あと,Helsinki 大などフィンランドで KDD に通るところがあるというのを知って,留学したくなった.