[Personal] PAM_Cython: Pachinko Allocation Model (PAM) with Cython

トピックモデルとは、文章データの潜在的なトピックを推定する確率モデルです。 本モデルを用いることで、以下のような情報が得られます。

  • トピックに基づく文章のクラスタリング
  • ある文章を構成するトピックの寄与(document-topic distribution)
  • あるトピックを構成する単語の寄与(topic-word distribution) 今回はあえてPachinko Allocation Model (PAM; パチンコ配分法) というマイナー手法に焦点を当て、実装に取り組みました。

Qiitaの投稿もご覧ください。

The source code is available at https://github.com/groovy-phazuma/PAM_Cython.