2012年11月14日水曜日

Pythonでアンテナサイトのレコメンド機能書いてみた

方法は以下の通りです

最近mecabで遊んでみたいな〜と思う今日この頃です

そこで、先輩(@pinkroot)が2chまとめアンテナサイトを作っていたのでそれに今まで見た記事から別のまとめ記事をレコメンド機能を実装してみました。

地獄アンテナ

方法は以下の通りです

  1. RSSリーダーからとって来れるタイトルと概要をmecabで形態素解析にかける。
  2. 品詞が名詞のものだけを抽出してキーワードとする。
  3. その記事のキーワードをカウンティングしてベクトルを作る
  4. 記事をクリックしたらそのユーザの趣向ベクトルにその記事のベクトルを加算する
  5. レコメンドする時はユーザの趣向ベクトルと記事ベクトルのコサイン類似度にかけて上位を表示する。

こんな感じでレコメンドが出来ました。
方法はかなり我流なところがあるのでできるのかわからないです。

結果自体は自分のやつで試した結果「萌え」「美少女」のキーワードに敏感に反応するようになっていたので結構よかったのかな〜と思っています。

まとめ

今回は簡単なレコメンド機能を作る事でmecabの簡単な使い方とベクトルの類似度を求めるアルゴリズムに触れる事が出来たのでよかった。

0 件のコメント:

コメントを投稿