ブログ記事の整理プロジェクト – カテゴリの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

カテゴリを決定するのが割と難関です。

ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。
各記事の要約文は各記事の頻出名詞で良さそうです。

しかし、カテゴリ・・・。
各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。
タグとしては良いのです。ただカテゴリとしては役不足です。
一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。

もう少し掘り下げて考えていきます。


「人」や「自分」や「プロジェクト」というのは確かに分類としてはアリかもしれません。
しかし、そのグループの記事を読みたくなるか?という根本的な疑問がわきます。
僕は読みたい記事に3手順以内にたどり着きたいのです。
何を読みたい時に「人」や「情報」を選択するのか?
「プログラマーやめました」というタイトルで「プログラマー」を選択する人は何を考えているのか?皆目見当もつきません。

名詞 出現数
751
自分 345
プロジェクト 339
会社 288
ソフトウェア 271
データ 258
システム 253
技術 249
プログラマー 246
情報 242

当ブログのカテゴリを想定した単語としては妥当な線ですが、
名詞一つではあまり興味を惹かれません。

当ブログは「プログラマーやめました」というタイトルで、
全ての記事はプログラマーをやめた(?)僕が書いてます。
このブログを他のブログと並べてカテゴライズすると
「プログラマー」というカテゴリが妥当でしょう。
つまり「プログラマー」は全記事に該当するカテゴリーと考えて良いと思います。

  • プログラマーと人
  • プログラマーと自分
  • プログラマーとプロジェクト
  • プログラマーと会社
  • プログラマーとソフトウェア
  • プログラマーとデータ
  • プログラマーとシステム
  • プログラマーと技術
  • プログラマーと情報

お、カテゴリーの粒度が変わってないのに何故か興味が惹かれる感じになりました。
カテゴリーは「プログラマーとXXX」で行くことにします。
「プログラマーとプログラマー」はちょっとアレなのでプログラマーを除く20個で行きます。
Top20個は前回の記事で調べた97%を網羅できる名詞だからです。

  • プログラマーと企業
  • プログラマーとファイル
  • プログラマーと画面
  • プログラマーとユーザー
  • プログラマーと記事
  • プログラマーとbitnami
  • プログラマーと感じ
  • プログラマーサーバー
  • プログラマーと業務
  • プログラマーと内容
  • プログラマーとWordpress

「感じ」は名詞として認めない。

  • プログラマーと言葉

さて、カテゴリの整理をやっていきます。


カテゴリ修正前と修正後の比較

修正前

ほとんどが「サラリーマンに関する話題」か「ぼやき」。
何の役にも立ちません。

修正後

プログラマーと人に振られすぎですが、
ちょっと興味をそそられるカテゴリに分類されました。(個人の感想です。)
ウィジェットに追加してみましたがそれなりに見栄えします。
中々アリだな。これ。

機械的に分類したもので僕の感覚とは異なるので何だか新鮮な感じです。

まとめ

実際のカテゴリと内容が合ってるかどうかはご愛敬。

記事をこのまま書き続ければ、
おそらく使用する名詞の数が変わるので頻出名詞Top20も変わると思います。
案外時代にあったカテゴリが出てくるようになるかもしれません。
自動でやれるようにしてみようかなぁ。

次はタグも同じく変更していきます。

おわり

コメントする

メールアドレスが公開されることはありません。