パーマリンクにカテゴリを絶対に入れてはいけない理由(WordPress)

先に結論だけ言っておきます。
ワードプレスなどでブログを書かれている方、
パーマリンクにカテゴリを入れては絶対にいけません。

僕は今、3番目です。何があったか聞いてください。

元ネタはこちらの方王月ようさん

映える記事

ブログのカテゴリとタグを修正したら、
それなりにシュッとしました(個人の感想です)。
アクセス数は激減するので良い子は真似しない方がよいと思います。
本ブログもアクセス数が平日は3分の1,土日は10分の1にシュッとしています。

さて、シュッとしたついでに彩りを添えたくなってきました。
色も自動でつけられたらおしゃれなのでは?というやけくそ。

が、今回の趣旨です。

テキストマイニングを用いた分析 – 対象キーワード「プログラマー きつい」

本記事のテーマは「掲題のキーワードで出てくる情報をテキストマイニングでざっくり調査」です。

僕のページ「プログラマーやめました」をGoogleで検索すると
「他のキーワード」候補として「プログラマー きつい」が出てきます。

このキーワードで出てくるTop100の記事を順番に
タグカテくんとKHCoderを使って分析してみます。

タグカテくん - GitHub zeikomi552/BlogOrganizer
KHCoder

タグカテくんの使い方 – ブログのタグとカテゴリの付け方案

ブログの雑然としたタグやカテゴリを何とかしたい。
そう感じたらタグカテくん。

SEOとか全く考えてませんが適当につけるよりはマシなのではないでしょうか?

タグとかカテゴリって最初は頑張るのですが、
面倒くさくなって全部同じものを付けるようになってしまいます。
僕のサイトの大半が「ぼやき」カテゴリー「ぼやき」タグがついてました。
効果がイマイチ見えない作業って続かないんですよね。
頭を使わずに、、もとい、機械的にカテゴリー分けとタグ付けをやりたいがコンセプトです。

では、ツール「タグカテくん」のご紹介。
「機械的にタグとカテゴリーを付ける方法」編です。

ブログ記事の整理プロジェクト – 総括

本プロジェクトの目的は「プログラマーやめました」の全記事に対し
明確なカテゴリとタグをつけることでした。
今回は全体を振り返ってみることにします。
想像していた以上に面白い結果が得られたので、
案外色んなところで応用が利くのではないかと考えています。

ブログ記事の整理プロジェクト – タグの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

いつまでブログの記事整理ごときでブログを続けるのか?
愚問ですね。飽きるまでです。飽きてきました。もう無理。
次回、総括して終わりにします。

今回はいよいよ大詰め。タグの整理です。
タグの整理は見通しが立っています。

しかしここへきて、大きな失態を犯してしまいました。
元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。
ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?

ブログ記事の整理プロジェクト – カテゴリの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

カテゴリを決定するのが割と難関です。

ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。
各記事の要約文は各記事の頻出名詞で良さそうです。

しかし、カテゴリ・・・。
各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。
タグとしては良いのです。ただカテゴリとしては役不足です。
一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。

もう少し掘り下げて考えていきます。

ブログ記事の整理プロジェクト – カテゴリ分類の考察

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事では約8割の確率でタグに使えそうということがわかりました。
しかしながら、カテゴリとして使おうと思うと約3.5割。
今回はカテゴリの層別をやっていきます。

ブログ記事の整理プロジェクト – 各記事の頻出名詞の取得(C# + MeCab)

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事ではKH Coderを使用して、当ブログ全記事の頻出名詞を抜き出しました。
上位10件程度なら、カテゴリやタグとしてそこそこ使えそうなものが並んでいます。

抽出語 品詞 出現回数
名詞C 761
自分 名詞 345
プロジェクト 名詞 342
会社 名詞 288
システム 名詞 278
ソフトウェア 名詞 272
データ 名詞 263
技術 名詞 249
プログラマー 名詞 246
情報 名詞 242

今回は各記事個別に頻出名詞を見ていきます。