タグ: ブログ記事整理プロジェクト

カテゴリやタグがぐちゃぐちゃ。
何だか嫌になってカテゴリとタグの整理に乗り出します。
ブログアクセス数は激減し10分の1に。
真似るな危険。ダメな例としてご参考まで。


  • タグカテくんの使い方 – ブログのタグとカテゴリの付け方案

    ブログの雑然としたタグやカテゴリを何とかしたい。 そう感じたらタグカテくん。 SEOとか全く考えてませんが適当につけるよりはマシなのではないでしょうか? タグとかカテゴリって最初は頑張るのですが、 面倒くさくなって全部同じものを付けるようになってしまいます。 僕のサイトの大半が「ぼやき」カテゴリー「ぼやき」タグがついてました。 効果がイマイチ見えない作業って続かないんですよね。 頭を使わずに、、もとい、**機械的にカテゴリー分けとタグ付けをやりたい**がコンセプトです。 では、ツール「タグカテくん」のご紹介。 「機械的にタグとカテゴリーを付ける方法」編です。


  • 【ブログ記事整理】ブログの記事整理総括【WordPress】

    本プロジェクトの目的は「プログラマーやめました」の全記事に対し 明確なカテゴリとタグをつけることでした。 今回は全体を振り返ってみることにします。 想像していた以上に面白い結果が得られたので、 案外色んなところで応用が利くものではないかと考えています。


  • 【ブログ記事整理】タグを一定のルールでつけてみる【WordPress】

    ブログ記事の整理プロジェクト続編です。 最初から読みたい変わり者はコチラへどうぞ → [ブログ記事の整理プロジェクト](https://www.premium-tsubu-hero.net/blog-seiri-menu/) いつまでブログの記事整理ごときでブログを続けるのか? 愚問。飽きるまでです。で、飽きてきました。もう無理。 次回、総括とツールを公開して終わりにします。 いよいよ大詰め。タグの整理です。 タグの整理は見通しが立っています。 しかしここへきて、大きな失態を犯してしまいました。 元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。 ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?


  • 【ブログ記事整理】カテゴリを一定のルールでつけてみる【WordPress】

    カテゴリを決定するのが割と難関です。 ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。 各記事の要約文は各記事の頻出名詞で良さそうです。 しかし、カテゴリ・・・。 各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。 タグとしては良いのです。ただカテゴリとしては役不足です。 一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。 もう少し掘り下げて考えていきます。


  • 【ブログ記事整理】カテゴリの分類方法案【WordPress】

    [前回の記事](https://www.premium-tsubu-hero.net/blogtech/blog-organize/blog-seiri-project-05/)では頻出名詞が各記事のタグに約8割の確率で使えそうということがわかりました。 しかしながら、カテゴリとして使おうと思うと約3割でした。 今回はカテゴリの層別をやっていきます。


  • ブログ記事の整理プロジェクト – 各記事の頻出名詞の取得(C# + MeCab)

    前回の記事ではKH Coderを使用して、当ブログ全記事の頻出名詞を抜き出しました。 上位10件程度なら、カテゴリやタグとしてそこそこ使えそうなものが並んでいます。 | 抽出語 | 品詞 | 出現回数 | | ———— | —— | — | | 人 | 名詞C | 761 | | 自分 | 名詞 | 345 | | プロジェクト | 名詞 | 342 | | 会社 | 名詞 | 288 | | システム | 名詞 | 278 | | ソフトウェア | 名詞 | 272 | | データ | 名詞 | 263 | | 技術 | 名詞 | 249 | | プログラマー | 名詞 | 246 | | 情報 | 名詞 | 242 | 今回は各記事個別に品質単語を見ていきます。


  • ブログ記事の整理プロジェクト – テキストマイニング(KH Coder)

    [前回までの記事](https://www.premium-tsubu-hero.net/blog-seiri-project-03/)でブログの記事を取り出しました。 今回はテキストマイニングです。以下のツールを使っていきます。 [KH Coder](https://khcoder.net/) 様々な研究で使用されており、非常に応用範囲の広い技術だと思います。 そんな素晴らしい技術を公衆便所の落書きのようなページに あろうことかカテゴリやタグの整理で使用させて頂くという・・・。 では、やっていきます。


  • 【ブログ記事整理】記事の取り出し方【WordPress】

    ブログの記事を整理するために形態素解析の準備をしています。 何を言っているかわからない方。深く考えない方がよいと思います。 ブログの整理がイヤで趣味に走ってる感は否めません。 [前回](https://www.premium-tsubu-hero.net/blog-seiri-project-02/)記事の取出方法の候補を4つ挙げました。 諸般の事情により3の方針でいきます。 1. WordPressのREST APIで記事を取得する 2. WordPressのデータベースから直接クエリで取り出す 3. バックアップファイルから取り出す 4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す


  • 【ブログ記事整理】バックアップを解析する【WordPress】

    今回はブログの記事を取り出す方針を考えてみようと思います。 パッと思いつく方法としては以下の3種類。 1. WordPressのREST APIで記事を取得する 2. WordPressのデータベースから直接クエリで取り出す 3. バックアップファイルから取り出す どれも中々面倒くさそうです。 1.はAPIを調べるのが面倒くさい。 2.はいちいち外向けにMySQLを解放しないといけないので面倒くさい 3.はクエリのバックアップなので取り除かないといけない文字がいっぱいありそうで面倒くさい 今回は折角バックアップとったので活用することにします。 普段は何もないとそのまま破棄されちゃいますしね。 今回はちゃんと使ってあげます。 というわけで3を採用。


  • ブログ記事の整理プロジェクト – WordPressのバックアップ

    ブログ記事の整理を行うにあたり、まずバックアップを取っていきます。 バックアップの取り方は色々ありますが、 今回は以前僕が作ったバッチを使ってバックアップを取っていきます。 ※環境はAWSのBitnamiを使用しています。