ブログ執筆環境を整える(WordPress, VSCode, マークダウン, PasteImage)

全記事を読みたい場合はこちら → ブログ執筆環境改善プロジェクト

僕は文章を書くのはたぶん好きですが、
記事を書く以外が色々面倒くさくて嫌になります。
今回はブログの執筆環境を整えていくことにします。

映える記事

ブログのカテゴリとタグを修正したら、
それなりにシュッとしました(個人の感想です)。
アクセス数は激減するので良い子は真似しない方がよいと思います。
本ブログもアクセス数が平日は3分の1,土日は10分の1にシュッとしています。

さて、シュッとしたついでに彩りを添えたくなってきました。
色も自動でつけられたらおしゃれなのでは?というやけくそ。

が、今回の趣旨です。

ブログ記事の整理プロジェクト – 総括

本プロジェクトの目的は「プログラマーやめました」の全記事に対し
明確なカテゴリとタグをつけることでした。
今回は全体を振り返ってみることにします。
想像していた以上に面白い結果が得られたので、
案外色んなところで応用が利くのではないかと考えています。

ブログ記事の整理プロジェクト – タグの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

いつまでブログの記事整理ごときでブログを続けるのか?
愚問ですね。飽きるまでです。飽きてきました。もう無理。
次回、総括して終わりにします。

今回はいよいよ大詰め。タグの整理です。
タグの整理は見通しが立っています。

しかしここへきて、大きな失態を犯してしまいました。
元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。
ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?

ブログ記事の整理プロジェクト – カテゴリの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

カテゴリを決定するのが割と難関です。

ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。
各記事の要約文は各記事の頻出名詞で良さそうです。

しかし、カテゴリ・・・。
各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。
タグとしては良いのです。ただカテゴリとしては役不足です。
一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。

もう少し掘り下げて考えていきます。

ブログ記事の整理プロジェクト – カテゴリ分類の考察

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事では約8割の確率でタグに使えそうということがわかりました。
しかしながら、カテゴリとして使おうと思うと約3.5割。
今回はカテゴリの層別をやっていきます。

ブログ記事の整理プロジェクト – テキストマイニング(KH Coder)

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回までの記事でブログの記事を取り出しました。
今回はテキストマイニングです。
前回、形態素解析と言ってしまいましたが、技術単体の話ではないのでテキストマイニングに訂正しておきます。

以下のツールを使っていきます。

KH Coder

様々な研究で使用されており、非常に応用範囲の広い技術だと思います。

そんな素晴らしい技術を公衆便所の落書きのようなページに
あろうことかカテゴリやタグの整理で使用させて頂くという・・・。

では、やっていきます。

ブログ記事の整理プロジェクト – WordPressの記事の取り出し

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

ブログの記事を整理するために形態素解析の準備をしています。
何を言っているかわからない方、その感覚は正しい。
でも、深く考えない方がよいと思います。
ブログの整理がイヤで趣味に走ってる感は否めません。

前回記事の取出方法の候補を4つ挙げました。
諸般の事情により3の方針でいきます。

  1. WordPressのREST APIで記事を取得する
  2. WordPressのデータベースから直接クエリで取り出す
  3. バックアップファイルから取り出す
  4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す

ブログ記事の整理プロジェクト – ブログ記事の取り出し方方針

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

今回はブログの記事を取り出す方針を考えてみようと思います。

パッと思いつく方法としては以下の4種類。

  1. WordPressのREST APIで記事を取得する
  2. WordPressのデータベースから直接クエリで取り出す
  3. バックアップファイルから取り出す
  4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す

どれも中々面倒くさそうです。
1.はAPIを調べるのが面倒くさい。
2.はいちいち外向けにMySQLを解放しないといけないので面倒くさい
3.はクエリのバックアップなので取り除かないといけない文字がいっぱいありそうで面倒くさい
4.は何かちょっとコンプライアンス的によろしくない気がする

今回は折角バックアップとったので活用することにします。
普段は何もないとそのまま破棄されちゃいますしね。
今回はちゃんと使ってあげます。

というわけで3を採用。

ブログ記事の整理プロジェクト

このブログ自体が雑多な感じになってきてしまいました。
常々やろうと考えていたのですが僕にはなかなかの難題です。

SEIRI

ローマ字にすれば何かうやむやになって
簡単そうに感じるかと思ったのですが逆効果ですね。

完全に気が失せました。下がるわー。
とりあえずテンションを上げていくためにプロジェクトにします。

ブログ記事整理プロジェクト!!!

あー、もうやれる気がしない。