ブログ記事の整理プロジェクト – タグの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

いつまでブログの記事整理ごときでブログを続けるのか?
愚問ですね。飽きるまでです。飽きてきました。もう無理。
次回、総括して終わりにします。

今回はいよいよ大詰め。タグの整理です。
タグの整理は見通しが立っています。

しかしここへきて、大きな失態を犯してしまいました。
元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。
ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?

ブログ記事の整理プロジェクト – カテゴリの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

カテゴリを決定するのが割と難関です。

ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。
各記事の要約文は各記事の頻出名詞で良さそうです。

しかし、カテゴリ・・・。
各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。
タグとしては良いのです。ただカテゴリとしては役不足です。
一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。

もう少し掘り下げて考えていきます。

ブログ記事の整理プロジェクト – カテゴリ分類の考察

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事では約8割の確率でタグに使えそうということがわかりました。
しかしながら、カテゴリとして使おうと思うと約3.5割。
今回はカテゴリの層別をやっていきます。

ブログ記事の整理プロジェクト – 各記事の頻出名詞の取得(C# + MeCab)

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事ではKH Coderを使用して、当ブログ全記事の頻出名詞を抜き出しました。
上位10件程度なら、カテゴリやタグとしてそこそこ使えそうなものが並んでいます。

抽出語 品詞 出現回数
名詞C 761
自分 名詞 345
プロジェクト 名詞 342
会社 名詞 288
システム 名詞 278
ソフトウェア 名詞 272
データ 名詞 263
技術 名詞 249
プログラマー 名詞 246
情報 名詞 242

今回は各記事個別に頻出名詞を見ていきます。

ブログ記事の整理プロジェクト – ブログ記事の取り出し方方針

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

今回はブログの記事を取り出す方針を考えてみようと思います。

パッと思いつく方法としては以下の4種類。

  1. WordPressのREST APIで記事を取得する
  2. WordPressのデータベースから直接クエリで取り出す
  3. バックアップファイルから取り出す
  4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す

どれも中々面倒くさそうです。
1.はAPIを調べるのが面倒くさい。
2.はいちいち外向けにMySQLを解放しないといけないので面倒くさい
3.はクエリのバックアップなので取り除かないといけない文字がいっぱいありそうで面倒くさい
4.は何かちょっとコンプライアンス的によろしくない気がする

今回は折角バックアップとったので活用することにします。
普段は何もないとそのまま破棄されちゃいますしね。
今回はちゃんと使ってあげます。

というわけで3を採用。

ブログ記事の整理プロジェクト

このブログ自体が雑多な感じになってきてしまいました。
常々やろうと考えていたのですが僕にはなかなかの難題です。

SEIRI

ローマ字にすれば何かうやむやになって
簡単そうに感じるかと思ったのですが逆効果ですね。

完全に気が失せました。下がるわー。
とりあえずテンションを上げていくためにプロジェクトにします。

ブログ記事整理プロジェクト!!!

あー、もうやれる気がしない。

成功も失敗もわからないプロジェクト

僕がITベンダーに勤めていたころは
「XXX開発プロジェクト」や「XXX社向けXXXXプロジェクト」など後ろにプロジェクトと名の付く仕事が中心でした。
製造業に勤める今、ワーキンググループと呼び名の異なるプロジェクトが仕事の中心です。

プロジェクトとは、一回限りの繰り返しのない仕事である。
プロジェクトの定義はNASAやPMI(米国プロジェクトマネジメント協会)などで行われていますが、
いずれにも共通する要素をピックアップするとこのようになります。

- 有期性がある業務(期間が限定され、明確な開始と終了がある業務)
- 独自性がある業務(繰り返しのない1回限りの業務)
- 明確なプロジェクト目標の存在

しかしながら、今の方が圧倒的に成功確率が低いのです。
何故なのか考察してみます。個人的な意見です。

プログラマーをやめたいあなたへ

やぁ、どこかの誰かさん。ちゃんと眠れてますか?

こんなタイトルの記事を読むなんて
きっと背負っているものが多いのでしょう。
いっそ全てを投げ捨てて今とは違うどこかへ行ってしまいたい。
そんな気持ちなのかもしれませんね。知らんけど。
僕はずっとそうでした。

以前、僕は長期連休を全くとれないプログラマーでした。
いま、確実に保証されている長期連休がGW・夏休み・正月休みと・・・
おそらく会社を辞めない限り保証されています。
僕にとって全てを忘れて眠れる長期連休は何よりもありがたい。
ゴールデンウィーク終盤になるとこういう文章を書きたくなります。

プログラマーをやめたいあなたへ。
気分転換に僕の昔話でも聞いていきませんか?

「プログラマーをやめたい」あなたは、「プログラマーをやめる」あなたではないのだと思います。
いつやめるのかではなく、やめるかどうかを悩んでいるのでしょう。
僕がどのタイミングで「やめる僕」になったのかをお話します。

行先ボードでも作ってみるか⑳ – プロジェクト完了報告

プロジェクトと言うほどでもないですが、
一応プロジェクトの体裁でやってきたので完了報告書を作成しておきます。
これにて、行先ボードバージョン1の開発は終了といたします。
すぐにバージョン2に取り掛かりますが・・・。
バージョン2以降は見積もりとかせずに適当にやっていきます。

これまでの記録はこちらをご確認ください。

行先ボードでも作ってみるか⑭ – 中間集計

行先ボード開発ですが、
開発前の資料がおよそ揃ってきたのでそろそろ開発に入れそうです。
そこで開発に入る前の計画と実績の中間集計を行いたいと思います。

今回寄り道をしてしまったのでかなり怖いです。
では集計していきます。