リモートワーク放置・テレワーク放置①

テレワークやリモートワーク。
いわゆるIT技術を活用して場所を選ばない働き方を実現するアレです。
通勤のストレスやコストが削減できるので会社にとっても個人にとってもメリットがあります。
半面、日本人大好き「ぬくもり」のある直接会ってのやりとりが減ります。

コロナ前から指摘があった内容ですが、
「雑談が減る」
が、そこかしこで露見した形になります。

最近、テレワーク時の放置プレイがつらくて辞めていく新人が多いらしいですね。
非常にもったいないです。
彼ら彼女らが将来どれだけの貢献をしてくれるかわかりません。
全員、僕の所に来れば良いのに。

例によって世の中の記事が何を言っているのかを調べていきます。

プログラマーという職業が将来なくなる? – という言説について調べてみる

相変わらず形態素解析にハマっています。
日本語だし面白いよね。

自己満足を見せつける形になってしまってすみません。
僕の趣味にお付き合いいただける方のみ読んでいただけると幸いです。
損はさせま・・・いえ損します。

今回はGoogle検索の「プログラマー 仕事 なくなる」のTop50記事を使用します。

テキストマイニングを用いた分析 – 対象キーワード「プログラマー きつい」

本記事のテーマは「掲題のキーワードで出てくる情報をテキストマイニングでざっくり調査」です。

僕のページ「プログラマーやめました」をGoogleで検索すると
「他のキーワード」候補として「プログラマー きつい」が出てきます。

このキーワードで出てくるTop100の記事を順番に
タグカテくんとKHCoderを使って分析してみます。

タグカテくん - GitHub zeikomi552/BlogOrganizer
KHCoder

タグカテくんの使い方 – ブログのタグとカテゴリの付け方案

ブログの雑然としたタグやカテゴリを何とかしたい。
そう感じたらタグカテくん。

SEOとか全く考えてませんが適当につけるよりはマシなのではないでしょうか?

タグとかカテゴリって最初は頑張るのですが、
面倒くさくなって全部同じものを付けるようになってしまいます。
僕のサイトの大半が「ぼやき」カテゴリー「ぼやき」タグがついてました。
効果がイマイチ見えない作業って続かないんですよね。
頭を使わずに、、もとい、機械的にカテゴリー分けとタグ付けをやりたいがコンセプトです。

では、ツール「タグカテくん」のご紹介。
「機械的にタグとカテゴリーを付ける方法」編です。

ブログ記事の整理プロジェクト – 総括

本プロジェクトの目的は「プログラマーやめました」の全記事に対し
明確なカテゴリとタグをつけることでした。
今回は全体を振り返ってみることにします。
想像していた以上に面白い結果が得られたので、
案外色んなところで応用が利くのではないかと考えています。

ブログ記事の整理プロジェクト – タグの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

いつまでブログの記事整理ごときでブログを続けるのか?
愚問ですね。飽きるまでです。飽きてきました。もう無理。
次回、総括して終わりにします。

今回はいよいよ大詰め。タグの整理です。
タグの整理は見通しが立っています。

しかしここへきて、大きな失態を犯してしまいました。
元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。
ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?

ブログ記事の整理プロジェクト – カテゴリの決定

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

カテゴリを決定するのが割と難関です。

ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。
各記事の要約文は各記事の頻出名詞で良さそうです。

しかし、カテゴリ・・・。
各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。
タグとしては良いのです。ただカテゴリとしては役不足です。
一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。

もう少し掘り下げて考えていきます。

ブログ記事の整理プロジェクト – カテゴリ分類の考察

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事では約8割の確率でタグに使えそうということがわかりました。
しかしながら、カテゴリとして使おうと思うと約3.5割。
今回はカテゴリの層別をやっていきます。

ブログ記事の整理プロジェクト – 各記事の頻出名詞の取得(C# + MeCab)

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

前回の記事ではKH Coderを使用して、当ブログ全記事の頻出名詞を抜き出しました。
上位10件程度なら、カテゴリやタグとしてそこそこ使えそうなものが並んでいます。

抽出語 品詞 出現回数
名詞C 761
自分 名詞 345
プロジェクト 名詞 342
会社 名詞 288
システム 名詞 278
ソフトウェア 名詞 272
データ 名詞 263
技術 名詞 249
プログラマー 名詞 246
情報 名詞 242

今回は各記事個別に頻出名詞を見ていきます。

ブログ記事の整理プロジェクト – WordPressの記事の取り出し

ブログ記事の整理プロジェクト続編です。
最初から読みたい変わり者はコチラへどうぞ → ブログ記事の整理プロジェクト

ブログの記事を整理するために形態素解析の準備をしています。
何を言っているかわからない方、その感覚は正しい。
でも、深く考えない方がよいと思います。
ブログの整理がイヤで趣味に走ってる感は否めません。

前回記事の取出方法の候補を4つ挙げました。
諸般の事情により3の方針でいきます。

  1. WordPressのREST APIで記事を取得する
  2. WordPressのデータベースから直接クエリで取り出す
  3. バックアップファイルから取り出す
  4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す