月: 2021年6月


  • アリとキリギリス

    アリとキリギリス

    アリとキリギリス。 「楽をしてはひどい目に遭う」という教訓が含まれています。 しかし、元のお話はセミ(キリギリスではない)でセミの名台詞で話は終わります。 “` すると、アリは笑って言いました。 『夏の間歌ったなら、冬の間踊りなさい』 すると、セミはこう答えました。 『歌うべき歌は、歌いつくした。私の亡骸を食べて、生きのびればいい。』 “` アリかセミ(キリギリス)か。 なんていうか・・・アリは何も生み出せない気がするんですよね。 世の中をおどろかせる何かを作る可能性があるとすればはやっぱセミでしょう。 今回はそういうお話です。


  • テキストマイニングを用いた分析 – 対象キーワード「プログラマー きつい」

    えーすみません。最初から謝っておきます。 本記事は「プログラマー きつい」で悩んでる方に解決策を提示する記事ではありません。 本記事のテーマは「テキストマイニングで掲題のキーワードで出てくる情報のざっくり調査」です。 僕のページ「プログラマーやめました」をGoogleで検索すると 「他のキーワード」候補として「プログラマー きつい」が出てきます。 このキーワードで出てくるTop100の記事を順番に タグカテくんとKHCoderを使って分析してみます。


  • タグカテくんの使い方 – ブログのタグとカテゴリの付け方案

    ブログの雑然としたタグやカテゴリを何とかしたい。 そう感じたらタグカテくん。 SEOとか全く考えてませんが適当につけるよりはマシなのではないでしょうか? タグとかカテゴリって最初は頑張るのですが、 面倒くさくなって全部同じものを付けるようになってしまいます。 僕のサイトの大半が「ぼやき」カテゴリー「ぼやき」タグがついてました。 効果がイマイチ見えない作業って続かないんですよね。 頭を使わずに、、もとい、**機械的にカテゴリー分けとタグ付けをやりたい**がコンセプトです。 では、ツール「タグカテくん」のご紹介。 「機械的にタグとカテゴリーを付ける方法」編です。


  • 【ブログ記事整理】ブログの記事整理総括【WordPress】

    本プロジェクトの目的は「プログラマーやめました」の全記事に対し 明確なカテゴリとタグをつけることでした。 今回は全体を振り返ってみることにします。 想像していた以上に面白い結果が得られたので、 案外色んなところで応用が利くものではないかと考えています。


  • 【ブログ記事整理】タグを一定のルールでつけてみる【WordPress】

    ブログ記事の整理プロジェクト続編です。 最初から読みたい変わり者はコチラへどうぞ → [ブログ記事の整理プロジェクト](https://www.premium-tsubu-hero.net/blog-seiri-menu/) いつまでブログの記事整理ごときでブログを続けるのか? 愚問。飽きるまでです。で、飽きてきました。もう無理。 次回、総括とツールを公開して終わりにします。 いよいよ大詰め。タグの整理です。 タグの整理は見通しが立っています。 しかしここへきて、大きな失態を犯してしまいました。 元のタグのぐちゃぐちゃ感を表す証拠を残すのを忘れたのです。 ビフォー・アフターのアフターしかない状態でこの記事を収束させるのか?


  • 【ブログ記事整理】カテゴリを一定のルールでつけてみる【WordPress】

    カテゴリを決定するのが割と難関です。 ブログ全体の要約文を作るには全記事の頻出名詞を抜き出せば良さそうです。 各記事の要約文は各記事の頻出名詞で良さそうです。 しかし、カテゴリ・・・。 各記事の頻出名詞では具体的過ぎて278記事なのに256個のカテゴリが必要になってしまいます。 タグとしては良いのです。ただカテゴリとしては役不足です。 一方ブログ全体の頻出名詞を当て込むと抽象的すぎて70%の記事が「人」です。 もう少し掘り下げて考えていきます。


  • 【ブログ記事整理】カテゴリの分類方法案【WordPress】

    [前回の記事](https://www.premium-tsubu-hero.net/blogtech/blog-organize/blog-seiri-project-05/)では頻出名詞が各記事のタグに約8割の確率で使えそうということがわかりました。 しかしながら、カテゴリとして使おうと思うと約3割でした。 今回はカテゴリの層別をやっていきます。


  • ブログ記事の整理プロジェクト – 各記事の頻出名詞の取得(C# + MeCab)

    前回の記事ではKH Coderを使用して、当ブログ全記事の頻出名詞を抜き出しました。 上位10件程度なら、カテゴリやタグとしてそこそこ使えそうなものが並んでいます。 | 抽出語 | 品詞 | 出現回数 | | ———— | —— | — | | 人 | 名詞C | 761 | | 自分 | 名詞 | 345 | | プロジェクト | 名詞 | 342 | | 会社 | 名詞 | 288 | | システム | 名詞 | 278 | | ソフトウェア | 名詞 | 272 | | データ | 名詞 | 263 | | 技術 | 名詞 | 249 | | プログラマー | 名詞 | 246 | | 情報 | 名詞 | 242 | 今回は各記事個別に品質単語を見ていきます。


  • ブログ記事の整理プロジェクト – テキストマイニング(KH Coder)

    [前回までの記事](https://www.premium-tsubu-hero.net/blog-seiri-project-03/)でブログの記事を取り出しました。 今回はテキストマイニングです。以下のツールを使っていきます。 [KH Coder](https://khcoder.net/) 様々な研究で使用されており、非常に応用範囲の広い技術だと思います。 そんな素晴らしい技術を公衆便所の落書きのようなページに あろうことかカテゴリやタグの整理で使用させて頂くという・・・。 では、やっていきます。


  • 【ブログ記事整理】記事の取り出し方【WordPress】

    ブログの記事を整理するために形態素解析の準備をしています。 何を言っているかわからない方。深く考えない方がよいと思います。 ブログの整理がイヤで趣味に走ってる感は否めません。 [前回](https://www.premium-tsubu-hero.net/blog-seiri-project-02/)記事の取出方法の候補を4つ挙げました。 諸般の事情により3の方針でいきます。 1. WordPressのREST APIで記事を取得する 2. WordPressのデータベースから直接クエリで取り出す 3. バックアップファイルから取り出す 4. Webページに直接アクセスしてリンクを順に辿っていき記事のHTMLを取り出す