全国WordCloudツアー

僕のような出不精はコロナ禍かどうかに関わらず全く旅行に行きません。
そんなひきこもりですがゴールデンウィーク最終日ともなると
少しくらいどこかに行っておけばよかったなぁ・・・と。。。1ミリも思いません。

さて、そんな出不精の僕は最近の技術を駆使して効率よく旅行気分を味わおうと思います。

手法

調査日時:22/05/08 AM 5:27~5:54にデータを取得

  • ツイッターで直近の7日間のツイートを都道府県名で検索(1000件ツイート前後)。
  • 形態素解析にかけて名詞だけを取り出す
  • WordCloudにかける
  • シルエット画像に合わせこんで出力する

ソースコードは要望があれば出しますが、
もう何番煎じというくらい世の中に出回っているので今回は割愛します。
本ページは出力結果を中心にご紹介します。

※ここにある画像は自由に使っていただいて構いません。

北海道

北海道

東北

青森

秋田

岩手

山形

宮城

福島

関東

茨城

栃木

群馬

埼玉

千葉

東京

神奈川

中部

新潟

富山

石川

福井

山梨

長野

岐阜

静岡

愛知

近畿

三重

滋賀

京都

大阪

兵庫

奈良

和歌山

中国

鳥取

島根

岡山

広島

山口

四国

香川

徳島

愛媛

高知

九州

福岡

佐賀

長崎

熊本

大分

宮崎

鹿児島

沖縄

まとめ

テキストマイニングの技術の一つとして知られるワードクラウドですが
共起ネットワークとかの方が意味をとらえやすいように感じます。
どちらかといえばデザインよりの技術ですかね。

当初の目的の旅行気分が味わえるか?ほんのすこーしだけ味わえました。
何となく特産や名物・名所がわかるところもあれば何もわからないところもあります。
山形のさくらんぼ、高知のカツオ、香川のうどんなんか好きですね。
徳島のスタンフォードはちょっと気になって調べてしまいました。
ただ惜しい。もう一工夫必要かなぁ。

余談ですが、芸能・スポーツ・競走馬には少し詳しくなりました。

おまけ

明日から出社

GW最終日なので。

もっとネガティブなのかと思ったらそこまでではないですね。
小さいですがログインやパスワードを気にしているところはちょっと好きです。

おわり

PR

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です