相変わらずTwitterでフォロバさん(フォローしたらフォローを返してくれる人)を探しています。
フォロバ率を上げるため今回は最終ツイート日を用いて検証してみようと思います。
全体を見たい方はこちら → 隠れフォロバさんを探せ!!–ツイッターフォロワー獲得プロジェクト
前回のおさらい
前々回の検証で、FF比(フォロー数/フォロワー数×100)が98%~102%の人を
フォローしてくとフォロバ率は約25%(フォローしていないのにフォローしてくれた人も含む)であることがわかっています。
さらに前回の検証で、
- フォロー数・フォロワー数は対数正規分布
- 中央値(山の凸部分)はフォローしてくれる人もしてくれない人もほぼ同じ
- 100人以下と3万人以上のフォロワーの人を取り除けばフォローバ率を上げられそう
ということがわかりました。
しかし100人以下のフォロワーの人を除外する気にはなれません。
また、フォロバさんとそうでない人のヒストグラムに少し特徴があることがわかりました。
青のヒストグラムがフォロバさんでオレンジが
ノットフォロバ(フォローを返してくれなかった人)さんです。
赤枠の部分にご注目ください。
ノットフォロバさんをうまく除外できるかを試みます。
右側の赤枠は単純にフォロワー数(3万人以上)で取り除けますが問題は4付近の赤枠ですね。
フォロワー数が100人(4.6未満)未満の人なので
もしかしたらTwitterを辞めているのでは?
という当たり前すぎる仮説を検証していきます。
最終ツイート日からの経過日数の検証
TwitterAPIでユーザーの最終ツイート日が取れるので実装しました。
データの外観は以下の通りです。datediffが最終ツイート日からの経過日数です。
一度も発言していない人はdatediffが44521になっています。
ExcelのDATEDIF関数を使ったらこんな値になりました。
異常データであることが分かればよいのでこのままで行きます。
50パーセンタイルで最終ツイート日からの差が4日。
75%タイルで49日とうまく行けば1/4くらいのデータはフィルタできそうです。
では、ヒストグラムを出してみます。
データ全体のヒストグラム
例によって面白くないヒストグラムが出来上がりました。
全く発言していない人の割合を見る位にしか使えません。
対数変換ですね。今回は計算しやすいように底は2で行きます。
データ全体のヒストグラム(対数変換)
正規分布とは言えません。
しかし複数のグラフが重なっているように見えます。
ノットフォロバさんとフォロバさんの分離
フォロバさんとノットフォロバさんで色付けしてみます。
ついでにbins(=50)にしています。
ノットフォロバさん(オレンジ)が特徴的です。
5付近からノットフォロバさんが増えますね。
つまり32日以上発言していない人のフォロバ率はぐっと下がると考えられます。
一年以上発言していないのに僕をフォローし返してくれた変わり種もいらっしゃいます。
ただ、発言しない人とつながっても情報は得られないのでざっくりフィルタします。
32日以内でフィルタ
最終ツイート日を32日以下でフィルタした結果は以下の通りです。
もっと短くしても良さそうですが今回はこの辺にしておきます。
ついでに冒頭でフォロワー数のヒストグラムを出しましたが、
最終ツイート日を32日以内でフィルタしてみます。
フォロバさんとノットフォロバさんのヒストグラムにほぼ差がなくなりました。
あとは、フォロワー3万人以上(≒10.3~)をフィルタすれば完璧ですね。
まとめ
32日以内に発言している人のフォローバック率は高そうです。
ちなみに最終ツイート日を32日以下で絞り込んだら
- フォロバさん:164人
- ノットフォロバさん:179人
で、フォロバ率は48.7%でした。
この水準まではいくのではないか。行ってほしいなぁ。。。
98%~102%に絞り込んでるのでもうちょい行ってくれても良いのですが、まだ少し違和感です。
しばらく今回のフィルタ条件を加えて自動フォローしてみます。
続編 → 隠れフォロバさんを探せ⑥ – 勝手にフォローさんは何者?
隠れフォロバさんを探せ⑤ – 最終ツイート日を検証
おわり
コメントを残す