データサイエンティストとプログラマー


お疲れ様です。僕です。
先日データサイエンティストと
名乗る外国人とお会いしがっかりしたのでご報告です。

結論から言うとビッグデータは
現在存在しない何かに頼らざるを得ない状況です。
つまりビッグデータと切っても切り離せないIoTは完全に出口を見失っています。
なので、出し抜けば大穴を開けられるかもしれません。

一体どういうことかと申しますと・・・

存在しない何かとは

簡単にいうと
巨大なデータを分析することができる何か
です。

現在候補として挙がっているのは以下でしょうか。
①データサイエンティスト
②機械学習やディープラーニング

巨大なデータについて

話は変わりますが議事録面倒ですよね。
滅多に見ないのに書かないと
あの時どういう風に決まったかの証拠がない。
言った言わないの水掛け論より議事録の説得力。
しかしそれだけの為に議事録を書かないといけないのでしょうか。

例えば技術の進歩の方向によっては
以下のようなことが起こるかもしれません。

(フィクションです)
とある会社では、
議事録をIoTで動画収集し
会議内のワードの出現回数を確認。
不要ワードと生産性の関係を可視化し
会議の生産性が10倍になったと謳っています。

そうか、これからの時代は議事録IoTだ!
議事録面倒だしIoTで会議を全て録画しよう。
最近話題だし、IoTに上げれば色々できるみたいよ?

こうして、A社の議事録IoTへの挑戦が始まりました。
様々なツールが揃っており動画をサーバーに上げること自体は簡単でした。
最初は新人が議事録動画を眺めて会議内のワードをエクセルにまとめます。
何となく会議内のワードトップ100が出ていけそうと感じたので
気を良くしたA社は全会議に横展開します。

しかしどんどんたまる議事録はすぐに消化不良になります。
一つずつ順番に見てワードを取り出すことは最早不可能。

必死でまとめていた会議ワードもまとめていた新人くんも虫の息。
残業時間だけでは間に合いません。

周りからも言われるようになります。

もう会議内ワードTOP100なんか見たくない。
「お疲れ様です」がトップなのはもうわかった。
そんなことに一体いくらかける気だ!!

相変わらず手書きメモの議事録はなくなりません。

巨大なデータを分析する技術 – AI

(フィクションが続きます)
切り札AIもまだまだ未成熟。

「結果は出せても理由が説明できない。精度も良いとは言えない。」
と、「YesともNoとも言わない」日本人みたいな技術です。
なんとも煮え切りません。

「ビール」と「オムツ」みたいな予想外のキーワードを導き出してほしいのに。
この大量の議事録データ。何とか使い道はない物か。

機械学習やディープラーニングは使うにも
高度な技術や知識が必要になります。

他にもOpenCVなどを使って発言者の顔を切り出し
音声認識させたものを形態素解析させてタイムスタンプを利用して紐づける手法が世間を賑わしている様です。
それができれば発言ワードと発言者の紐づけが自動でできる・・・かもしれない。

プログラマーでもないおじさんに一体どうしろと。

巨大なデータを分析する人 – データサイエンティスト

(フィクション終わり)
IoTを議事録に例えてみましたが、
議事録の動画データが設備の電力量に変わろうが同じことです。
分析してグラフ化を自動化するというのはまだまだ時間がかかりそうです。
そこで登場するのは人ですね。
本当に人間の融通の利きっぷりには頭が下がります。

21世紀最もセクシーな職業に選ばれ
一躍脚光を浴びた「データサイエンティスト」
名前も何かカッコいいしレア感もすごい。

では「データサイエンティストって何?」という話ですが、
偉い人のお言葉を拝借します。

データ・サイエンティストとは、さまざまな意思決定の局面において、データにもとづいて合理的な判断を行えるように意思決定者をサポートする職務またはそれを行う人のことです。
データ・サイエンティストとは?

です。

言い得て妙ですが「データにもとづいて合理的な判断を行えるように意思決定者をサポートする」が曲者です。
グラフ化することと考えている人は一生答えに辿り着きません。

傾向があるかどうかも分からないデータとにらめっこし、
様々な切り口で仮定を検証し効果的な見せ方を何度も考え練り直すことです。
どんな情報を出すか、どんなグラフで見せるかを考えるのも役割ですし
「どんなグラフが見たいですか?」なんて質問するのは論外です。
ユーザーが見たいのは「生産性が上がる何か」です。
これまでにない気付きを期待しています。

今後、IoT患者がすがるのが
データサイエンティスト
です。

颯爽と現れた今世紀最もセクシーな職業

巨大なデータを取り出す技術に長け
大量の情報から何らかの傾向を見出すことができ
どういう風に見せれば良いかの知見も持っていて
可視化する技術やプログラミングの技術を持っていて
統計などの数学的知識も保有しており
AI関連にも造詣が深い

本当にそんなやつがいるのか?
少し疑問はよぎりますが最早ワラにも縋る思い。
IoTから解放されるのであれば怪しいツボとか水だって買います。

何故なら超高速で増え続けるゴミを抱えているから。

しかしデータサイエンティストを名乗る外国人もいまいちでしたね。
結局「どんなデータがみたいですか?」と聞いてくる人でした。

まとめ

今年はデータサイエンティスト詐欺が流行りそうですね。
まぁ騙されたと思わなければ詐欺は詐欺じゃないので
会社同士であれば詐欺ではなく失敗プロジェクトでしょうかね。

僕はその辺に救いの手を差し伸べようかと思います。
そう僕は神。

おわり


カテゴリーIT

コメントを残す

メールアドレスが公開されることはありません。