データサイエンティストに求められる力

現在データレイクと呼ばれるデータの湖がそこかしこに存在します。
データレイクとは言わないまでも
共有のファイルサーバーはどこの会社にも存在するかと思います。

フォルダ構成が定義されていない
どこに何があるかわからないファイルサーバー等は、
誰しも思い当たる節があるのではないでしょうか。

データレイクやデータベースなど専門性の強いデータ置き場も同じで、
様々なシステムや人が好き勝手に利用するので、
そこに秩序はなく欲しいデータを取り出すことも、ままなりません。
どこに何があるかを把握していることすら稀でしょう。

「無秩序なビッグデータを資産」という姿は
「ゴミ屋敷のゴミを資産」と言っている姿と被ります。

データサイエンティストの仕事は
手の付けられなくなった大量のデータゴミを上手く処理することであると考えます。 “データサイエンティストに求められる力” の続きを読む