データサイエンティストに求められる力
現在データレイクと呼ばれるデータの湖がそこかしこに存在します。
データレイクとは言わないまでも
共有のファイルサーバーはどこの会社にも存在するかと思います。
フォルダ構成が定義されていない
どこに何があるかわからないファイルサーバー等は、
誰しも思い当たる節があるのではないでしょうか。
データレイクやデータベースなど専門性の強いデータ置き場も同じで、
様々なシステムや人が好き勝手に利用するので、
そこに秩序はなく欲しいデータを取り出すことも、ままなりません。
どこに何があるかを把握していることすら稀でしょう。
「無秩序なビッグデータを資産」という姿は
「ゴミ屋敷のゴミを資産」と言っている姿と被ります。
データサイエンティストの仕事は
手の付けられなくなった大量のデータゴミを上手く処理することであると考えます。 “データサイエンティストに求められる力” の続きを読む