データサイエンティストとは?
データサイエンティストは、近年できた新しい職種です。「ビッグデータ」と呼ばれる大規模なデータを蓄積できるようになり、増えてきました。
主にITやビジネスに関係するデータ分析、マーケティングを行う専門家です。IT技術の発展や通信網の整備、通信の高速化により、「ビッグデータ」の蓄積や分析が可能となりました。ビッグデータを分析し、活用するときに活躍するのがデータサイエンティストです。
データサイエンティストが行う主な業務は、そもそもどのようなデータを取得すべきなのかという設計からデータ収集、データ運用、データ分析、レポート作成、課題解決です。その中には、分析者として必要なスキルだけでなく、プログラミングや、顧客とのコミュニケーションなどのスキルが必要になります。
データサイエンティストに必要なスキル
データサイエンティストとひとくちに言っても、企業によって定義や要件が異なるため、一概には言えないのですが、多くの場合、データサイエンティストにとって必要なスキルは以下のようなものになります。
幅広いITに関する知識
データの収集・分析などにおいてIT技術は必ず必要です。人がつくったシステムを利用する場合でもデータの収集方法を自分たちが使いやすいようにカスタマイズしたり、セキュリティ対策を考えたりITに関する知識が必要です。
ビッグデータに関する知識
ビッグデータは日々進化しています。活用方法についてもまだ模索中のところもあります。ビッグデータの知識を身に着けるだけでなく、最新情報にもアンテナを張り巡らせておく必要があります。単に収集・分析するだけでなく、効率的に大規模データを取り扱うことができれば、処理時間の短縮など短時間で分析を完了することができます。
プログラミング
データサイエンティストの仕事には、ビッグデータのログを収集したり、バッチ処理によって繰り返し業務の効率化を図ったり、プログラムを作成、利用する機会が頻繁になります。そもそもビッグデータを扱うので、データチェックを人の手で行うのは非常に大変なため、プログラムを自分で作成して業務を効率的に進めることが重要になります。
RやPyhthonのようなオープンソース系の言語が最近ではよく使われているようですが、最近はPhthonが主流になりつつあるように感じています。
データサイエンティストに求められるプログラミングスキルに関しては、別の記事で紹介しておりますので、詳しくはそちらをご覧ください。
統計解析の知識
データを分析する上で、欠かせないのが数学の統計解析の知識です。その中でも、統計、確率、微分積分に関しては頻繁につかわれます。高校卒業レベル、できれば大学レベルの知識がのぞまれています。基本的には、エクセルやプログラムを作成して計算させるので、記憶している必要はなく、このような時にはこの数式を使えばよいというのがわかっていれば問題はありません。
データ分析手法
データ分析にはさまざまな手法があります。統計処理手法、データマイニング手法、回帰分析など非常に複雑な手法が多いです。これらの手法を手計算で解ける必要はありません。必要ならば分析ツールを使えば良いです。その分析ツールを使えるようになっているというのが重要です。
ビジネスの目的を正確に把握する
データサイエンティストはビッグデータを収集し、分析を行うことで課題解決をはかります。そこで重要となるのが、ビッグデータの対象となっているビジネスの目的です。目的にあったデータ分析を行わないと効果は生まれません。ビジネスの目的をえる方法はコミュニケーション力と理解力にあります。目的が明確になるまで顧客とのコミュニケーション力が重要になります。顧客がいっていることを正しく理解するスキルも重要になります。
コミュニケーション力
ビジネスを理解するところでも出ましたが、データサイエンティストは分析した結果をわかりやすく他人に伝える必要があります。いくら良い分析をしていてもそれが顧客にうまく伝わらなければ効果は半減です。自分の言いたいこと、顧客が知りたいことを伝えるコミュニケーション力も重要です。
データサイエンティストのスキルまとめ
データサイエンティストとして転職する際に必要となるスキルは以上のようになります。ここでは紹介しませんでしたが、Deep Learningの実装経験やフレームワークの知識を求められるケースもあり、機械学習エンジニアとしての役割を求められるケースもあります。
求人要項を作成する企業側の採用担当者の知識が追い付いていないケースもあり、採用企業側の要件がはっきりしないケースもあるため、転職する際には実際に面接に行き、しっかりと話をすることが重要です。