データサイエンス

 データ駆動型社会が到来しています。データを正しく読み取り、その中に潜む意味を科学的に正しく理解して現状を捉える、その上で大局的で客観的な判断をする、データを適切に可視化して他者を説得し企画を進めるなど、データを自ら正しく解釈し活用する力は、あらゆる場面で欠かせないスキルとなっており、統計学・データサイエンスの最小限の知識や思考力は、今や文科系・理科系問わず全ての学生が備えるべき基本的な素養となっています。これが創生学部で全ての学生にこの科目を必修として課している理由です。

 

  今あなたの手元に多数のデータがあり、これを相手と共有したいとします。相手には時間がなく、要するにどうなのか? データを簡単に1つの値、または2つの値で教えて欲しい、と言われたらどうすればよいか(どの値でこのデータ集団を代表させるのが科学的に適切か)? から始まり、この講義では、統計学・データサイエンスの入口となる基礎を理解することを目的とし、統計学・データサイエンスが必要とされる背景や、データを取り扱う上で注意すべき事項(倫理的・法的・社会的課題に関連した事項およびセキュリティ等)、統計学・データサイエンスの考え方や仕組みの概要を学びます。
なお、数式を用いて理解を進める数学以外の理系科目や経済学等の文系科目が数学ではないように、統計学・データサイエンスも数学ではありません。数学は適用範囲を定めない高度に一般化・抽象化された学問体系ですが、統計学・データサイエンスは例えば経済学同様、現実の問題に対処するための「実学」です。最も重要なのは、例えば確率の和・積がどんな条件下で可能か、また確率変数、期待値、確率分布、推定、検定といった統計学に特有の考え方、またその測定や観測との対応関係を理解することです。数学的手法に通じていれば理解しやすくなるのは間違いありませんが、数学が使えるから統計学が理解できるとは限りませんし、逆に数学が苦手でも、統計の考え方を理解することは十分可能です。

 高校までの学習のクセが残っているからか、よく見られるのは、式が追えない等があるとそこで思考を止めてしまうことなのですが、細かい部分が分からなくても一旦置いておいて、本質部分の考え方を見逃さないよう心掛けて下さい。例えば連続型確率分布の場合には無限や極限、ネイピア数(e)など、数学IIIの学習内容が含まれます。実はこれらは、本質部分の理解には「置いておいて」よい事項です。枝葉部分を見極め、時に捨て去るある種の大胆さは、統計学・データサイエンスに限らず大学以降の学びでは共通して重要な能力とも言え、あとは実践を通して不足する知識を補う、を繰り返して行けば、今後様々な場面で統計学を「活用する力」が身につきます。

 また、統計分野は様々な教材が書籍やネット記事として手軽に入手可能です。自分に合ったものを選んで、何となく、でよいのでイメージを持ってから授業に臨むと、理解度が格段に高まると思います。

 なお、数学や確率・統計に苦手意識がある場合は、データサイエンス概説演習を併せて履修することをお勧めしております。