大学生のためのデータサイエンス(Ⅰ)(ga109)

Go to class
Write Review

Free Online Course: 大学生のためのデータサイエンス(Ⅰ)(ga109) provided by gacco is a comprehensive online course, which lasts for 4 weeks long, 3-4 hours a week. The course is taught in Japanese and is free of charge.

Overview
  • 講座内容

    今日の社会は、情報通信技術の普及により、個人の様々な履歴、各種製造・販売データ、ネットワーク情報などの大量かつ多様なデータが簡単に集められるようになってきました。このビッグデータなど様々なデータを対象とする学問分野がデータサイエンスです。データサイエンスは多くの場面で注目されており、たとえば、様々な行動履歴に基づくタイプ診断、調査・アンケートに基づく顧客の需要予測、不良品の製造・機械の故障に関する予兆検知などに活用されています。

    現在、データサイエンスはほとんどの分野で必要とされているにもかかわらず、データサイエンティストがかなり不足していると言われています。また、データサイエンスを専門的に学ぶ人でなくても、データに基づく意思決定の重要性を認識することが重要です。そこで、「数理及びデータサイエンスに係る教育強化拠点」の拠点校の一つである滋賀大学は「データサイエンス教育の全学・全国への展開」を目的として本講義を開講します。本講義の内容は文系理系を問わず、すべての大学生に学んでもらいたいものとなっています。さらに発展的な内容は「大学生のためのデータサイエンス(II)」で提供予定です。

    この講義では、データの収集・加工・処理、データの分析、分析結果の解釈とその活用というデータサイエンスにおいて重要な3要素について紹介します。特に、理論的な手法だけでなく、様々な応用事例についても紹介しています。

     

Syllabus
  • Week1:現代社会におけるデータサイエンス

    1. データサイエンスの役割
    2. データサイエンスの役割(続)
    3. データの取得・管理 ①データの収集と保存
    4. データの取得・管理 ②データの管理
    5. データの入手方法
    6. データの分析
    7. データサイエンスと画像処理技術 ①デジタル画像の構成
    8. データサイエンスと画像処理技術 ②画像処理の応用
    9. データサイエンスと音声処理技術 ①音声データ処理
    10. データサイエンスと音声処理技術 ②音声認識入門

    Week2:データ分析の基礎

    1. ヒストグラム
    2. 箱ひげ図
    3. 平均・分散・標準偏差
    4. 散布図(2つの量の関係の視覚化)
    5. 相関係数(2つの量の関係の要約)
    6. 回帰直線(2つの量の関係の定式化)
    7. 回帰直線(データの当てはまり)
    8. データ分析で注意すべき点(相関と因果の違い)
    9. データ分析で注意すべき点(観察研究と実験研究)
    10. データ分析で注意すべき点(標本調査)

    Week3:コンピュータを用いたデータ分析

    1. Excelを用いたヒストグラムの作成
    2. Excelを用いた箱ひげ図の作成
    3. Excelを用いた散布図と回帰直線
    4. Rを使ってみる
    5. Rによるデータ分析
    6. Rのさらなる活用
    7. Pythonのインストールと基本操作
    8. Pythonを使ったデータの整理と可視化
    9. Pythonを使ったデータの分析と、より高度な可視化

    Week4:データサイエンスの応用事例

    1. 保険(基本的な仕組み)
    2. 保険(自動車保険)
    3. 金融(銀行におけるデータ活用)
    4. マーケティングリサーチ 概要編
    5. マーケティングリサーチ 企画編
    6. マーケティングリサーチ 事例編
    7. 染色体上で遺伝子を探す
    8. 疾患関連遺伝子を探す
    9. 品質管理