Сбор и анализ данных в Python

Go to class
Write Review

Free Online Course: Сбор и анализ данных в Python provided by Coursera is a comprehensive online course, which lasts for 5 weeks long, 22 hours worth of material. The course is taught in Russian and is free of charge. Upon completion of the course, you can receive an e-certificate from Coursera.

Overview
  • В этом онлайн-курсе НИУ ВШЭ мы познакомимся с базовыми понятиями статистики, научимся аккуратно собирать данные, обрабатывать их и визуализировать. Также мы поговорим про базовые теоремы, которые используются в математической статистике: ЗБЧ и ЦПТ.

    В онлайн-курсе мы изучим основы математической статистики и аккуратную работу с данными.

    Мы научимся собирать и обрабатывать данные с помощью Python, поговорим про их визуализацию и предварительный анализ.

    Мы также познакомимся с основными распределениями и описательными статистиками, с которыми аналитики сталкиваются на повседневной основе. И обсудим теоремы, на которых базируется вся наука о данных: закон больших чисел и центральную предельную теорему.

    Github со всеми материалами курса: https://github.com/FUlyankin/matstat_online

    Курс состоит из 5 недель. Каждая включает в себя несколько коротких видеолекций (суммарная продолжительность – от 60 до 100 минут), тест на знание теоретического материала (5 – 15 вопросов), а также тест, включающий в себя выполнение заданий по программированию и решение теоретических задач.
    На некоторых неделях задание по программированию заменено заданием на взаимное оценивание. В конце курса предусмотрен итоговый экзамен, состоящий из тестовых вопросов.

Syllabus
    • Распределения и описательные статистики
      • Вспоминаем основные определения из теории вероятностей. Говорим про описательные статистики. Пробуем делать в python простые вещи, связанные с визуализацией, случайными величинами и табличками.
    • Особенности в данных
      • Говорим про зависимые случайные величины, нормальное распределение и проблемы в данных.
    • Сбор и очистка данных
    • Разведочный анализ данных и визуализация
      • Анализируем данные по мемам и логи магазина. Смотрим на пайплайн знакомства с данными.
    • Закон больших чисел и центральная предельная теорема
      • Говорим о том, какими бывают сходимости случайных величин, учимся решать задачи с помощью симуляций.