-
Анализ данных крайне востребован в современном бизнесе. Многие компании обладают большими массивами данных, а инсайты о взаимосвязях внутри этих данных становятся серьезным преимуществом в конкурентной борьбе.
Python — наиболее популярный инструмент для анализа данных. Дизайн этого языка позволяет одинаково удобно проверять гипотезы и разрабатывать полноценные приложения. Популярность языка и огромное сообщество его пользователей обеспечивает простой поиск ответов на возникающие вопросы и актуальность необходимых библиотек.
В этом курсе вы узнаете, как применять свои навыки программирования для работы с маркетинговыми данными, формулирования бизнес-гипотез и визуализации данных. Курс ориентирован на практику и позволит вам сразу приступить к работе с данными и построению моделей
Overview
Syllabus
-
- О чем этот курс
- В данном модуле слушатели на примере различных кейсов познакомятся с задачами, которые можно решить с помощью языка Python и с основными методологиями разработки
- Введение в Python
- В данном модуле слушатели узнают как работает язык Python и как структурирована работа с Python в рамках данного курса. Также будут рассмотрены переменные в Python и работа с командной строкой
- Основы Python: базовые конструкции
- В данном модуле слушателя научатся работать с базовыми конструкциями языка Python, такими, как функции, циклы и условия. Разберут представленные конструкции на примерах и узнают в каких ситуациях их использовать
- Основы Python: базовые структуры данных
- В данном модуле слушатели познакомятся с базовыми структурами данных языка Python. Научатся работать со структурами, которые входят в сам язык: списки, словари, кортежи, множества. Также, рассмотрят основы работы со строками и классами
- Библиотека NumPy
- В данном модуле слушатели рассмотрят библиотеку NumPy, сферах ее применения, основных структурах данных и операциях над ними. Также, на практике познакомятся с преимуществами этой библиотеки
- Библиотека Рandas
- В данном модуле слушатели рассмотрят библиотеку Pandas, ее представление табличных данных и работе с этими данными. Познакомятся с техниками заполнения пропущенных данных и рассмотрят сферы их применения
- Библиотека Pandas. Расширенное использование
- В данном модуле слушатели познакомятся с более сложными случаями использования Pandas, конвертации в numpy.array и построят при помощи этого свою рекомендательную систему. Научатся группировать данные и работать со сводными таблицами (pivot tables)
- Визуализация данных
- В данном модуле слушатели научатся строить графики, настраивать отображение элементов на них, объединять графики друг с другом и использовать их как инструмент для анализа реальных данных. В этом помогут библиотеки matplotlib и seaborn
- Разведочный анализ данных
- Данный модуль суммирует все полученные ранее знания и учит применять их на реальной задаче – при анализе успешности маркетинговой кампании. Также слушатели узнают о «выбросах в данных» (outlier), корреляции между признаками и в конечном итоге сформулируют несколько гипотез
- Итоговый модуль