Программирование на языке Python. Анализ и визуализация данных на языке Python. Библиотеки Pandas, numpy, Matplotlib
Описание курса
Курс позволит позннакомиться с основными библиотеками для анализа данных Pandas, NumPy и matplotlib, расcчитанных на опытных программистов на Python.После прохождения курса слушатели смогут:
- Использовать средства модуля NumPy для работы с массивами чисел и матрицами
- Работать с библиотекой Pandas для анализа данных
- Визуализировать данные в таблицах данных (dataframe) библиотеки Pandas при помощи библиотеки matplotlib
Целевая аудитория
Разработчики, администраторы операционных сетей и баз данных, аналитики данных, имеющие предварительный опыт программирования на Python.Минимальные требования
Для эффективного обучения на курсе, слушатели должны обладать знаниями и навыками в объеме курсов "Программирование на Python: Базовый курс" и "Программирование на Python: Продвинутый уровень"Содержание курса
.Модуль 1: Установка и настройка программного обеспечения. Базовый инструментарий. (4 ак. ч.)
- Принципы организации и управления вычислениями. Используемые языки программирования и взаимосвязь между ними.
- Необходимые пакеты Python: numpy, Matplotlib, Pandas, Jupyter и другие.
- Дистрибутив Anaconda, его преимущества и недостатки.
- Установка пакетов в Linux.
- Установка пакетов в Windows. Возможные проблемы и методы их решения.
- Понятие массива и его основные характеристики.
- Структура библиотеки.
- Типы данных библиотеки numpy.
- Принципы вычислений.
- Универсальные функции.
- Важнейшие стандартные функции.
Модуль 3:. Практикум. (8 ак. ч.)
Работа с массивами и матрицами.
Модуль 4:. Библиотека Matplotlib. Визуализация данных. (4 ак. ч.)- Виды графиков и диаграмм.
- Основные элементы диаграммы.
- Создание диаграммы.
- Форматы изображений.
- График функции.
- Гистограмма.
- Объект Series.
- Объект DataFrame.
Первичная обработка данных.
- Загрузка и выгрузка данных.
- Организация колонок и строчек.
- Пропуски и повторы.
- Типы данных для представления времени.
- Объект Period.
- Основные операции статистики.
Статистика. Объединение и переформирование данных.
- Объединение данных.
- Сцепление и наложение (concatenating and stacking).
- Слияние (merging and joining).
