Загрузка...

[Udemy] Парсинг и анализ данных на Python: от азов до автоматизации [Центр digital-профессий ITtensi

Тема в разделе Python создана пользователем Slomosa 21 фев 2020. 320 просмотров

  1. Slomosa
    Slomosa Автор темы 21 фев 2020 Заблокирован(а) 1181 17 ноя 2019
    [IMG]

    Парсинг и анализ данных на Python: от азов до автоматизации
    Научимся работать с pandas, импортировать и майнить данные из Сети, строить графики и картограммы, создавать отчеты

    Язык: Русский
    Автор: Центр digital-профессий ITtensive
    Лекций: 48
    Продолжительность: 8 часов

    Чему вы научитесь
    Описание
    Центр digital-профессий ITtensive предлагает персонализированные программы с индивидуальными наставниками для освоения актуальных профессий будущего: аналитик данных на Python и программист больших данных.

    Курс состоит из 4 больших частей.

    1. Анализ данных

    Вы изучите работу с импортом, объединением, преобразованием, фильтрацией данных на pandas, а также научитесь предсказывать тренды.

    Вы сможете самостоятельно загружать данные в формате CSV, TSV, Excel, извлекать из них значения, находить взаимосвязи между разными наборами данных, преобразовывать и усекать наборы данных. В заключении вы освоите математический аппарат линейной регрессии для поиска линейной связи между данными и эффективно примените его для предсказания значений в будущем.

    2. Парсинг данных

    Вы изучите получение данных в Python, используя библиотеку requests API и форматы JSON и XML (включая SOAP).

    Научитесь работать с неструктурированными данными в HTML, собирать их и преобразовывать в фреймы данных.

    Научитесь собирать данные целиком с сайта в несколько потоков: создадим мультипроцессного робота-паука.

    В завершении установите SQLite и загрузите все собранные данные в базу, а также научитесь выбирать из базы данных непосредственно в фреймы данных.

    3. Визуализация данных

    Вы изучите анатомию matplotlib и типы визуализации различных данных: линии, области, столбцы, круговые диаграммы.

    Научитесь визуализировать зависимости между данными и линейную регрессию с помощью seaborn: построите ящичковые и парные диаграммы, диаграммы распределения.

    Изучите визуализацию временных (хронологических) данных: ряды, скользящие средние, отклонения и "японские свечи".

    В завершении разберете работу с гео-данными и построение фоновых картограмм по нескольким наборам данных, используя geopandas.

    4. Генерация отчетов и автоматизация

    В этом курсе вы научитесь создавать и преобразовывать PDF *********, генерировать их из HTML кода, используя шаблонизатор, отправлять отчеты по e-mail и автоматизировать работу.

    В курсе используются библиотеки reportlab, pypdf2, pdfkit, jinja2, smtplib, email, binascii, io, а также бинарный файл wkhtmltopdf. Решаем задачи по созданию PDF документа через холст, разбору PDF документа, объединению PDF документов, созданию HTML и PDF документов из HTML, шаблонизации HTML через jinja2, преобразованию бинарных данных в base64-кодировку. В заключении разберем отправку e-mail, включая HTML-письма и вложенные PDF отчеты.

    Ограничение ответов в теме:
    Автор темы разрешил отвечать в теме только этим группам (и вышестоящим): Местный, Команда форума и Кураторы.
     
Загрузка...
Top