Только зарегистрированные клиенты, купившие данный товар, могут публиковать отзывы.
Парсинг с помощью Python. Веб-скрапинг в действии. Митчелл. 2025
100 ₽
Данная книга — всеобъемлющее руководство по осознанному парсингу (сбору) любых видов данных из несовместимых источников в современном интернете.
В части I детально рассматриваются веб-скрапинг и веб-краулинг. Основное внимание уделено механике веб-скрапинrа: как с помощью Python отравлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. Особое внимание уделяется использованию нескольких полезных библиотек. Данная часть вполне может послужить подробным справочником по этим библиотекам и методикам (за некоторыми исключениями, по которым будут предоставлены дополнительные ссылки). Описанные здесь приемы окажутся полезны всем, кто пишет веб-скраперы, независимо от конкретной цели и области применения.
В части II раскрываются дополнительные темы, которые также могут пригодиться при написании веб-скраперов, но не всегда и не любых. Исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинrа.
Книга покажет, как:
- анализировать сложные НТМL-страницы;
- разрабатывать веб-сканеры с помощью фреймворка Scrapy;
- хранить данные, полученные с помощью скрапинга;
- читать и извлекать данные из документов;
- очищать и нормализовывать плохо отформатированные данные;
- читать и записывать информацию на естественных языках;
- выполнять поиск по формам и страницам входа;
- выполнять скрапинг JavaScript-кoдa и работать с API;
- писать и использовать программы для преобразования изображений в текст;
- обходить противоскрапинговые ловушки и блокаторы ботов;
- тестировать свои веб сайты с помощью скрапинга.
Эта превосходная и информативная книга учит осознанному и эффективному веб-скрапингу. Я рекомендую ее всем, кто хочет извлекать данные с веб-сайтов или планирует создать веб-сайт для обмена данными.
Райан Митчелл
Отзывы
Отзывов пока нет.