Как спарсить сайт?

Grennnick · 14 ноя 2024

Нужно спарсить с сайта 100.000+ данных, но чтобы их достать нужно листать страницу вниз, т.е. нужно перемотать где то 3.4к раз, через selenium дедик сидит вахуе, потому что система перегружается, пробовал через playwright - тоже так себе идея, headless режим положительных результатов не дал. Есть какие еще варианты, как можно спарсить данные?

Passwordll · 14 ноя 2024

нажми cntrl + a и все выделиться

Toil · 15 ноя 2024

глянь по запросам как у них данные получаются при скролле, потом напиши код, который будет отправлять такие же запросы, только, от твоего скрипта. Единственная проблема - всякие генерируемые токены/подписи при запросе, но, если это не прям что-то крупное, то не думаю, что возникнут какие-то проблемы

TheBoossya · 15 ноя 2024

Что значит перегружается? Забивается RAM? Можешь чистить и оптимизировать дерево, но чуть упадет скорость скраппинга. Также, можешь попробовать посмотреть в сторону получения данных по API, вместо скраппинга

umikud · 15 ноя 2024

глянь сначала через консоль разработчка - может там есть прямые ссылки на данные, тогда можно просто через requests забрать. Если нет - используй асинхронные запросы, разбей на мелкие части, добавь задержки и ******. В крайнем случае юзай puppeteer-stealth вместо selenium, он полегче будет.

Авторегер Telegram аккаунтов

Бот для обратной связи с админкой | Обход спамблока.

Бот-помощник для скупки рекламы | Сверка статусов/закрепов + аватарок

DICEBOT для форума | AIOGRAM бот с красивым меню

Неподтвержденные заказы - напоминалка для FPC

Посоветуйте что можно написать из ботов в тг

Триггербот Valorant OPENSOURCE

[Актуально] Юзер Бот - авто покупка подарков телеграм

Софт для генерации OctoBrowser и активации промиков

Софт для смены паролей firstmail

Много мужских имён в .txt файле

Парсер игр с 100% скидками стим

Автостатус в ВК и автобио в Telegram c текущей песней Spotify

Скрипт для скачивания всей музыки ВК + с обложкой + с текстом MusixMatch или Genius

Простейший вечный онлайн ВКонтакте

Pyanty - Веб-автоматизация, модуль для управления долфином через Selenium, и Dolphin API

Emunium - модуль для имитации поведения человека в Selenium/Pyppeteer/Playwright и т.д.

Gram_tools | Утильки для упрощенной разработки ботов на aiogram 3

CryptoScan - python библиотека для мониторинга (приёма) крипто платежей

Телеграм бот для проведения розыгрышей

Скрипт бота сносера на сессиях

[TG DRAIN] Telegram дрейнер

FREE| Telegram Parser | Телеграмм парсер username

[ЛУЧШИЙ] Бот Автопродаж | Телеграм Магазин

Шаблон бота Telegram

Рандомный статус ВКонтакте

Telegram бот: Gemini пересказывает все голосовые сообщения, которые вам приходят в ЛС

Звонки через Userbot в телеграм

Какие вообще платежки можно подключить если <18?

Как можно войти в телеграм аккаунт с помощью Auth Key (HEX) и DC ID. Ищу софт

Как спарсить сайт?