Загрузка...

Парсер ссылок на Python

Тема в разделе Python создана пользователем renameduser_122026 24 авг 2019. 275 просмотров

  1. renameduser_122026
    renameduser_122026 Автор темы 24 авг 2019 46 3 июн 2017
    В общем, пишу одну штуку на пайтоне с использованием Selenium.
    Мне нужно спарсить опредленные ссылки, продемонстрирую на примере лолза:
    есть ссылки на темы типа: lolzteam.net/threads/12345, если она была уже прочитана, то она будет выглядеть так: lolzteam.net/threads/12345/unread
    Так вот, нужно спарсить ссылки только не прочитанные и записать их в файл, возможно ли такое сделать непосредственно в Selenium?
    И желательно с кусочком кода, я в долгу не останусь :)
     
  2. MortiZ
    MortiZ 25 авг 2019 542 13 май 2017
  3. Kyber_Zero
    Kyber_Zero 25 авг 2019 Dead Inside 5 21 янв 2018
    renameduser_122026, Два вопроса - откуда будешь брать ссылки и мб выберешь другой модуль? Например bs4 + requests
     
  4. renameduser_122026
    renameduser_122026 Автор темы 25 авг 2019 46 3 июн 2017
    Да я решил вопрос, через requests/grab сайт ругался на отключенный JS, помогла библиотека requests-html, годная штука, поддерживает хромиуим и JS, можно спросить все ссылки буквально за 3-4 строки кода
     
  5. Rostil
    Rostil 25 авг 2019 Дай личный! 504 12 ноя 2018
    Если request-html поддерживает js & chromium тогда тебе большое спасибо!
    --- Сообщение объединено с предыдущим 25 авг 2019
    Я посмотрел документацию, спасибо тебе большое я долго рылся как парсить js, но никак немог найти! Press F to pay respect :press_f::press_f::press_f:!
     
Загрузка...
Top