Загрузка...

Парсер на python

Тема в разделе Python создана пользователем Coskaua 3 сен 2020. 505 просмотров

  1. Coskaua
    Coskaua Автор темы 3 сен 2020 0 11 июн 2019
    здравствуйте кодеры , я новенький в деле парсеров , и хотелось бы что-бы мне кто нибудь помог и скинул даже самый примитивный парсер на python (можно в телеграмм @mierdajodida)
    (пожалуйста не пишите по типу - ' посмотри в ютубе ' :duck_knife:)
     
  2. Morn1ngStar
  3. Паспорт_inactive3516618
    Паспорт_inactive3516618 3 сен 2020 Заблокирован(а) 2 3 сен 2020
    не смотри в ютубе
     
    1. Reverlight
  4. Кефтеме
    Кефтеме 4 сен 2020 1097 20 июл 2020
    Загугли примитивный парсинг с модулем BeautifulSoup4
     
  5. Valera22840
    Valera22840 4 сен 2020 67 17 сен 2017
    как пример мне очень зашел этот видос - (не реклама)
     
  6. Reverlight
    Reverlight 5 сен 2020 Пью чай 27 23 июл 2020
    Здесь сразу суп советуют, но если вы новичок вам нужно понять основы или если говорить по другому суть того что происходит.
    Поучите HTML и css чтобы понимать разницу между тем как сайт видим мы и компьютер. Потом сделайте запросы по сайту get и получите ваш первый документ html.
    Дальше приходит мысль что HTML это огромный набор лишних тегов для нашей работы, и чтобы залесть в значение тега нужно использовать уже soup к примеру.
    Потом развиваемся дальше учим js, понимаем что многие сайты просто не дадут нам данные если не эмклировать js, а проще всего это делать через эмуляцию браузера к примеру selenium.

    Я раскатал это полотно не чтобы напугать (не подумайте), а чтобы объяснить что если вы пойдёте в selenium не зная что такое запросы и акк приходят данные и как они парсяться вы потеряетесь очень быстро. Поэтому request + html наше все для начала.
    Конкретно откуда брать инфу сейчас не скажу, но думаю вполне хватит уроков на том же ютубе для начала если идти в твой очерёдности что я рассказал. Ещё можно (даже нужно) в итоге читать документацию библиотек но это само придёт я думаю.
     
Top
Загрузка...