Загрузка...

Неправильная кодировка при парсинге

Тема в разделе Python создана пользователем SvetoCopy 28 май 2020. 285 просмотров

  1. SvetoCopy
    Парсил один русско-язычный сайт по типу "онлайн-блаблабла.рф".В этом сайте мне нужно спарсить все ссылки стихов авторов(Лермонтов для примера).Эти ссылки были соответственно русскими(онлайн-блаблабла.рф/лермонтов/блаблабла.html)
    Но эти ссылки у меня парсяться всем известными непонятными символами,когда не поставил кодировку.
    Работал с lxml и requests на pycharm.
    Помогите плез
     
  2. Maxim_05
    Maxim_05 29 май 2020 Заблокирован(а) 1 28 май 2020
    Платно или как?
     
  3. Kyber_Zero
    Kyber_Zero 30 май 2020 Dead Inside 5 21 янв 2018
    SvetoCopy, Скорее всего это utf-8 или b64+utf-8. ".decode('utf-8')" в помощь. Ну и гугл
     
    1. SvetoCopy Автор темы
      Kyber_Zero, делал так,не помогает
    2. Kyber_Zero
      SvetoCopy, скинь сюда или в лс вывод консоли
Top
Загрузка...