Загрузка...

Incorrect encoding when parsing

Thread in Python created by SvetoCopy May 28, 2020. 288 views

  1. SvetoCopy
    Парсил один русско-язычный сайт по типу "онлайн-блаблабла.рф".В этом сайте мне нужно спарсить все ссылки стихов авторов(Лермонтов для примера).Эти ссылки были соответственно русскими(онлайн-блаблабла.рф/лермонтов/блаблабла.html)
    Но эти ссылки у меня парсяться всем известными непонятными символами,когда не поставил кодировку.
    Работал с lxml и requests на pycharm.
    Помогите плез
     
  2. Maxim_05
    Maxim_05 May 29, 2020 Banned 1 May 28, 2020
    Платно или как?
     
  3. Kyber_Zero
    Kyber_Zero May 30, 2020 Dead Inside 5 Jan 21, 2018
    SvetoCopy, Скорее всего это utf-8 или b64+utf-8. ".decode('utf-8')" в помощь. Ну и гугл
     
    1. SvetoCopy Topic starter
      Kyber_Zero, делал так,не помогает
    2. Kyber_Zero
      SvetoCopy, скинь сюда или в лс вывод консоли
Top
Loading...