Загрузка...

CURL,Проксирование

Тема в разделе Backend создана пользователем GodCods 29 ноя 2022. 128 просмотров

Загрузка...
  1. GodCods
    GodCods Автор темы 29 ноя 2022 Заблокирован(а) 75 20 сен 2014
    В Общем господа! Ищу помошника кто поможет разобраться в проксировании и курле, не бесплатно! задача спарсить онион сайт пишите в тг!
     
  2. Joker9019
    Joker9019 4 дек 2022 Заблокирован(а) 3 27 ноя 2022
    GodCods,

    <?php
    // Указываем URL страницы, с которой будем парсить данные
    $url = 'https://www.onion.com/';

    // Инициализируем cURL сеанс
    $ch = curl_init();

    // Устанавливаем URL и другие необходимые параметры
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

    // Выполняем запрос и получаем ответ
    $response = curl_exec($ch);

    // Закрываем cURL сеанс
    curl_close($ch);

    // Используем DOMDocument для парсинга ответа
    $dom = new DOMDocument();
    @$dom->loadHTML($response);

    // Получаем все элементы с тегом h1
    $h1Elements = $dom->getElementsByTagName('h1');

    // Перебираем все элементы и выводим их текст
    foreach ($h1Elements as $h1) {
    echo $h1->nodeValue . '<br>';
    }
    ?>

     
  3. Shadowraze
    Shadowraze 4 дек 2022 685 15 июл 2018
    Парсить с помощью php это боль, питон в этом более гибкий и удобный язык
     
    1. Joker9019
      Shadowraze,

      import requests
      from bs4 import BeautifulSoup

      # Указываем URL страницы, с которой будем парсить данные
      url = 'https://www.onion.com/'

      # Выполняем запрос и получаем ответ
      response = requests.get(url)

      # Используем BeautifulSoup для парсинга ответа
      soup = BeautifulSoup(response.text, 'html.parser')

      # Получаем все элементы с тегом h1
      h1_elements = soup.find_all('h1')

      # Перебираем все элементы и выводим их текст
      for h1 in h1_elements:
      print(h1.text)

      Вывод:

      The Onion

      на пайтон
  4. sorrybaby
    sorrybaby 4 дек 2022 Заблокирован(а) 216 24 ноя 2020
     
Top