Как парсить Google, не попав под блокировку

Парсинг Google часто необходим для SEO-анализа, мониторинга цен, сбора изображений или новостей. Так, изучение результатов поисковой выдачи (SERP) позволяет отслеживать позиции конкурентов по ключевым словам, данные из сервиса Shopping — сравнивать цены на товары, а результаты поиска в Google Images или Google News — получать визуальную информацию и следить за Read more…

Что такое цифровой отпечаток браузера

Цифровой отпечаток браузера — это совокупность уникальных характеристик вашего устройства и настроек браузера, которые позволяют идентифицировать его онлайн. Он формируется из информации, автоматически передаваемой при каждом обращении к сайту (HTTP-заголовки и JavaScript-параметры), и остаётся практически неизменным даже после удаления куки или включения приватного режима. Обычно комбинация таких параметров, как операционная Read more…

Web Crawling vs Web Scraping: в чём разница?

В сфере автоматизированного сбора данных из интернета термины web crawling и web scraping часто путают. Обе технологии действительно имеют общие черты, но выполняют разные функции. В этой статье мы подробно рассмотрим, что такое веб-краулинг и веб-скрейпинг, в чём между ними разница и как прокси-серверы помогают избегать блокировок при сборе данных. Read more…