Author Profile

Ștefan Răcilă

Desenvolvedor Full Stack

Stefan Racila é engenheiro de DevOps e Full Stack na WebScrapingAPI, onde desenvolve funcionalidades do produto e mantém a infraestrutura que garante a fiabilidade da plataforma.

Python web scrapingproxy infrastructurebrowser automationGuidesScience of Web Scraping

Ștefan Răcilă, Desenvolvedor Full Stack @ WebScrapingAPI

Published Articles

GuidesApr 29, 202613 min read

Tutorial do Scrapy Splash: Renderizar páginas JavaScript

TL;DR: O Scrapy Splash emparelha o mecanismo de rastreamento rápido do Scrapy com o navegador sem cabeça Splash para renderizar páginas pesadas em JavaScript. Este tutorial do Scrapy Splash guia você através da configuração do Docker, configuração do projeto Scrapy, noções básicas do SplashRequest, scripts Lua para rolagem e clique, integração de proxy e correção dos erros mais comuns que você encontrará.

Read article

GuidesApr 10, 20264 min read

As 11 melhores dicas para evitar ser bloqueado ou ter o IP banido ao fazer web scraping

Domine a técnica de web scraping sem ser bloqueado! Siga as dicas sobre como respeitar os Termos de Serviço, utilizar proxies e evitar bloqueios de IP. Extraia dados de forma ética e legal.

Read article

GuidesMay 7, 202611 min read

Como usar proxies com Python Requests: Do básico à produção

TL;DR: Este guia mostra como usar proxies com Python Requests de ponta a ponta: um ditado de proxies funcionando, URLs autenticadas, variáveis de ambiente, reutilização de sessão, SOCKS5 sem vazamentos de DNS, e um pool de rotação com novas tentativas e um circuit breaker. No final, você saberá quando uma API gerenciada ganha seu sustento sobre um pool DIY.

Read article

GuidesApr 22, 20268 min read

Como criar um rastreador da Web usando Python - Guia para principiantes

Este tutorial irá demonstrar como rastrear a Web utilizando Python. O rastreamento da Web é uma abordagem eficaz para recolher dados da Web, localizando todos os URLs de um ou mais domínios.

Read article

Science of Web ScrapingMay 8, 202613 min read

O que é a automatização do navegador? Um guia prático

TL;DR: A automação do navegador é a prática de conduzir um navegador da Web real ou sem cabeça a partir do código para que ele clique, digite, navegue e leia páginas em seu nome. Este guia explica o que é automação de navegador nos bastidores, compara Selenium, Playwright, Puppeteer e Cypress, e mostra quando não se deve usar um navegador completo.

Read article

Science of Web ScrapingMay 12, 202615 min read

Web Scraping vs Data Mining: Diferenças, pipelines e quando usar cada um

TL;DR: O Web scraping recolhe dados em bruto de páginas Web públicas. A extração de dados analisa dados estruturados para obter padrões, previsões e segmentos. São fases diferentes do mesmo ciclo de vida e a maioria dos sistemas de produção combinam-nas num pipeline de scrape-then-normalize-then-mine.

Read article

Science of Web ScrapingMay 8, 202612 min read

Melhores cursos de Web Scraping para desenvolvedores

TL;DR: Os melhores cursos de web scraping dependem do seu idioma, nível e caso de uso alvo. Este guia compara cinco opções pagas na Udemy, Coursera, DataCamp e Packt, aponta para suplementos gratuitos, como documentos oficiais, e mostra como fazer a ponte entre a conclusão de um curso e a execução de scrapers de produção.

Read article

GuidesApr 22, 202610 min read

As 11 melhores dicas para evitar ser bloqueado ou ter o IP banido ao fazer web scraping

Com estas 11 recomendações essenciais, vai aprender a fazer web scraping sem ser colocado na lista negra. Acabaram-se as mensagens de erro!

Read article

Science of Web ScrapingApr 22, 20266 min read

Guia rápido de seletores CSS - Dicas e truques para extrair dados da Web

Use esta ficha de referência de seletores CSS quando quiser fazer scraping na Web como um profissional

Read article