Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Artigos mais recentes

Raspagem da Web sem ser bloqueado: Manual 2026

TL;DR: Os bloqueios modernos ocorrem em quatro camadas: rede, assinatura do pedido, navegador e comportamento. Diagnostique a camada primeiro usando códigos de status e páginas de desafio e, em seguida, corrija-a com a combinação certa de proxies residenciais rotativos, cabeçalhos de nível de navegador, personificação de TLS, navegadores furtivos e tempo semelhante ao humano. Quando o volume ou a sofisticação anti-bot torna a bricolage pouco económica, transfira a camada de pedido para uma API gerida.

Sergiu Inizian38 min read
May 1, 2026