Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Artigos mais recentes

Como fazer scraping do LinkedIn em 2026: um guia Python

TL;DR: Raspar o LinkedIn significa trabalhar em torno de uma parede de autenticação agressiva, rastreamento comportamental e impressão digital TLS. Este guia fornece uma árvore de decisão método por página, padrões Python de trabalho para trabalhos, perfis e empresas (API oculta, JSON-LD, Selenium quando necessário) e uma lista de verificação anti-bloqueio consolidada para 2026.

Suciu Dan14 min read
May 13, 2026

12 melhores ferramentas de raspagem da Web gratuitas em 2026: comparadas

TL; DR: As 12 melhores ferramentas gratuitas de raspagem da web em 2026 divididas em quatro grupos: APIs gerenciadas com créditos gratuitos, estruturas de código aberto, extensões de navegador sem código e extratores de IA. Escolha primeiro por caso de uso (raspagem única vs. pipeline programado) e, em seguida, por nível de habilidade. A maioria dos níveis gratuitos cobre a avaliação, não a produção; no momento em que sua taxa de sucesso cai abaixo de ~90% ou você gasta mais horas em blocos do que em dados, é hora de passar para uma API paga.

Suciu Dan29 min read
May 13, 2026

A raspagem da Web é legal em 2026? Quadro de conformidade

TL;DR: A raspagem da Web é legal? Normalmente sim, com algumas ressalvas. A legalidade depende do tipo de dados, do caminho de acesso, das jurisdições envolvidas e do que se faz com o resultado. Este guia dá-lhe um veredito direto, uma estrutura de cinco minutos antes da recolha de dados, os casos que interessam e uma lista de verificação que pode executar antes de enviar.

Suciu Dan15 min read
May 13, 2026