Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Artigos mais recentes

Raspagem da Web com Scrapy: Manual 2026

TL;DR: Este é um guia opinativo, de ponta a ponta, para raspagem da web com Scrapy em 2026. Você instalará o Scrapy, criará protótipos de seletores no shell, construirá um spider de comércio eletrônico de várias páginas, limpará itens com Item Loaders, persistirá em um banco de dados, fortalecerá as configurações contra proibições e incluirá o Scrapy-Playwright para páginas renderizadas em JavaScript.

Mihai Maxim18 min read
May 13, 2026

Como executar JavaScript com o Scrapy

Está com dificuldades em extrair dados de sites dinâmicos com o Scrapy? Neste artigo, vamos explorar várias soluções para lidar com a renderização em JavaScript. Saiba como utilizar plugins como o Splash e o Selenium para levar o seu projeto Scrapy a um novo patamar.

Mihai Maxim5 min read
Apr 22, 2026

Axios Set Headers in 2026: O manual do programador

TL;DR: Axios define cabeçalhos em cinco camadas, configuração por requisição, padrões globais, instâncias axios.create(), interceptores de requisição e resposta, e a própria resposta. Este guia percorre cada camada com trechos executáveis da v1 e, em seguida, corrige os quatro bugs que afetam a todos: limites de várias partes, cookies CORS, certificados auto-assinados e revestimento de cabeçalho.

Mihnea-Octavian Manolache18 min read
May 12, 2026

Melhores proxies residenciais rotativos em 2026 para raspagem da Web

TL;DR: Os melhores proxies residenciais rotativos em 2026 não são os que têm o maior tamanho de pool de outdoors. Eles são aqueles cujo controle de sessão, segmentação geográfica, fornecimento ético e economia por GB realmente correspondem aos alvos que você raspa. Este guia fornece uma estrutura de avaliação neutra do fornecedor, uma tabela de comparação de 12 fornecedores e um mapa de casos de uso para que você possa selecionar dois ou três antes de tocar em um cartão de crédito.

Anda Miuțescu12 min read
May 14, 2026

Web Scraping com JavaScript e Node.Js

Os programadores estão a usar web scrapers para todos os tipos de obtenção de dados. Vamos mostrar-lhe como construir o seu próprio Web Scraping com JavaScript.

Robert Sfichi15 min read
Apr 28, 2026

Web Scraping com Node-Unblocker: Um guia prático

TL;DR: O Node-unblocker transforma um aplicativo Express em um proxy HTTP com prefixo de URL que você pode hackear. Este guia de desbloqueio de nó de raspagem da web percorre a instalação, conectando middlewares de solicitação e resposta, instâncias rotativas, implantando no Docker ou Heroku e reconhecendo o ponto em que uma API de raspagem gerenciada é a resposta mais limpa.

Sorin-Gabriel Marica12 min read
May 1, 2026