Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Artigos mais recentes

Formulário de envio do Puppeteer: Guia do Node.js para 2026

TL;DR: Utilize page.locator(seletor).fill(value) para scripts de formulários de submissão rápidos e determinísticos do Puppeteer e page.type() quando a página procura por toques de teclas reais (autocomplete, anti-bot, validação em tempo real). Submeter clicando no botão, premindo Enter ou chamando form.requestSubmit(), e esperar sempre por um sinal de sucesso concreto em vez de um tempo limite fixo.

Mihnea-Octavian Manolache14 min read
May 8, 2026

Como construir um Web Scraper com Pyppeteer (Guia 2026)

TL;DR: Pyppeteer é o port não-oficial do Puppeteer para Python e ainda funciona para conduzir um Chromium real a partir do asyncio. Neste guia você vai instalá-lo, escrever um web scraper moderno com Pyppeteer usando asyncio.run e try/finally, lidar com waits, formulários, screenshots, scroll infinito, cookies e proxies, e aprender quando migrar para Playwright, Selenium ou uma API de scraping hospedada.

Mihnea-Octavian Manolache12 min read
May 12, 2026

Como fazer scraping do Walmart.com: Guia de ponta a ponta para 2026

TL;DR: Este guia mostra como raspar os dados de produtos do Walmart de ponta a ponta em Python, desde a análise do JSON __NEXT_DATA__ oculto até o dimensionamento com proxies, novas tentativas e buscas assíncronas. Ele também traça uma linha honesta para quando uma API de raspagem gerenciada supera a DIY.

Raluca Penciuc14 min read
May 12, 2026

15 melhores navegadores antidetecção em 2026: comparação honesta para profissionais de marketing, scrapers e gerentes de várias contas

TL;DR: Os navegadores antidetecção permitem-lhe executar vários perfis de navegador isolados, cada um com uma impressão digital única, para que as plataformas não possam ligar as suas contas. Este guia classifica os 15 melhores navegadores antidetecção de 2026 em termos de qualidade de impressão digital, suporte à automação, preço e integração de proxy. Também abordamos como essas ferramentas realmente funcionam, quando uma API de raspagem é a escolha mais inteligente e qual tipo de proxy deve ser combinado com cada caso de uso.

Mihnea-Octavian Manolache32 min read
Apr 28, 2026