Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Todos Guias A ciência da extração de dados da Web Casos de utilização Engenharia Outros

Artigos mais recentes

Guias

As 11 melhores dicas para evitar ser bloqueado ou ter o IP banido ao fazer web scraping

Com estas 11 recomendações essenciais, vai aprender a fazer web scraping sem ser colocado na lista negra. Acabaram-se as mensagens de erro!

Ștefan Răcilă10 min read

Apr 22, 2026

Engenharia

A descentralização no seu melhor: o modelo DAO da ice Network vs. a falta de controlo dos utilizadores na Pi Network

Compreendendo a diferença entre dois modelos distintos de DAO para a descentralização, estamos a analisar redes semelhantes, mas totalmente diferentes: a ICE e a Pi.

Anda Miuțescu10 min read

Apr 10, 2026

Guias

Como extrair dados do Idealista: Um manual para 2026

TL;DR: Idealista é o maior mercado imobiliário em Espanha, Itália e Portugal, mas está atrás de uma pilha anti-bot séria que bloqueia rapidamente scrapers ingénuos. Este guia mostra como raspar dados do Idealista de ponta a ponta em Python, cobrindo o mapeamento do site, Selenium com undetected-chromedriver, manipulação de DataDome, rotação de proxy e exportações limpas, com os concorrentes de endurecimento de produção geralmente ignoram.

Raluca Penciuc16 min read

May 8, 2026

Guias

Como fazer o Scrape do Yelp com Python: Avaliações, listagens e pipelines de dados prontos para LLM

TL;DR: Este guia orienta-o na construção de um raspador Yelp completo em Python, cobrindo resultados de pesquisa, detalhes de negócios e avaliações com código de trabalho. Você também aprenderá como lidar com proteções anti-bot, exportar dados para CSV ou JSON e alimentar avaliações raspadas em um LLM para análise de sentimentos, algo que nenhum outro tutorial de raspagem do Yelp cobre.

Raluca Penciuc15 min read

Apr 28, 2026

A ciência da extração de dados da Web

10 perguntas sobre raspagem que toda equipe de dados deve responder antes de escrever um raspador

TL;DR: Um projeto de web scraping falha no planeamento muito antes de falhar no código. Estas dez perguntas sobre scraping orientam-no através da legalidade, alternativas de API, defesas anti-bot, custo, cadência de atualização, qualidade dos dados e governação, para que possa definir o âmbito do trabalho, escolher a pilha certa e evitar os modos de falha que matam silenciosamente os scrapers em produção.

Mihai Maxim12 min read

May 8, 2026

Guias

Como extrair dados da Web dos vendedores nas proximidades do Google Shopping com Node.js

Saiba como utilizar o Node.js e a nossa API para extrair dados de vendedores nas proximidades a partir do Google Shopping. Extraia dados valiosos de forma rápida e fácil com o nosso scraper profissional.

Andrei Ogiolan6 min read

Apr 22, 2026

1 2 37928 29 30