Perspetivas e Engenharia

Análises aprofundadas sobre a infraestrutura de dados da Web, técnicas de extração e o futuro dos dados estruturados em grande escala.

Artigos mais recentes

Web Scraping em Ruby: O Tutorial Definitivo

O que se obtém quando se junta Ruby, um conjunto de gems úteis e algumas horas? A resposta: um scraper web bastante bom. Aqui está um guia passo a passo:

Raluca Penciuc9 min read
Apr 22, 2026

Web Scraping com PHP: Um Guia Prático de Bibliotecas, Código e Melhores Práticas

TL;DR: O PHP é uma linguagem perfeitamente capaz de fazer scraping da web, graças às extensões embutidas como cURL e DOMDocument, além de um rico ecossistema Composer que inclui Guzzle, Symfony DomCrawler e Symfony Panther para navegação sem cabeça. Este guia o orienta por todo o fluxo de trabalho: buscar páginas, analisar HTML, armazenar resultados em CSV/JSON/MySQL, tratar erros e evitar bloqueios.

Sorin-Gabriel Marica19 min read
Apr 30, 2026

Como construir um rastreador da Web em Python: Do início à escala

TL;DR: Um web crawler python automatiza o trabalho tedioso de seguir links em um site para descobrir e coletar conteúdo. Este guia orienta-o na construção de um de raiz com pedidos e BeautifulSoup, passando depois para Scrapy para rastreio concorrente, pipelines de itens e exportações de dados estruturados. Você também aprenderá como rastrear de forma responsável, girar proxies para evitar bloqueios e lidar com páginas renderizadas em JavaScript.

Suciu Dan31 min read
Apr 30, 2026