Author Profile

Mihai Maxim

Desenvolvedor Full Stack

Mihai Maxim é um programador Full Stack na WebScrapingAPI, contribuindo em todas as áreas do produto e ajudando a criar ferramentas e funcionalidades fiáveis para a plataforma.

Python web scrapingJava web scrapingproxy infrastructurebrowser automationUse CasesGuidesScience of Web Scraping
Mihai Maxim, Desenvolvedor Full Stack @ WebScrapingAPI

Published Articles

14

Published Articles
GuidesApr 27, 202613 min read

Como extrair dados do Expedia com Python: hotéis, preços e avaliações (Guia de 2026)

Extraia os anúncios de hotéis da Expedia com Python, utilizando renderização em JS, proxies, seletores CSS e paginação; em seguida, limpe e exporte os dados para CSV.

Read article

Use CasesMay 1, 202614 min read

Selectores XPath vs CSS: Escolher o correto

TL;DR: Os selectores XPath e CSS localizam ambos elementos DOM, mas resolvem problemas diferentes. Os selectores CSS são mais rápidos e mais legíveis para selecções simples. O XPath ganha quando é necessário percorrer o DOM em qualquer direção, fazer corresponder conteúdo de texto ou lidar com lógica condicional complexa. A maioria dos projectos de produção beneficia da utilização de ambos estrategicamente.

Read article

GuidesMay 7, 202611 min read

Web Scraping com Regex: Um guia prático

TL;DR: Web scraping com regex brilha quando você precisa de padrões de texto curtos e previsíveis (preços, SKUs, e-mails, datas) do HTML em que você já confia. Emparelhe o módulo re do Python com Beautiful Soup, escopo seus padrões para um nó analisado em vez de marcação bruta, e mantenha o regex fora do caminho da análise completa da árvore HTML. Este guia apresenta um raspador de título e preço em funcionamento, recursos avançados de regex e as armadilhas que afetam os raspadores reais em produção.

Read article

Science of Web ScrapingMay 8, 202612 min read

10 perguntas sobre raspagem que toda equipe de dados deve responder antes de escrever um raspador

TL;DR: Um projeto de web scraping falha no planeamento muito antes de falhar no código. Estas dez perguntas sobre scraping orientam-no através da legalidade, alternativas de API, defesas anti-bot, custo, cadência de atualização, qualidade dos dados e governação, para que possa definir o âmbito do trabalho, escolher a pilha certa e evitar os modos de falha que matam silenciosamente os scrapers em produção.

Read article

GuidesApr 10, 20266 min read

Comece a usar o Web Stealth Proxy como um profissional: Guia de início rápido

Descubra como utilizar o Web Stealth Proxy como um profissional com o nosso guia de início rápido. Obtenha instruções passo a passo para otimizar a sua experiência com proxies e elevar a sua privacidade online a um novo nível. Comece hoje mesmo!

Read article

GuidesApr 10, 20268 min read

Erros de estado do proxy: como identificá-los e resolvê-los

Está a ter problemas com códigos de erro de proxy que o impedem de fazer web scraping? Junte-se a mim para explorarmos os erros mais comuns e descobrirmos formas de os resolver.

Read article

GuidesApr 22, 20268 min read

Como extrair dados de uma tabela HTML em JavaScript

Está interessado em extrair dados de tabelas HTML na Web utilizando JavaScript? Neste artigo, irá descobrir como utilizar a biblioteca cheerio em conjunto com o Node.js para extrair facilmente dados de tabelas em qualquer site.

Read article

GuidesMay 12, 202613 min read

Análise de HTML em Java com Jsoup

TL;DR: Jsoup é a biblioteca padrão para análise de HTML em Java. Este guia percorre todo o ciclo de vida (configuração do Maven, carregamento de um documento, seletores CSS, travessia do DOM, extração, modificação e serialização), além de um projeto de raspagem executável, tratamento de erros, paginação e os limites que o levam a um navegador sem cabeça ou a uma API de raspagem.

Read article

GuidesApr 10, 20266 min read

Como testar proxies

Utilize este guia para dominar os testes de proxy. Aprenda a utilizar ferramentas online para verificar as ligações de proxy, a localização e o anonimato. Otimize a utilização do seu proxy e resolva eventuais problemas.

Read article

GuidesMay 12, 202625 min read

Python Extrair texto de HTML

TL;DR: Para extrair texto de HTML em Python, analise a marcação com um analisador real (BeautifulSoup, lxml.html ou html-text), remova scripts, estilos e cromo do site e, em seguida, normalize o espaço em branco e o Unicode antes de salvar. Este guia compara as principais bibliotecas, corrige as armadilhas comuns de limpeza e termina com um rastreador executável que escreve JSONL e arquivos .txt por página.

Read article

GuidesApr 22, 202611 min read

Web scraping com o Scrapy: a maneira fácil

Domine a extração de dados da Web com o Scrapy. Aprenda passo a passo com exemplos práticos neste guia completo. Entre agora no mundo da extração de dados!

Read article

GuidesApr 22, 20265 min read

Como executar JavaScript com o Scrapy

Está com dificuldades em extrair dados de sites dinâmicos com o Scrapy? Neste artigo, vamos explorar várias soluções para lidar com a renderização em JavaScript. Saiba como utilizar plugins como o Splash e o Selenium para levar o seu projeto Scrapy a um novo patamar.

Read article

GuidesApr 22, 20268 min read

O melhor guia rápido de XPath. Como escrever facilmente seletores poderosos.

Descubra como navegar pelo DOM com facilidade. A ficha de referência do XPath abrange tudo o que precisa de saber sobre a criação de seletores dinâmicos.

Read article

GuidesApr 22, 20267 min read

Guia para principiantes sobre web scraping com Rust

O Rust é uma linguagem rápida e eficiente em termos de memória. Mas como é que lida com a extração de dados da Web? Consulte este guia para principiantes e descubra como pode utilizá-la para criar um programa básico de extração de dados da Web.

Read article