Author Profile

Sorin-Gabriel Marica

Desenvolvedor Full-Stack

Sorin Marica é engenheiro Full Stack e DevOps na WebScrapingAPI, onde desenvolve funcionalidades do produto e mantém a infraestrutura que garante o bom funcionamento da plataforma.

Python web scrapingGuidesEngineering
Sorin-Gabriel Marica, Desenvolvedor Full-Stack @ WebScrapingAPI

Published Articles

6

Published Articles
Science of Web ScrapingMay 1, 202612 min read

Web Scraping com Node-Unblocker: Um guia prático

TL;DR: O Node-unblocker transforma um aplicativo Express em um proxy HTTP com prefixo de URL que você pode hackear. Este guia de desbloqueio de nó de raspagem da web percorre a instalação, conectando middlewares de solicitação e resposta, instâncias rotativas, implantando no Docker ou Heroku e reconhecendo o ponto em que uma API de raspagem gerenciada é a resposta mais limpa.

Read article

GuidesApr 30, 202619 min read

Web Scraping com PHP: Um Guia Prático de Bibliotecas, Código e Melhores Práticas

TL;DR: O PHP é uma linguagem perfeitamente capaz de fazer scraping da web, graças às extensões embutidas como cURL e DOMDocument, além de um rico ecossistema Composer que inclui Guzzle, Symfony DomCrawler e Symfony Panther para navegação sem cabeça. Este guia o orienta por todo o fluxo de trabalho: buscar páginas, analisar HTML, armazenar resultados em CSV/JSON/MySQL, tratar erros e evitar bloqueios.

Read article

EngineeringApr 10, 20266 min read

Restrições arquitetónicas da API REST

As APIs assumem diversas formas e tamanhos. Entre elas, as APIs REST são talvez as mais populares, mas o que as define exatamente? Bem, vamos descobrir!

Read article

GuidesApr 22, 20268 min read

Aprenda a usar o Node-Fetch do NPM para fazer pedidos HTTP no Node.js

Descubra como utilizar o recém-lançado node-fetch para efetuar pedidos HTTP diretamente a partir do Node.js. O node-fetch é o equivalente à API fetch em JavaScript

Read article

GuidesApr 22, 20269 min read

O guia definitivo sobre como começar a fazer web scraping com Go

Este é um guia completo sobre como utilizar o Go para a extração de dados da Web. Aprenda a criar um programa de extração de dados rápido, tirando partido da poderosa capacidade de concorrência do Go.

Read article

GuidesMay 12, 202619 min read

Tutorial BeautifulSoup: Construa um Scraper Python real a partir do zero

TL;DR: Este tutorial do BeautifulSoup guia-o através de um scraper Python completo, desde a instalação do pip até um script reforçado que pagina o Hacker News, exporta para CSV e JSON, e é educado o suficiente para não ser bloqueado. Cada snippet é executável, e nós apontamos os momentos exatos em que o BeautifulSoup é a ferramenta errada.

Read article