Para utilizarmos a WebScrapingAPI, precisamos de criar a nossa conta e obter a nossa chave de acesso privada, utilizada para autenticar-nos na API. Não precisa de se preocupar, pois a criação da conta é gratuita e não é necessário adicionar o seu cartão de crédito ou outras informações pessoais.
Ao iniciar sessão, seremos redirecionados para o Painel de Controlo. Aqui, veremos a nossa chave de acesso, que iremos utilizar dentro de momentos. Certifique-se de que a guarda em segredo, mas se achar que a sua chave privada foi comprometida, pode sempre repor a mesma premindo o botão «Reset API Key».
Para mais detalhes sobre como a WebScrapingAPI funciona e como pode ser integrada no seu projeto, pode sempre consultar a documentação; e para testar as funcionalidades, o API Playground ajuda-o a visualizar os resultados ainda melhor!
Chega de apresentação, vamos ver como podemos usar a WebScrapingAPI para fazer scraping utilizando sitemaps.
Para este exemplo, utilizaremos o NodeJS como nossa linguagem de programação, mas pode utilizar qualquer linguagem de programação com a qual se sinta confortável. Em seguida, iremos extrair o mapa do site e analisar os URLs dos produtos, extrair as páginas dos produtos e armazenar os dados num ficheiro CSV. Desta forma, pode extrair dados em massa utilizando a WebScrapingAPI, mas se desejar extrair apenas determinadas páginas, também pode fazer pedidos específicos.