how do I extract data from linked pages in websites using python

Question

I have been trying to scrape data from webpages for data analytics project and I managed successfully to get the data from a single page.

import requests
from bs4 import BeautifulSoup
import concurrent.futures
from urllib.parse import urlencode
from scraper_api import ScraperAPIClient


    client = ScraperAPIClient('key')
    results = client.get(url = "https://www.essex.ac.uk/course-search?query=&f.Level%7CcourseLevel=Undergraduate").text
    
    print(results)

For an example from the site "https://www.essex.ac.uk/course-search?query=&f.Level%7CcourseLevel=Undergraduate" I need to navigate inside each courses and get a single data called duration from that page.

AmineBTG · Accepted Answer

Try the below :

client = ScraperAPIClient('key')
results = []
for i in range(10):
   results.append(client.get(url = f"https://www.essex.ac.uk/course-search?query=&f.Level%7CcourseLevel=Undergraduate&start_rank={i}1").text)
    
print(results)

loop through the 10 results page and put each text respone in the results list

how do I extract data from linked pages in websites using python

Answers (2)

Related Questions