-2
votes

Urllib.Request ne fonctionne pas sur Python 3. Comment puis-je utiliser Beautifulsoup?

J'essaie d'apprendre à scraper un site Web et je continue à se heurter à Urllib.Request, ce qui ne fonctionne pas pour moi. XXX

python web-scraping beautifulsoup

0 commentaires

3 Réponses :

1
votes

Essayez Demandes

import requests
import bs4 as bs
sauce = requests.get('https://www.goat.com/collections/just-dropped').text
soup = bs.BeautifulSoup(sauce, 'lxml')
print(soup)

2 commentaires

MODULENOTFOUNDERROR: Aucun module nommé 'Demandes'

Cliquez sur le lien que j'ai laissé dans la solution. Vous devez l'installer

0
votes

Vous devez définir un en-tête d'agent utilisateur, mais malheureusement, la page est un contenu dynamique et vous devez utiliser SELENIUM

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import chromedriver_binary  # Adds chromedriver binary to path

driver = webdriver.Chrome()
driver.get('https://www.goat.com/collections/just-dropped')

# wait until the product rendered
products = WebDriverWait(driver, 15).until(
    lambda d: d.find_element_by_css_selector('.goat-clean-product-template ')
)

for p in products:
    name = p.get_attribute('title')
    url = p.get_attribute('href')
    print('%s: %s' % (name, url))

0 commentaires

0
votes

Comme indiqué précédemment, vous pouvez utiliser le Demandes Library vraiment vraiment Pour chercher un contenu de page.

Tout d'abord, vous devez installer requêtes et bs4 via pip . Cela résoudra le modulenotfounderror que vous obtenez. xxx

alors il est votre code pour obtenir des données: xxx



                                                                    
                                    
                                    
                                        2 commentaires
                                        
                                                                                            
                                                    tu es un joli être humain merci                                                
                                                
                                                                                            
                                                    @Tudorpopica, content que cela vous ait aidé.


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Python: ConnectionError: HTTPSConnectionPool (hôte = 'api.foursquare-com', port = 443)                        
                        
                                            
                            L'exécution de Flask sous Windows n'exécute pas la commande d'exécution de flask                        
                        
                                            
                            Chatbot installé mais obtention d'une erreur lors de l'importation de ChatBot                        
                        
                                            
                            Administrateur Django: __str__ a renvoyé une non-chaîne (type int)