Python-internettoegang met Urllib.Request en urlopen()
Wat is urllib?
urllib is een Python-module die kan worden gebruikt voor het openen van URL's. Het definieert functies en klassen om te helpen bij URL-acties.
Met Python kunt u ook gegevens van internet benaderen en ophalen zoals XML, HTML, JSON, etc. U kunt Python ook gebruiken om direct met deze gegevens te werken. In deze tutorial gaan we kijken hoe we gegevens van het web kunnen halen. Hier hebben we bijvoorbeeld een guru99-video-URL gebruikt en we gaan deze video-URL openen met Python en een HTML-bestand van deze URL afdrukken.
In deze tutorial zullen we leren
- URL openen met Urllib
- Hoe lees je een HTML-bestand voor je URL in Python
URL openen met Urllib
Voordat we de code uitvoeren om verbinding te maken met internetgegevens, moeten we de instructie voor de URL-bibliotheekmodule of "urllib" importeren.
- Urllib importeren
- Definieer je hoofdfunctie
- Declareer de variabele webUrl
- Bel vervolgens de urlopen-functie aan in de URL-bibliotheek
- De URL die we openen is de guru99-tutorial op youtube
- Vervolgens gaan we de resultaatcode afdrukken
- Resultaatcode wordt opgehaald door de getcode-functie aan te roepen op de webUrl-variabele die we hebben gemaakt
- We gaan dat converteren naar een string, zodat het kan worden samengevoegd met onze string "resultaatcode"
- Dit is een gewone HTTP-code "200", wat aangeeft dat het http-verzoek met succes is verwerkt
Hoe krijg ik een HTML-bestandsformulier-URL in Python
Je kunt het HTML-bestand ook lezen met behulp van de "leesfunctie" in Python, en wanneer je de code uitvoert, verschijnt het HTML-bestand in de console.
- Roep de leesfunctie op de webURL-variabele aan
- Leesvariabele maakt het mogelijk om de inhoud van gegevensbestanden te lezen
- Lees de volledige inhoud van de URL in een variabele genaamd data
- Voer de code uit - De gegevens worden in HTML-indeling afgedrukt
Hier is de volledige code
Python 2 voorbeeld
# # read the data from the URL and print it # import urllib2 def main(): # open a connection to a URL using urllib2 webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com") #get the result code and print it print "result code: " + str(webUrl.getcode()) # read the data from the URL and print it data = webUrl.read() print data if __name__ == "__main__": main()
Python 3 voorbeeld
# # read the data from the URL and print it # import urllib.request # open a connection to a URL using urllib webUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com') #get the result code and print it print ("result code: " + str(webUrl.getcode())) # read the data from the URL and print it data = webUrl.read() print (data)
Python
- Het gebruik van SaaS en de cloud vereist zorgvuldige gegevensverwarring
- Python-sleutelwoorden en -ID's
- Python-verklaring, inspringing en opmerkingen
- Python-variabelen, constanten en literalen
- Python-gegevenstypen
- Python Type Conversie en Type Casting
- Python invoer, uitvoer en import
- Python globale, lokale en niet-lokale variabelen
- Python-directory en bestandsbeheer
- Python-fouten en ingebouwde uitzonderingen
- Afhandeling van Python-uitzonderingen met behulp van de instructie try, behalve en tenslotte