Hva er urllib?
urllib er en Python-modul som kan brukes til å åpne URL-er. Den definerer funksjoner og klasser for å hjelpe til med URL-handlinger.
Med Python kan du også få tilgang til og hente data fra internett som XML, HTML, JSON, etc. Du kan også bruke Python til å jobbe med disse dataene direkte. I denne opplæringen skal vi se hvordan vi kan hente data fra nettet. For eksempel brukte vi her en guru99-video-URL, og vi skal få tilgang til denne video-URL-en ved hjelp av Python, samt skrive ut HTML-fil av denne URL-en.
I denne veiledningen vil vi lære
- Hvordan åpne URL ved hjelp av Urllib
- Hvordan lese HTML-fil for URL-en din i Python
Hvordan åpne URL ved hjelp av Urllib
Før vi kjører koden for å koble til Internett-data, må vi importere uttalelse for URL-biblioteksmodul eller "urllib".
- Importer urllib
- Definer hovedfunksjonen din
- Erklær variabelen webUrl
- Ring deretter urlopen-funksjonen i URL lib biblioteket
- URL-en vi åpner er guru99 tutorial på youtube
- Deretter skal vi skrive ut resultatkoden
- Resultatkoden hentes ved å ringe getcode-funksjonen på webUrl-variabelen vi har opprettet
- Vi skal konvertere det til en streng, slik at den kan sammenkobles med streng "resultatkode"
- Dette vil være en vanlig HTTP-kode "200", noe som indikerer at http-forespørsel er behandlet
Hvordan få HTML-filformular-URL i Python
Du kan også lese HTML-filen ved å bruke "lese-funksjonen" i Python, og når du kjører koden, vil HTML-filen vises i konsollen.
- Ring lesefunksjonen på webURL-variabelen
- Les variabel lar deg lese innholdet i datafiler
- Les hele innholdet i URL-en i en variabel som heter data
- Kjør koden - Den vil skrive ut dataene i HTML-format
Her er den fullstendige koden
Python 2 Eksempel
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 Eksempel
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)