Python Internett-tilgang ved hjelp av Urllib.Request and urlopen ()

Innholdsfortegnelse:

Anonim

Hva er urllib?

urllib er en Python-modul som kan brukes til å åpne URL-er. Den definerer funksjoner og klasser for å hjelpe til med URL-handlinger.

Med Python kan du også få tilgang til og hente data fra internett som XML, HTML, JSON, etc. Du kan også bruke Python til å jobbe med disse dataene direkte. I denne opplæringen skal vi se hvordan vi kan hente data fra nettet. For eksempel brukte vi her en guru99-video-URL, og vi skal få tilgang til denne video-URL-en ved hjelp av Python, samt skrive ut HTML-fil av denne URL-en.

I denne veiledningen vil vi lære

  • Hvordan åpne URL ved hjelp av Urllib
  • Hvordan lese HTML-fil for URL-en din i Python

Hvordan åpne URL ved hjelp av Urllib

Før vi kjører koden for å koble til Internett-data, må vi importere uttalelse for URL-biblioteksmodul eller "urllib".

  • Importer urllib
  • Definer hovedfunksjonen din
  • Erklær variabelen webUrl
  • Ring deretter urlopen-funksjonen i URL lib biblioteket
  • URL-en vi åpner er guru99 tutorial på youtube
  • Deretter skal vi skrive ut resultatkoden
  • Resultatkoden hentes ved å ringe getcode-funksjonen på webUrl-variabelen vi har opprettet
  • Vi skal konvertere det til en streng, slik at den kan sammenkobles med streng "resultatkode"
  • Dette vil være en vanlig HTTP-kode "200", noe som indikerer at http-forespørsel er behandlet

Hvordan få HTML-filformular-URL i Python

Du kan også lese HTML-filen ved å bruke "lese-funksjonen" i Python, og når du kjører koden, vil HTML-filen vises i konsollen.

  • Ring lesefunksjonen på webURL-variabelen
  • Les variabel lar deg lese innholdet i datafiler
  • Les hele innholdet i URL-en i en variabel som heter data
  • Kjør koden - Den vil skrive ut dataene i HTML-format

Her er den fullstendige koden

Python 2 Eksempel

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Python 3 Eksempel

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)