Multithreading in Python met voorbeeld:leer GIL in Python

Met de programmeertaal Python kunt u multiprocessing of multithreading gebruiken. In deze tutorial leer je hoe je multithreaded applicaties schrijft in Python.

Wat is een discussielijn?

Een thread is een uitvoeringseenheid bij gelijktijdige programmering. Multithreading is een techniek waarmee een CPU veel taken van één proces tegelijkertijd kan uitvoeren. Deze threads kunnen afzonderlijk worden uitgevoerd terwijl ze hun procesbronnen delen.

Wat is een proces?

Een proces is in feite het programma in uitvoering. Wanneer u een toepassing op uw computer start (zoals een browser of teksteditor), maakt het besturingssysteem een proces aan.

Wat is multithreading in Python?

Multithreading in Python programmeren is een bekende techniek waarbij meerdere threads in een proces hun dataruimte delen met de hoofdthread, wat het delen van informatie en communicatie binnen threads gemakkelijk en efficiënt maakt. Draden zijn lichter dan processen. Multi-threads kunnen afzonderlijk worden uitgevoerd terwijl ze hun procesbronnen delen. Het doel van multithreading is om meerdere taken en functiecellen tegelijkertijd uit te voeren.

In deze tutorial leer je,

Wat is een draad?
Wat is een proces?
Wat is multithreading?
Wat is multiprocessing?
Python Multithreading versus Multiprocessing
Waarom multithreading gebruiken?
Python MultiThreading
De draad- en draadmodules
De draadmodule
De inrijgmodule
Deadlocks en racevoorwaarden
Draden synchroniseren
Wat is GIL?
Waarom was GIL nodig?

Wat is multiprocessing?

Met multiprocessing kunt u meerdere niet-gerelateerde processen tegelijkertijd uitvoeren. Deze processen delen hun bronnen niet en communiceren niet via IPC.

Python Multithreading versus Multiprocessing

Overweeg dit scenario om processen en threads te begrijpen:Een .exe-bestand op uw computer is een programma. Wanneer u het opent, laadt het besturingssysteem het in het geheugen en voert de CPU het uit. De instantie van het programma dat nu draait, wordt het proces genoemd.

Elk proces heeft 2 fundamentele componenten:

De code
De gegevens

Nu kan een proces een of meer subonderdelen bevatten die threads worden genoemd. Dit hangt af van de OS-architectuur. Je kunt een thread beschouwen als een onderdeel van het proces dat afzonderlijk door het besturingssysteem kan worden uitgevoerd.

Met andere woorden, het is een stroom van instructies die onafhankelijk door het besturingssysteem kan worden uitgevoerd. Threads binnen een enkel proces delen de gegevens van dat proces en zijn ontworpen om samen te werken om parallellisme te vergemakkelijken.

Waarom multithreading gebruiken?

Met multithreading kunt u een toepassing opsplitsen in meerdere subtaken en deze taken tegelijkertijd uitvoeren. Als u multithreading op de juiste manier gebruikt, kunnen uw applicatiesnelheid, prestaties en weergave allemaal worden verbeterd.

Python MultiThreading

Python ondersteunt constructies voor zowel multiprocessing als multithreading. In deze zelfstudie richt je je voornamelijk op het implementeren van multithreaded toepassingen met python. Er zijn twee hoofdmodules die kunnen worden gebruikt om threads in Python af te handelen:

De thread module, en
De threading module

In python is er echter ook iets dat een global interpreter lock (GIL) wordt genoemd. Het zorgt niet voor veel prestatiewinst en kan zelfs verminderen de prestaties van sommige toepassingen met meerdere threads. Je zult er alles over leren in de komende secties van deze tutorial.

De modules Draad en Draadsnijden

De twee modules waarover u in deze zelfstudie leert, zijn de thread-module en de threading-module .

De threadmodule is echter al lang verouderd. Vanaf Python 3 is het als verouderd aangemerkt en is het alleen toegankelijk als __thread voor achterwaartse compatibiliteit.

U moet de threading op een hoger niveau gebruiken module voor toepassingen die u wilt implementeren. De thread-module is hier alleen behandeld voor educatieve doeleinden.

De draadmodule

De syntaxis om een nieuwe thread te maken met behulp van deze module is als volgt:

thread.start_new_thread(function_name, arguments)

Oké, nu heb je de basistheorie behandeld om te beginnen met coderen. Open dus uw IDLE of een notitieblok en typ het volgende in:

import time
import _thread

def thread_test(name, wait):
   i = 0
   while i <= 3:
      time.sleep(wait)
      print("Running %s\n" %name)
      i = i + 1

   print("%s has finished execution" %name)

if __name__ == "__main__":
    
    _thread.start_new_thread(thread_test, ("First Thread", 1))
    _thread.start_new_thread(thread_test, ("Second Thread", 2))
    _thread.start_new_thread(thread_test, ("Third Thread", 3))

Sla het bestand op en druk op F5 om het programma uit te voeren. Als alles correct is gedaan, is dit de uitvoer die u zou moeten zien:

In de komende secties leer je meer over raceomstandigheden en hoe je ermee om moet gaan

CODE UITLEG

Deze instructies importeren de tijd- en threadmodule die worden gebruikt om de uitvoering en vertraging van de Python-threads af te handelen.
Hier heb je een functie gedefinieerd met de naam thread_test, die wordt aangeroepen door de start_new_thread methode. De functie voert een while-lus uit voor vier iteraties en drukt de naam af van de thread die deze heeft aangeroepen. Zodra de iteratie is voltooid, wordt een bericht afgedrukt dat de uitvoering van de thread is voltooid.
Dit is het hoofdgedeelte van je programma. Hier roep je gewoon de start_new_thread . aan methode met de thread_test functie als een argument. Dit zal een nieuwe thread maken voor de functie die u als argument doorgeeft en deze beginnen uit te voeren. Merk op dat je dit kunt vervangen (thread_ test) met een andere functie die u als thread wilt gebruiken.

De inrijgmodule

Deze module is de implementatie op hoog niveau van threading in python en de de facto standaard voor het beheren van multithreaded-applicaties. Het biedt een breed scala aan functies in vergelijking met de threadmodule.

Functienaam	Beschrijving
activeCount()	Retourneert het aantal Thread voorwerpen die nog leven
currentThread()	Retourneert het huidige object van de Thread-klasse.
enumerate()	Laat alle actieve Thread-objecten zien.
isDaemon()	Retourneert true als de thread een daemon is.
isAlive()	Retourneert true als de thread nog leeft.
	Thread Class-methoden
start()	Start de activiteit van een thread. Het moet slechts één keer worden aangeroepen voor elke thread, omdat het een runtime-fout zal geven als het meerdere keren wordt aangeroepen.
run()	Deze methode geeft de activiteit van een thread aan en kan worden overschreven door een klasse die de klasse Thread uitbreidt.
join()	Het blokkeert de uitvoering van andere code totdat de thread waarop de methode join() werd aangeroepen, wordt beëindigd.