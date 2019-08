Python bestaat alweer ongeveer dertig jaar, maar pas het afgelopen decennium is de populariteit zodanig gestegen dat het alle programmeertalen heeft ingehaald, behalve Java en C. De populariteit heeft Python over het algemeen goed gedaan: de taal is het middelpunt van aandacht in de educatieve wereld, een goede plek om te beginnen met software-ontwikkeling en een waardevol component van een technologiestack.

Maar de populariteit zorgt er ook voor dat de zwakke plekken vaak worden uitvergroot. Pythons issues - met name prestaties, pakketten en applicatie-delivery - zijn nu breed bekend. Het zijn geen fatale tekortkomingen, maar het zijn wel obstakels voor adoptie en worden alleen maar zichtbaarder, met concurrentie die leert van deze tekortkomingen en het anders doet, zoals Julia, Nim, Rust en Go.

Hier volgen de drie hoofduitdagingen waar Python-programmeurs mee te maken krijgen en een aantal manieren waarop Python en third party-tools en -library's deze problemen proberen op te lossen.

1. Snelheid en multithreading

Het probleem: Python's trage prestaties en de beperkte threading en multiprocessing zijn een obstakel voor toekomstige ontwikkeling.

Python geeft makkelijk programmeren de voorkeur boven snelheid. Dat is geen slechte zaak als je bedenkt dat intensieve taken in Python kunnen worden opgelost met externe library's die in C of C++ zijn geschreven, zoals NumPy of Numba. Maar Pythons kant-en-klare prestaties lopen ver achter op andere talen met simpele syntaxis, zoals Nim of Julia, die naar machinetaal compileren.

Een van de tekortkomingen waar Python al het langste mee worstelt is het gebrek aan het gebruik van meerdere cores of processoren. Hoewel Python wel mogelijkheden heeft om met threading om te gaan, is dat beperkt tot een enkele core. En hoewel Python multiprocessing ondersteunt met behulp van sub-instances in zijn runtime, is het niet altijd efficiënt om dat in te zetten en de resultaten te synchroniseren.

De oplossing(en): Op het moment is er niet één top-down holistische oplossing voor de prestatieproblemen van Python. Het gaat om een heleboel initiatieven om Python te versnellen, die elk iets bijdragen op een specifiek gebied. Enkele voorbeelden:

Verbeteringen aan CPython's interne mechanismes: Verbeteringen aan CPython leveren bescheiden maar universele snelheidsverbeteringen. Zo levert protocol Verbeteringen aan CPython leveren bescheiden maar universele snelheidsverbeteringen. Zo levert protocol Vectorcall in Python 3.8 een manier op om sneller een call uit te voeren naar een Python-object. Deze verbeteringen maken geen dramatisch verschil, maar zijn voorspelbaar en meetbaar, breken achterwaartse compatibiliteit niet en bestaande Python-apps kunnen ze gebruiken zonder dat herschrijven nodig is.

Verveteringen van subinterpreter-functionaliteit van CPython. En nieuwe programmatische interface voor Pythons interpreter zorgt op den duur voor het eleganter delen van data tussen interpreters voor multicore verwerking. Dit voorstel staat op de rol om opgenomen te worden in Python 3.9, dus de relevante bitjes verschijnen pas tenminste vanaf de volgende versie van Python. En nieuwe programmatische interface voor Pythons interpreter zorgt op den duur voor het eleganter delen van data tussen interpreters voor multicore verwerking. Dit voorstel staat op de rol om opgenomen te worden in Python 3.9, dus de relevante bitjes verschijnen pas tenminste vanaf de volgende versie van Python.

Verbeteren van delen van objecten tussen meerdere processen. Bij Python worden er bij multiprocessing interpreter-instances gestart voor elke core voor maximale prestaties, maar veel van deze prestatieverbeteringen gaan weer verloren als de interpreters met hetzelfde object in het geheugen werken. Nieuwe functionaliteiten als de klasse Bij Python worden er bij multiprocessing interpreter-instances gestart voor elke core voor maximale prestaties, maar veel van deze prestatieverbeteringen gaan weer verloren als de interpreters met hetzelfde object in het geheugen werken. Nieuwe functionaliteiten als de klasse SharedMemory en het nieuwe Pickle-protocol zorgt ervoor dat er minder gekopieerd en geserialiseerd hoeft te worden om data door te geven tussen interpreters.

Projecten buiten Python zelf bieden ook prestatieverbeteringen, maar alleen in specifieke gevallen:

PyPy. Dit is een alternatieve Python-interpreter die just-in-time compilatie naar machinetaal uitvoert. Dit is een alternatieve Python-interpreter die just-in-time compilatie naar machinetaal uitvoert. PyPy werkt het beste met pure-Python projecten, maar het werkt redelijk met popualaire library's als Numpy. Dit werkt het beste voor diensten die lang draaien en niet de eenmalige toepassingen.

Cython. Cython zorgt ervoor dat je Python-code in C kan vertalen. Het project is oorspronkelijk ontworpen voor wetenschappelijke toepassingen, maar kan in vrijwel alle scenario's worden gebruikt. Het grootste nadeel is de syntaxis, die uniek is voor Cython en de conversie daarom eenrichtingsverkeer maakt. Het is het beste voor het gebruiken van specifieke delen code die geoptimaliseerd worden in plaats van hele programma's.

Numba. Ook Ook Numba voert just-in-time compliatie naar machinetaal uit voor geselecteerde functies. Net als Cython is Numba voornamelijk bedoeld voor wetenschappelijke toepassingen. Het werkt het beste voor code die lokaal draait in tegenstelling tot gedistribueerd.

Mypyc. Dit is werk in uitvoering en het genereert C-code vanaf Python-code die is voorzien van mypy -types. Dit is werk in uitvoering en het genereert C-code vanaf Python-code die is voorzien van-types. Mypyc is veelbelovend omdat het Pythons native typeringen gebruikt, maar het moet nog verder vorderen om in productie nuttig te zijn.

Geoptimaliseerde Python-distributies. Sommige third party-versies van Python, zoals Sommige third party-versies van Python, zoals die van Intel , hebben speciaal gecompileerde versies van wiskundige en statistische library's die Intels processor-extensies (bijvoorbeeld AVX512) benutten. Het is goed om te weten dat specifieke wiskundige functies sterk verbeteren, maar dit biedt geen versnelling voor de code als geheel.

Python-programmeurs willen ook graag af van de Global Interpreter Lock (GIL) die toegang tot objecten serieel uitvoert en ervoor zorgt dat threads elkaars workloads niet verstoren. In theorie zou het loslaten van de GIL ervoor zorgen dat prestaties verbeteren. Maar Python zonder GIL is grotendeels achterwaarts incompatibel met Python (vooral met C-extensies). Tot nu toe hebben alle pogingen om GIL te verwijderen tot niets geleid of Python juist vertraagd in plaats van versneld.

Een van de initiatieven die meer snel snelheidsverbeteringen moet opleveren is het refactoren van de implementatie van Pythons eigen C-API's. Een opgeruimdere API moet het makkelijker maken om op lange termijn verschillende verbeteringen toe te voegen: een veranderde of verwijderde GIL, haakjes voor JIT-compilaties, betere manieren om data te verschuiven tussen interpreter-instances enzovoorts.

2. Pakketten en stand-alone exexutables

Het probleem: Zelfs na dertig jaar heeft Python nog geen goede manier om een programma of script om te zetten in een eigen executable om uit te rollen op meerdere platforms. Er zijn manieren om het te doen, maar ze zijn hoofdzakelijk beperkt tot third party-tools die geen native component zijn van Python en ze kunnen lastig in het gebruik zijn.

De bekendste en breedst ondersteunde van dit soort tools, PyInstaller, is nog steeds er nuttig. PyInstaller kan een pakketje maken van apps die kan worden gebruikt door de meeste third party-extensies, zoals NumPy. PyInstaller moet je handmatig synchroniseren met die third party-extensies en dat kan een pittige klus zijn in een wijdverspreid ecosysteem als Python. PyInstaller maakt app-pakketjes en bundelt alles wat gevraagd wordt in import en bepaalt niet welke componenten daadwerkelijk worden gebruikt bij het draaien. Ook zijn ze niet cross-platform, je moet een pakket maken voor het platform waar je op gaat uitrollen.

De oplossing(en): Niets ten nadele van PyInstaller, maar wat we eigenlijk nodig hebben is een native-Python oplossing, als standaardlibrary of ingebouwd, waarmee we Python-apps efficiënt als standalone binary's kunnen afleveren voor de meeste doorsnee platforms. Idealiter zou deze ingebouwde pacakager runtime code-coverage data gebruiken om alleen de library's die nodig zijn te bundelen (in plaats van alles waarom wordt gevraagd) en zou het automatisch met de rest van Python synchroniseren.

Op dit moment bestaat er niets wat zoiets doet. Maar we blijven hints tegenkomen over hoe we zo'n tool zouden moeten bouwen. PyOxidizer, bijvoorbeeld, gebruikt Rust om binary's te genereren die Python embedden, als een manier om stand-alone Python-apps te maken. Het is verre van een totaal oplossing voor applicatie-delivery, maar het is een idee van hoe concepten van buiten het Python-ecosysteem tot een oplossing kunnen leiden.

3. Installatie, pakketbeheer en projectmanagement

Het probleem: Weet je wat veel te ingewikkeld is? Een workplace maken voor een professioneel Python-project, met mappenstructuur, projectgeneratie, het beheren van de omgeving, pakketten en dependency's die bij het project horen, het herdistribueren van de bron van een project op een manier die te reproduceren is en ervoor zorgen dat je je toetsenbord niet stukslaat uit pure frustratie als je bovenstaande keer op keer moet uitvoeren.

Talen als Rust en Go zetten vanaf het begin af aan een enkele leidende manier neer om een project op te zetten en gedurende de hele levenscyclus te beheren. Wat ontwikkelaars van deze talen verliezen aan flexibiliteit, winnen ze aan voorspelbaar, consequent beheer.

Pythons tools en methodes om installaties, pakketten en projecten te beheren zijn over de jaren heen gegroeid, een legacy van drie decennia. Het is een gefragmenteerd raamwerk aan losse ideeën: pip voor pakketbeheer, venv/virtualeny voor het maken van virtuele omgevingen, virtualenvwrapper en Pipeny om die te beheren, pip-tools voor het maken van project-dependency's, distutils en setuptools voor het maken van codedistributies, enzovoorts enzovoorts. Daarnaast heb je een heleboel andere onderdelen nodig om een project te definiëren: setup.py , requirements.txt , setup.cfg , MANIFEST.in , Pipfile - de lijst gaat maar door.

De oplossing(en): Wat we ook hier nodig hebben is één tool en proces om dit te overkoepelen, als eenduidige consequente oplossing van het core-Python ontwikkelteam, dat in staat is om elegant projecten te migreren die de bestaande methodes gebruiken. Dat is een stevige klus, maar hoe populairder Python wordt, hoe belangrijker het wordt om drempels voor adoptie en beheer te verlagen en om consequente en heldere tooling te hebben.