- Fournit une API Python similaire à Apache Spark / Dask, mais
→ n’appelle pas l’interpréteur Python
→ génère du bytecode LLVM optimisé pour le pipeline donné et le jeu de données d’entrée
→ 5 à 91x plus rapide que l’interpréteur
-
En interne, il s’appuie sur la compilation pilotée par les données et un traitement en double mode, ce qui lui permet d’atteindre une vitesse comparable à celle d’un pipeline codé et optimisé en C++
-
Prend en charge macOS / Linux
-
Article présenté à la SIGMOD '21 : "Tuplex: Data Science in Python at Native Code Speed"
Aucun commentaire pour le moment.