Apache Tajo admite funciones personalizadas / definidas por el usuario (UDF). Se pueden crear funciones personalizadas en Python.
Las UDF son funciones simples de Python con un decorador. «@Tipo de salida (
@ouput_type(“integer”) def sum_py(a, b): return a + b;
Los scripts de Python con UDF se pueden registrar agregando la siguiente configuración a «Tajosite.xml»…
<property> <name>tajo.function.python.code-dir</name> <value>file:///path/to/script1.py,file:///path/to/script2.py</value> </property>
Después de registrar los scripts, reinicie el clúster y las UDF estarán disponibles directamente en la consulta SQL de la siguiente manera:
select sum_py(10, 10) as pyfn;
Apache Tajo también admite funciones agregadas definidas por el usuario, pero no admite funciones de ventana personalizadas.
🚫