Merge pull request #14 from tfhe/ng/vec_znx_api

ngama75 · web-flow · commit 73105275ff0c · 2024-05-24T14:40:11.000+02:00
vec_znx_arithmetic api def
diff --git a/spqlios/CMakeLists.txt b/spqlios/CMakeLists.txt
@@ -87,6 +87,7 @@ set(SRCS_F128
 # H header files containing the public API (these headers are installed)
 set(HEADERSPUBLIC
         commons.h
+        arithmetic/vec_znx_arithmetic.h
         cplx/cplx_fft.h
         reim/reim_fft.h
         q120/q120_common.h
@@ -107,6 +108,7 @@ set(HEADERSPRIVATE
         reim/reim_fft_private.h
         q120/q120_arithmetic_private.h
         q120/q120_ntt_private.h
+        arithmetic/vec_znx_arithmetic.h
         )
 
 set(SPQLIOSSOURCES
diff --git a/spqlios/arithmetic/vec_znx_arithmetic.h b/spqlios/arithmetic/vec_znx_arithmetic.h
@@ -0,0 +1,344 @@
+#ifndef SPQLIOS_VEC_ZNX_ARITHMETIC_H
+#define SPQLIOS_VEC_ZNX_ARITHMETIC_H
+
+#include <stdint.h>
+
+#include "../commons.h"
+#include "../reim/reim_fft.h"
+
+/**
+ * We support the following module families:
+ * - FFT64:
+ *    all the polynomials should fit at all times over 52 bits.
+ *    for FHE implementations, the recommended limb-sizes are
+ *    between K=10 and 20, which is good for low multiplicative depths.
+ * - NTT120:
+ *    all the polynomials should fit at all times over 119 bits.
+ *    for FHE implementations, the recommended limb-sizes are
+ *    between K=20 and 40, which is good for large multiplicative depths.
+ */
+typedef enum module_type_t { FFT64, NTT120 } MODULE_TYPE;
+
+/** @brief opaque structure that describr the modules (ZnX,TnX) and the hardware */
+typedef struct module_info_t MODULE;
+/** @brief opaque type that represents a prepared matrix */
+typedef struct vmp_pmat_t VMP_PMAT;
+/** @brief opaque type that represents a vector of znx in DFT space */
+typedef struct vec_znx_dft_t VEC_ZNX_DFT;
+/** @brief opaque type that represents a vector of znx in large coeffs space */
+typedef struct vec_znx_bigcoeff_t VEC_ZNX_BIG;
+/** @brief opaque type that represents a prepared scalar vector product */
+typedef struct svp_ppol_t SVP_PPOL;
+/** @brief opaque type that represents a prepared left convolution vector product */
+typedef struct cnv_pvec_l_t CNV_PVEC_L;
+/** @brief opaque type that represents a prepared right convolution vector product */
+typedef struct cnv_pvec_r_t CNV_PVEC_R;
+
+/** @brief allocates a prepared matrix (release with free) */
+EXPORT VMP_PMAT* vmp_pmat_alloc(const MODULE* module,           // N
+                                uint64_t nrows, uint64_t ncols  // dimensions
+);
+
+/** @brief allocates a vec_znx in DFT space (release with free) */
+EXPORT VEC_ZNX_DFT* vec_znx_dft_alloc(const MODULE* module,  // N
+                                      uint64_t size);
+
+/** @brief allocates a vec_znx_big (release with free) */
+EXPORT VEC_ZNX_BIG* vec_znx_big_alloc(const MODULE* module,  // N
+                                      uint64_t size);
+
+/** @brief allocates a prepared vector (release with free) */
+EXPORT SVP_PPOL* svp_ppol_alloc(const MODULE* module);  // N
+
+/** @brief free something (vec_znx, pvmp, pcnv...) was allocated
+ * It just calls free. It is required to expose it for foreign
+ * languages bindings that do cannot call libc directly
+ */
+EXPORT void std_free(void* address);
+
+/**
+ * @brief obtain a module info for ring dimension N
+ * the module-info knows about:
+ *  - the dimension N (or the complex dimension m=N/2)
+ *  - any moduleuted fft or ntt items
+ *  - the hardware (avx, arm64, x86, ...)
+ */
+EXPORT MODULE* new_module_info(uint64_t N, MODULE_TYPE mode);
+EXPORT void delete_module_info(MODULE* module_info);
+EXPORT uint64_t module_get_n(const MODULE* module);
+
+/** @brief sets res = 0 */
+EXPORT void vec_znx_zero(const MODULE* module,                             // N
+                         int64_t* res, uint64_t res_size, uint64_t res_sl  // res
+);
+
+/** @brief sets res = a */
+EXPORT void vec_znx_copy(const MODULE* module,                              // N
+                         int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                         const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
+);
+
+/** @brief sets res = a */
+EXPORT void vec_znx_negate(const MODULE* module,                              // N
+                           int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                           const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
+);
+
+/** @brief sets res = a + b */
+EXPORT void vec_znx_add(const MODULE* module,                              // N
+                        int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                        const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                        const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
+);
+
+/** @brief sets res = a - b */
+EXPORT void vec_znx_sub(const MODULE* module,                              // N
+                        int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                        const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                        const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
+);
+
+/** @brief sets res = k-normalize-reduce(a) */
+EXPORT void vec_znx_normalize_base2k(const MODULE* module,                              // N
+                                     uint64_t log2_base2k,                              // output base 2^K
+                                     int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                                     const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                                     uint8_t* tmp_space                                 // scratch space (size >= N)
+);
+
+/** @brief returns the minimal byte length of scratch space for vec_znx_normalize_base2k */
+EXPORT uint64_t vec_znx_normalize_base2k_tmp_bytes(const MODULE* module,  // N
+                                                   uint64_t res_size,     // res size
+                                                   uint64_t inp_size      // inp size
+);
+
+/** @brief sets res = a . X^p */
+EXPORT void vec_znx_rotate(const MODULE* module,                              // N
+                           const int64_t p,                                   // rotation value
+                           int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                           const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
+);
+
+/** @brief sets res = a(X^p) */
+EXPORT void vec_znx_automorphism(const MODULE* module,                              // N
+                                 const int64_t p,                                   // X-X^p
+                                 int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                                 const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
+);
+
+/** @brief prepares a vmp matrix (contiguous row-major version) */
+EXPORT void vmp_prepare_contiguous(const MODULE* module,                                // N
+                                   VMP_PMAT* pmat,                                      // output
+                                   const int64_t* mat, uint64_t nrows, uint64_t ncols,  // a
+                                   uint8_t* tmp_space                                   // scratch space
+);
+
+/** @brief prepares a vmp matrix (mat[row*ncols+col] points to the item) */
+EXPORT void vmp_prepare_dblptr(const MODULE* module,                                 // N
+                               VMP_PMAT* pmat,                                       // output
+                               const int64_t** mat, uint64_t nrows, uint64_t ncols,  // a
+                               uint8_t* tmp_space                                    // scratch space
+);
+
+/** @brief sets res = 0 */
+EXPORT void vec_dft_zero(const MODULE* module,                // N
+                         VEC_ZNX_DFT* res, uint64_t res_size  // res
+);
+
+/** @brief sets res = a+b */
+EXPORT void vec_dft_add(const MODULE* module,                   // N
+                        VEC_ZNX_DFT* res, uint64_t res_size,    // res
+                        const VEC_ZNX_DFT* a, uint64_t a_size,  // a
+                        const VEC_ZNX_DFT* b, uint64_t b_size   // b
+);
+
+/** @brief sets res = a-b */
+EXPORT void vec_dft_sub(const MODULE* module,                   // N
+                        VEC_ZNX_DFT* res, uint64_t res_size,    // res
+                        const VEC_ZNX_DFT* a, uint64_t a_size,  // a
+                        const VEC_ZNX_DFT* b, uint64_t b_size   // b
+);
+
+/** @brief sets res = DFT(a) */
+EXPORT void vec_znx_dft(const MODULE* module,                             // N
+                        VEC_ZNX_DFT* res, uint64_t res_size,              // res
+                        const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
+);
+
+/** @brief sets res = iDFT(a_dft) -- output in big coeffs space */
+EXPORT void vec_znx_idft(const MODULE* module,                       // N
+                         VEC_ZNX_BIG* res, uint64_t res_size,        // res
+                         const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
+                         uint8_t* tmp                                // scratch space
+);
+
+/** @brief tmp bytes required for vec_znx_idft  */
+EXPORT uint64_t vec_znx_idft_tmp_bytes(const MODULE* module);
+
+/**
+ * @brief      sets res = iDFT(a_dft) -- output in big coeffs space
+ *
+ * @note       a_dft is overwritten
+ */
+EXPORT void vec_znx_idft_tmp_a(const MODULE* module,                 // N
+                               VEC_ZNX_BIG* res, uint64_t res_size,  // res
+                               VEC_ZNX_DFT* a_dft, uint64_t a_size   // a is overwritten
+);
+
+/** @brief sets res = a+b */
+EXPORT void vec_znx_big_add(const MODULE* module,                   // N
+                            VEC_ZNX_BIG* res, uint64_t res_size,    // res
+                            const VEC_ZNX_BIG* a, uint64_t a_size,  // a
+                            const VEC_ZNX_BIG* b, uint64_t b_size   // b
+);
+/** @brief sets res = a+b */
+EXPORT void vec_znx_big_add_small(const MODULE* module,                             // N
+                                  VEC_ZNX_BIG* res, uint64_t res_size,              // res
+                                  const VEC_ZNX_BIG* a, uint64_t a_size,            // a
+                                  const int64_t* b, uint64_t b_size, uint64_t b_sl  // b
+);
+EXPORT void vec_znx_big_add_small2(const MODULE* module,                              // N
+                                   VEC_ZNX_BIG* res, uint64_t res_size,               // res
+                                   const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                                   const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
+);
+
+/** @brief sets res = a-b */
+EXPORT void vec_znx_big_sub(const MODULE* module,                   // N
+                            VEC_ZNX_BIG* res, uint64_t res_size,    // res
+                            const VEC_ZNX_BIG* a, uint64_t a_size,  // a
+                            const VEC_ZNX_BIG* b, uint64_t b_size   // b
+);
+EXPORT void vec_znx_big_sub_small_b(const MODULE* module,                             // N
+                                    VEC_ZNX_BIG* res, uint64_t res_size,              // res
+                                    const VEC_ZNX_BIG* a, uint64_t a_size,            // a
+                                    const int64_t* b, uint64_t b_size, uint64_t b_sl  // b
+);
+EXPORT void vec_znx_big_sub_small_a(const MODULE* module,                              // N
+                                    VEC_ZNX_BIG* res, uint64_t res_size,               // res
+                                    const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                                    const VEC_ZNX_BIG* b, uint64_t b_size              // b
+);
+EXPORT void vec_znx_big_sub_small2(const MODULE* module,                              // N
+                                   VEC_ZNX_BIG* res, uint64_t res_size,               // res
+                                   const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
+                                   const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
+);
+
+/** @brief sets res = k-normalize(a) -- output in int64 coeffs space */
+EXPORT void vec_znx_big_normalize_base2k(const MODULE* module,                              // N
+                                         uint64_t log2_base2k,                              // base-2^k
+                                         int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
+                                         const VEC_ZNX_BIG* a, uint64_t a_size,             // a
+                                         uint8_t* tmp_space                                 // temp space
+);
+
+/** @brief returns the minimal byte length of scratch space for vec_znx_big_normalize_base2k */
+EXPORT uint64_t vec_znx_big_normalize_base2k_tmp_bytes(const MODULE* module,  // N
+                                                       uint64_t res_size,     // res size
+                                                       uint64_t inp_size      // inp size
+);
+
+/** @brief apply a svp product, result = ppol * a, presented in DFT space */
+EXPORT void fft64_svp_apply_dft(const MODULE* module,                             // N
+                                const VEC_ZNX_DFT* res, uint64_t res_size,        // output
+                                const SVP_PPOL* ppol,                             // prepared pol
+                                const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
+);
+
+/** @brief sets res = k-normalize(a.subrange) -- output in int64 coeffs space */
+EXPORT void vec_znx_big_range_normalize_base2k(                                                  //
+    const MODULE* module,                                                                        // N
+    uint64_t log2_base2k,                                                                        // base-2^k
+    int64_t* res, uint64_t res_size, uint64_t res_sl,                                            // res
+    const VEC_ZNX_BIG* a, uint64_t a_range_begin, uint64_t a_range_xend, uint64_t a_range_step,  // range
+    uint8_t* tmp_space                                                                           // temp space
+);
+
+/** @brief returns the minimal byte length of scratch space for vec_znx_big_range_normalize_base2k */
+EXPORT uint64_t vec_znx_big_range_normalize_base2k_tmp_bytes(  //
+    const MODULE* module,                                      // N
+    uint64_t res_size,                                         // res size
+    uint64_t inp_size                                          // inp size
+);
+
+/** @brief sets res = a . X^p */
+EXPORT void vec_znx_big_rotate(const MODULE* module,                  // N
+                               int64_t p,                             // rotation value
+                               VEC_ZNX_BIG* res, uint64_t res_size,   // res
+                               const VEC_ZNX_BIG* a, uint64_t a_size  // a
+);
+
+/** @brief sets res = a(X^p) */
+EXPORT void vec_znx_big_automorphism(const MODULE* module,                  // N
+                                     int64_t p,                             // X-X^p
+                                     VEC_ZNX_BIG* res, uint64_t res_size,   // res
+                                     const VEC_ZNX_BIG* a, uint64_t a_size  // a
+);
+
+/** @brief apply a svp product, result = ppol * a, presented in DFT space */
+EXPORT void svp_apply_dft(const MODULE* module,                             // N
+                          const VEC_ZNX_DFT* res, uint64_t res_size,        // output
+                          const SVP_PPOL* ppol,                             // prepared pol
+                          const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
+);
+
+/** @brief prepares a svp polynomial  */
+EXPORT void svp_prepare(const MODULE* module,  // N
+                        SVP_PPOL* ppol,        // output
+                        const int64_t* pol     // a
+);
+
+/** @brief res = a * b : small integer polynomial product  */
+EXPORT void znx_small_single_product(const MODULE* module,  // N
+                                     int64_t* res,          // output
+                                     const int64_t* a,      // a
+                                     const int64_t* b,      // b
+                                     uint8_t* tmp);
+
+/** @brief tmp bytes required for znx_small_single_product  */
+EXPORT uint64_t znx_small_single_product_tmp_bytes(const MODULE* module);
+
+/** @brief prepares a vmp matrix (contiguous row-major version) */
+EXPORT void vmp_prepare_contiguous(const MODULE* module,                                // N
+                                   VMP_PMAT* pmat,                                      // output
+                                   const int64_t* mat, uint64_t nrows, uint64_t ncols,  // a
+                                   uint8_t* tmp_space                                   // scratch space
+);
+
+/** @brief minimal scratch space byte-size required for the vmp_prepare function */
+EXPORT uint64_t vmp_prepare_contiguous_tmp_bytes(const MODULE* module,  // N
+                                                 uint64_t nrows, uint64_t ncols);
+
+/** @brief applies a vmp product (result in DFT space) */
+EXPORT void vmp_apply_dft(const MODULE* module,                                  // N
+                          VEC_ZNX_DFT* res, uint64_t res_size,                   // res
+                          const int64_t* a, uint64_t a_size, uint64_t a_sl,      // a
+                          const VMP_PMAT* pmat, uint64_t nrows, uint64_t ncols,  // prep matrix
+                          uint8_t* tmp_space                                     // scratch space
+);
+
+/** @brief minimal size of the tmp_space */
+EXPORT uint64_t vmp_apply_dft_tmp_bytes(const MODULE* module,           // N
+                                        uint64_t res_size,              // res
+                                        uint64_t a_size,                // a
+                                        uint64_t nrows, uint64_t ncols  // prep matrix
+);
+
+/** @brief minimal size of the tmp_space */
+EXPORT void vmp_apply_dft_to_dft(const MODULE* module,                       // N
+                                 VEC_ZNX_DFT* res, const uint64_t res_size,  // res
+                                 const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
+                                 const VMP_PMAT* pmat, const uint64_t nrows,
+                                 const uint64_t ncols,  // prep matrix
+                                 uint8_t* tmp_space     // scratch space (a_size*sizeof(reim4) bytes)
+);
+;
+
+/** @brief minimal size of the tmp_space */
+EXPORT uint64_t vmp_apply_dft_to_dft_tmp_bytes(const MODULE* module,           // N
+                                               uint64_t res_size,              // res
+                                               uint64_t a_size,                // a
+                                               uint64_t nrows, uint64_t ncols  // prep matrix
+);
+#endif  // SPQLIOS_VEC_ZNX_ARITHMETIC_H
diff --git a/spqlios/arithmetic/vec_znx_arithmetic_private.h b/spqlios/arithmetic/vec_znx_arithmetic_private.h

-Original file line number
+Diff line change
 +#ifndef SPQLIOS_VEC_ZNX_ARITHMETIC_PRIVATE_H
 +#define SPQLIOS_VEC_ZNX_ARITHMETIC_PRIVATE_H
++
 +#include "../commons_private.h"
 +#include "../q120/q120_ntt.h"
 +#include "vec_znx_arithmetic.h"
++
 +/**
 + * Layouts families:
 + *
 + * fft64:
 + *   K: <= 20, N: <= 65536, ell: <= 200
 + *   vec<ZnX> normalized: represented by int64
 + *   vec<ZnX> large: represented by int64 (expect <=52 bits)
 + *   vec<ZnX> DFT: represented by double (reim_fft space)
 + *   On AVX2 inftastructure, PMAT, LCNV, RCNV use a special reim4_fft space
 + *
 + * ntt120:
 + *   K: <= 50, N: <= 65536, ell: <= 80
 + *   vec<ZnX> normalized: represented by int64
 + *   vec<ZnX> large: represented by int128 (expect <=120 bits)
 + *   vec<ZnX> DFT: represented by int64x4 (ntt120 space)
 + *   On AVX2 inftastructure, PMAT, LCNV, RCNV use a special ntt120 space
 + *
 + * ntt104:
 + *   K: <= 40, N: <= 65536, ell: <= 80
 + *   vec<ZnX> normalized: represented by int64
 + *   vec<ZnX> large: represented by int128 (expect <=120 bits)
 + *   vec<ZnX> DFT: represented by int64x4 (ntt120 space)
 + *   On AVX512 inftastructure, PMAT, LCNV, RCNV use a special ntt104 space
 + */
++
 +struct fft64_module_info_t {
 +  // pre-computation for reim_fft
 +  REIM_FFT_PRECOMP* p_fft;
 +  // pre-computation for mul_fft
 +  REIM_FFTVEC_MUL_PRECOMP* mul_fft;
 +  // pre-computation for reim_from_znx6
 +  REIM_FROM_ZNX64_PRECOMP* p_conv;
 +  // pre-computation for reim_tp_znx6
 +  REIM_TO_ZNX64_PRECOMP* p_reim_to_znx;
 +  // pre-computation for reim_fft
 +  REIM_IFFT_PRECOMP* p_ifft;
 +  // pre-computation for reim_fftvec_addmul
 +  REIM_FFTVEC_ADDMUL_PRECOMP* p_addmul;
 +};
++
 +struct q120_module_info_t {
 +  // pre-computation for q120b to q120b ntt
 +  q120_ntt_precomp* p_ntt;
 +  // pre-computation for q120b to q120b intt
 +  q120_ntt_precomp* p_intt;
 +};
++
 +// TODO add function types here
 +typedef typeof(vmp_pmat_alloc) VMP_PMAT_ALLOC_F;
 +typedef typeof(vec_znx_dft_alloc) VEC_ZNX_DFT_ALLOC_F;
 +typedef typeof(vec_znx_big_alloc) VEC_ZNX_BIG_ALLOC_F;
 +typedef typeof(svp_ppol_alloc) SVP_PPOL_ALLOC_F;
 +typedef typeof(vec_znx_zero) VEC_ZNX_ZERO_F;
 +typedef typeof(vec_znx_copy) VEC_ZNX_COPY_F;
 +typedef typeof(vec_znx_negate) VEC_ZNX_NEGATE_F;
 +typedef typeof(vec_znx_add) VEC_ZNX_ADD_F;
 +typedef typeof(vec_znx_dft) VEC_ZNX_DFT_F;
 +typedef typeof(vec_znx_idft) VEC_ZNX_IDFT_F;
 +typedef typeof(vec_znx_idft_tmp_bytes) VEC_ZNX_IDFT_TMP_BYTES_F;
 +typedef typeof(vec_znx_idft_tmp_a) VEC_ZNX_IDFT_TMP_A_F;
 +typedef typeof(vec_znx_sub) VEC_ZNX_SUB_F;
 +typedef typeof(vec_znx_rotate) VEC_ZNX_ROTATE_F;
 +typedef typeof(vec_znx_automorphism) VEC_ZNX_AUTOMORPHISM_F;
 +typedef typeof(vec_znx_normalize_base2k) VEC_ZNX_NORMALIZE_BASE2K_F;
 +typedef typeof(vec_znx_normalize_base2k_tmp_bytes) VEC_ZNX_NORMALIZE_BASE2K_TMP_BYTES_F;
 +typedef typeof(vec_znx_big_normalize_base2k) VEC_ZNX_BIG_NORMALIZE_BASE2K_F;
 +typedef typeof(vec_znx_big_normalize_base2k_tmp_bytes) VEC_ZNX_BIG_NORMALIZE_BASE2K_TMP_BYTES_F;
 +typedef typeof(vec_znx_big_range_normalize_base2k) VEC_ZNX_BIG_RANGE_NORMALIZE_BASE2K_F;
 +typedef typeof(vec_znx_big_range_normalize_base2k_tmp_bytes) VEC_ZNX_BIG_RANGE_NORMALIZE_BASE2K_TMP_BYTES_F;
 +typedef typeof(vec_znx_big_add) VEC_ZNX_BIG_ADD_F;
 +typedef typeof(vec_znx_big_add_small) VEC_ZNX_BIG_ADD_SMALL_F;
 +typedef typeof(vec_znx_big_add_small2) VEC_ZNX_BIG_ADD_SMALL2_F;
 +typedef typeof(vec_znx_big_sub) VEC_ZNX_BIG_SUB_F;
 +typedef typeof(vec_znx_big_sub_small_a) VEC_ZNX_BIG_SUB_SMALL_A_F;
 +typedef typeof(vec_znx_big_sub_small_b) VEC_ZNX_BIG_SUB_SMALL_B_F;
 +typedef typeof(vec_znx_big_sub_small2) VEC_ZNX_BIG_SUB_SMALL2_F;
 +typedef typeof(vec_znx_big_rotate) VEC_ZNX_BIG_ROTATE_F;
 +typedef typeof(vec_znx_big_automorphism) VEC_ZNX_BIG_AUTOMORPHISM_F;
 +typedef typeof(svp_prepare) SVP_PREPARE;
 +typedef typeof(svp_apply_dft) SVP_APPLY_DFT_F;
 +typedef typeof(znx_small_single_product) ZNX_SMALL_SINGLE_PRODUCT_F;
 +typedef typeof(znx_small_single_product_tmp_bytes) ZNX_SMALL_SINGLE_PRODUCT_TMP_BYTES_F;
 +typedef typeof(vmp_prepare_contiguous) VMP_PREPARE_CONTIGUOUS_F;
 +typedef typeof(vmp_prepare_contiguous_tmp_bytes) VMP_PREPARE_CONTIGUOUS_TMP_BYTES_F;
 +typedef typeof(vmp_apply_dft) VMP_APPLY_DFT_F;
 +typedef typeof(vmp_apply_dft_tmp_bytes) VMP_APPLY_DFT_TMP_BYTES_F;
 +typedef typeof(vmp_apply_dft_to_dft) VMP_APPLY_DFT_TO_DFT_F;
 +typedef typeof(vmp_apply_dft_to_dft_tmp_bytes) VMP_APPLY_DFT_TO_DFT_TMP_BYTES_F;
++
 +struct module_virtual_functions_t {
 +  // TODO add functions here
 +  VMP_PMAT_ALLOC_F* vmp_pmat_alloc;
 +  VEC_ZNX_DFT_ALLOC_F* vec_znx_dft_alloc;
 +  VEC_ZNX_BIG_ALLOC_F* vec_znx_big_alloc;
 +  SVP_PPOL_ALLOC_F* svp_ppol_alloc;
 +  VEC_ZNX_ZERO_F* vec_znx_zero;
 +  VEC_ZNX_COPY_F* vec_znx_copy;
 +  VEC_ZNX_NEGATE_F* vec_znx_negate;
 +  VEC_ZNX_ADD_F* vec_znx_add;
 +  VEC_ZNX_DFT_F* vec_znx_dft;
 +  VEC_ZNX_IDFT_F* vec_znx_idft;
 +  VEC_ZNX_IDFT_TMP_BYTES_F* vec_znx_idft_tmp_bytes;
 +  VEC_ZNX_IDFT_TMP_A_F* vec_znx_idft_tmp_a;
 +  VEC_ZNX_SUB_F* vec_znx_sub;
 +  VEC_ZNX_ROTATE_F* vec_znx_rotate;
 +  VEC_ZNX_AUTOMORPHISM_F* vec_znx_automorphism;
 +  VEC_ZNX_NORMALIZE_BASE2K_F* vec_znx_normalize_base2k;
 +  VEC_ZNX_NORMALIZE_BASE2K_TMP_BYTES_F* vec_znx_normalize_base2k_tmp_bytes;
 +  VEC_ZNX_BIG_NORMALIZE_BASE2K_F* vec_znx_big_normalize_base2k;
 +  VEC_ZNX_BIG_NORMALIZE_BASE2K_TMP_BYTES_F* vec_znx_big_normalize_base2k_tmp_bytes;
 +  VEC_ZNX_BIG_RANGE_NORMALIZE_BASE2K_F* vec_znx_big_range_normalize_base2k;
 +  VEC_ZNX_BIG_RANGE_NORMALIZE_BASE2K_TMP_BYTES_F* vec_znx_big_range_normalize_base2k_tmp_bytes;
 +  VEC_ZNX_BIG_ADD_F* vec_znx_big_add;
 +  VEC_ZNX_BIG_ADD_SMALL_F* vec_znx_big_add_small;
 +  VEC_ZNX_BIG_ADD_SMALL2_F* vec_znx_big_add_small2;
 +  VEC_ZNX_BIG_SUB_F* vec_znx_big_sub;
 +  VEC_ZNX_BIG_SUB_SMALL_A_F* vec_znx_big_sub_small_a;
 +  VEC_ZNX_BIG_SUB_SMALL_B_F* vec_znx_big_sub_small_b;
 +  VEC_ZNX_BIG_SUB_SMALL2_F* vec_znx_big_sub_small2;
 +  VEC_ZNX_BIG_ROTATE_F* vec_znx_big_rotate;
 +  VEC_ZNX_BIG_AUTOMORPHISM_F* vec_znx_big_automorphism;
 +  SVP_PREPARE* svp_prepare;
 +  SVP_APPLY_DFT_F* svp_apply_dft;
 +  ZNX_SMALL_SINGLE_PRODUCT_F* znx_small_single_product;
 +  ZNX_SMALL_SINGLE_PRODUCT_TMP_BYTES_F* znx_small_single_product_tmp_bytes;
 +  VMP_PREPARE_CONTIGUOUS_F* vmp_prepare_contiguous;
 +  VMP_PREPARE_CONTIGUOUS_TMP_BYTES_F* vmp_prepare_contiguous_tmp_bytes;
 +  VMP_APPLY_DFT_F* vmp_apply_dft;
 +  VMP_APPLY_DFT_TMP_BYTES_F* vmp_apply_dft_tmp_bytes;
 +  VMP_APPLY_DFT_TO_DFT_F* vmp_apply_dft_to_dft;
 +  VMP_APPLY_DFT_TO_DFT_TMP_BYTES_F* vmp_apply_dft_to_dft_tmp_bytes;
 +};
++
 +union backend_module_info_t {
 +  struct fft64_module_info_t fft64;
 +  struct q120_module_info_t q120;
 +};
++
 +struct module_info_t {
 +  // generic parameters
 +  MODULE_TYPE module_type;
 +  uint64_t nn;
 +  uint64_t m;
 +  // backend_dependent functions
 +  union backend_module_info_t mod;
 +  // virtual functions
 +  struct module_virtual_functions_t func;
 +};
++
 +EXPORT VMP_PMAT* fft64_vmp_pmat_alloc(const MODULE* module,           // N
 +                                      uint64_t nrows, uint64_t ncols  // dimensions
 +);
++
 +EXPORT VEC_ZNX_DFT* fft64_vec_znx_dft_alloc(const MODULE* module,  // N
 +                                            uint64_t size);
++
 +EXPORT VEC_ZNX_BIG* fft64_vec_znx_big_alloc(const MODULE* module,  // N
 +                                            uint64_t size);
++
 +EXPORT SVP_PPOL* fft64_svp_ppol_alloc(const MODULE* module);  // N
++
 +EXPORT void vec_znx_zero_ref(const MODULE* module,                             // N
 +                             int64_t* res, uint64_t res_size, uint64_t res_sl  // res
 +);
++
 +EXPORT void vec_znx_copy_ref(const MODULE* precomp,                             // N
 +                             int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                             const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
 +);
++
 +EXPORT void vec_znx_negate_ref(const MODULE* module,                              // N
 +                               int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                               const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
 +);
++
 +EXPORT void vec_znx_negate_avx(const MODULE* module,                              // N
 +                               int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                               const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
 +);
++
 +EXPORT void vec_znx_add_ref(const MODULE* module,                              // N
 +                            int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                            const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                            const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
 +EXPORT void vec_znx_add_avx(const MODULE* module,                              // N
 +                            int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                            const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                            const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
++
 +EXPORT void vec_znx_sub_ref(const MODULE* precomp,                             // N
 +                            int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                            const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                            const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
++
 +EXPORT void vec_znx_sub_avx(const MODULE* module,                              // N
 +                            int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                            const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                            const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
++
 +EXPORT void vec_znx_normalize_base2k_ref(const MODULE* module,                              // N
 +                                         uint64_t log2_base2k,                              // output base 2^K
 +                                         int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                                         const int64_t* a, uint64_t a_size, uint64_t a_sl,  // inp
 +                                         uint8_t* tmp_space                                 // scratch space
 +);
++
 +EXPORT uint64_t vec_znx_normalize_base2k_tmp_bytes_ref(const MODULE* module,  // N
 +                                                       uint64_t res_size,     // res size
 +                                                       uint64_t inp_size      // inp size
 +);
++
 +EXPORT void vec_znx_rotate_ref(const MODULE* module,                              // N
 +                               const int64_t p,                                   // rotation value
 +                               int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                               const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
 +);
++
 +EXPORT void vec_znx_automorphism_ref(const MODULE* module,                              // N
 +                                     const int64_t p,                                   // X->X^p
 +                                     int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                                     const int64_t* a, uint64_t a_size, uint64_t a_sl   // a
 +);
++
 +EXPORT void vmp_prepare_ref(const MODULE* precomp,                              // N
 +                            VMP_PMAT* pmat,                                     // output
 +                            const int64_t* mat, uint64_t nrows, uint64_t ncols  // a
 +);
++
 +EXPORT void vmp_apply_dft_ref(const MODULE* precomp,                                // N
 +                              VEC_ZNX_DFT* res, uint64_t res_size,                  // res
 +                              const int64_t* a, uint64_t a_size, uint64_t a_sl,     // a
 +                              const VMP_PMAT* pmat, uint64_t nrows, uint64_t ncols  // prep matrix
 +);
++
 +EXPORT void vec_dft_zero_ref(const MODULE* precomp,               // N
 +                             VEC_ZNX_DFT* res, uint64_t res_size  // res
 +);
++
 +EXPORT void vec_dft_add_ref(const MODULE* precomp,                  // N
 +                            VEC_ZNX_DFT* res, uint64_t res_size,    // res
 +                            const VEC_ZNX_DFT* a, uint64_t a_size,  // a
 +                            const VEC_ZNX_DFT* b, uint64_t b_size   // b
 +);
++
 +EXPORT void vec_dft_sub_ref(const MODULE* precomp,                  // N
 +                            VEC_ZNX_DFT* res, uint64_t res_size,    // res
 +                            const VEC_ZNX_DFT* a, uint64_t a_size,  // a
 +                            const VEC_ZNX_DFT* b, uint64_t b_size   // b
 +);
++
 +EXPORT void vec_dft_ref(const MODULE* precomp,                            // N
 +                        VEC_ZNX_DFT* res, uint64_t res_size,              // res
 +                        const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
 +);
++
 +EXPORT void vec_idft_ref(const MODULE* precomp,                // N
 +                         VEC_ZNX_BIG* res, uint64_t res_size,  // res
 +                         const VEC_ZNX_DFT* a_dft, uint64_t a_size);
++
 +EXPORT void vec_znx_big_normalize_ref(const MODULE* precomp,                             // N
 +                                      uint64_t k,                                        // base-2^k
 +                                      int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                                      const VEC_ZNX_BIG* a, uint64_t a_size              // a
 +);
++
 +/** @brief apply a svp product, result = ppol * a, presented in DFT space  */
 +EXPORT void fft64_svp_apply_dft_ref(const MODULE* module,                             // N
 +                                    const VEC_ZNX_DFT* res, uint64_t res_size,        // output
 +                                    const SVP_PPOL* ppol,                             // prepared pol
 +                                    const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
 +);
++
 +/** @brief sets res = k-normalize(a) -- output in int64 coeffs space */
 +EXPORT void fft64_vec_znx_big_normalize_base2k(const MODULE* module,                              // N
 +                                               uint64_t k,                                        // base-2^k
 +                                               int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                                               const VEC_ZNX_BIG* a, uint64_t a_size,             // a
 +                                               uint8_t* tmp_space                                 // temp space
 +);
++
 +/** @brief returns the minimal byte length of scratch space for vec_znx_big_normalize_base2k */
 +EXPORT uint64_t fft64_vec_znx_big_normalize_base2k_tmp_bytes(const MODULE* module,  // N
 +                                                             uint64_t res_size,     // res size
 +                                                             uint64_t inp_size      // inp size
++
 +);
++
 +/** @brief sets res = k-normalize(a.subrange) -- output in int64 coeffs space */
 +EXPORT void fft64_vec_znx_big_range_normalize_base2k(const MODULE* module,                              // N
 +                                                     uint64_t log2_base2k,                              // base-2^k
 +                                                     int64_t* res, uint64_t res_size, uint64_t res_sl,  // res
 +                                                     const VEC_ZNX_BIG* a, uint64_t a_range_begin,      // a
 +                                                     uint64_t a_range_xend, uint64_t a_range_step,      // range
 +                                                     uint8_t* tmp_space                                 // temp space
 +);
++
 +/** @brief returns the minimal byte length of scratch space for vec_znx_big_range_normalize_base2k */
 +EXPORT uint64_t fft64_vec_znx_big_range_normalize_base2k_tmp_bytes(const MODULE* module,  // N
 +                                                                   uint64_t res_size,     // res size
 +                                                                   uint64_t inp_size      // inp size
 +);
++
 +EXPORT void fft64_vec_znx_dft(const MODULE* module,                             // N
 +                              VEC_ZNX_DFT* res, uint64_t res_size,              // res
 +                              const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
 +);
++
 +EXPORT void fft64_vec_znx_idft(const MODULE* module,                       // N
 +                               VEC_ZNX_BIG* res, uint64_t res_size,        // res
 +                               const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
 +                               uint8_t* tmp                                // scratch space
 +);
++
 +EXPORT uint64_t fft64_vec_znx_idft_tmp_bytes(const MODULE* module);
++
 +EXPORT void fft64_vec_znx_idft_tmp_a(const MODULE* module,                 // N
 +                                     VEC_ZNX_BIG* res, uint64_t res_size,  // res
 +                                     VEC_ZNX_DFT* a_dft, uint64_t a_size   // a is overwritten
 +);
++
 +EXPORT void ntt120_vec_znx_dft_avx(const MODULE* module,                             // N
 +                                   VEC_ZNX_DFT* res, uint64_t res_size,              // res
 +                                   const int64_t* a, uint64_t a_size, uint64_t a_sl  // a
 +);
++
 +/**   */
 +EXPORT void ntt120_vec_znx_idft_avx(const MODULE* module,                       // N
 +                                    VEC_ZNX_BIG* res, uint64_t res_size,        // res
 +                                    const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
 +                                    uint8_t* tmp                                // scratch space
 +);
++
 +EXPORT uint64_t ntt120_vec_znx_idft_tmp_bytes_avx(const MODULE* module);
++
 +EXPORT void ntt120_vec_znx_idft_tmp_a_avx(const MODULE* module,                 // N
 +                                          VEC_ZNX_BIG* res, uint64_t res_size,  // res
 +                                          VEC_ZNX_DFT* a_dft, uint64_t a_size   // a is overwritten
 +);
++
 +// big additions/subtractions
++
 +/** @brief sets res = a+b */
 +EXPORT void fft64_vec_znx_big_add(const MODULE* module,                   // N
 +                                  VEC_ZNX_BIG* res, uint64_t res_size,    // res
 +                                  const VEC_ZNX_BIG* a, uint64_t a_size,  // a
 +                                  const VEC_ZNX_BIG* b, uint64_t b_size   // b
 +);
 +/** @brief sets res = a+b */
 +EXPORT void fft64_vec_znx_big_add_small(const MODULE* module,                             // N
 +                                        VEC_ZNX_BIG* res, uint64_t res_size,              // res
 +                                        const VEC_ZNX_BIG* a, uint64_t a_size,            // a
 +                                        const int64_t* b, uint64_t b_size, uint64_t b_sl  // b
 +);
 +EXPORT void fft64_vec_znx_big_add_small2(const MODULE* module,                              // N
 +                                         VEC_ZNX_BIG* res, uint64_t res_size,               // res
 +                                         const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                                         const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
++
 +/** @brief sets res = a-b */
 +EXPORT void fft64_vec_znx_big_sub(const MODULE* module,                   // N
 +                                  VEC_ZNX_BIG* res, uint64_t res_size,    // res
 +                                  const VEC_ZNX_BIG* a, uint64_t a_size,  // a
 +                                  const VEC_ZNX_BIG* b, uint64_t b_size   // b
 +);
 +EXPORT void fft64_vec_znx_big_sub_small_b(const MODULE* module,                             // N
 +                                          VEC_ZNX_BIG* res, uint64_t res_size,              // res
 +                                          const VEC_ZNX_BIG* a, uint64_t a_size,            // a
 +                                          const int64_t* b, uint64_t b_size, uint64_t b_sl  // b
 +);
 +EXPORT void fft64_vec_znx_big_sub_small_a(const MODULE* module,                              // N
 +                                          VEC_ZNX_BIG* res, uint64_t res_size,               // res
 +                                          const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                                          const VEC_ZNX_BIG* b, uint64_t b_size              // b
 +);
 +EXPORT void fft64_vec_znx_big_sub_small2(const MODULE* module,                              // N
 +                                         VEC_ZNX_BIG* res, uint64_t res_size,               // res
 +                                         const int64_t* a, uint64_t a_size, uint64_t a_sl,  // a
 +                                         const int64_t* b, uint64_t b_size, uint64_t b_sl   // b
 +);
++
 +/** @brief sets res = a . X^p */
 +EXPORT void fft64_vec_znx_big_rotate(const MODULE* module,                  // N
 +                                     int64_t p,                             // rotation value
 +                                     VEC_ZNX_BIG* res, uint64_t res_size,   // res
 +                                     const VEC_ZNX_BIG* a, uint64_t a_size  // a
 +);
++
 +/** @brief sets res = a(X^p) */
 +EXPORT void fft64_vec_znx_big_automorphism(const MODULE* module,                  // N
 +                                           int64_t p,                             // X-X^p
 +                                           VEC_ZNX_BIG* res, uint64_t res_size,   // res
 +                                           const VEC_ZNX_BIG* a, uint64_t a_size  // a
 +);
++
 +/** @brief prepares a svp polynomial  */
 +EXPORT void fft64_svp_prepare_ref(const MODULE* module,  // N
 +                                  SVP_PPOL* ppol,        // output
 +                                  const int64_t* pol     // a
 +);
++
 +/** @brief res = a * b : small integer polynomial product  */
 +EXPORT void fft64_znx_small_single_product(const MODULE* module,  // N
 +                                           int64_t* res,          // output
 +                                           const int64_t* a,      // a
 +                                           const int64_t* b,      // b
 +                                           uint8_t* tmp);
++
 +/** @brief tmp bytes required for znx_small_single_product  */
 +EXPORT uint64_t fft64_znx_small_single_product_tmp_bytes(const MODULE* module);
++
 +/** @brief prepares a vmp matrix (contiguous row-major version) */
 +EXPORT void fft64_vmp_prepare_contiguous_ref(const MODULE* module,                                // N
 +                                             VMP_PMAT* pmat,                                      // output
 +                                             const int64_t* mat, uint64_t nrows, uint64_t ncols,  // a
 +                                             uint8_t* tmp_space                                   // scratch space
 +);
++
 +/** @brief prepares a vmp matrix (contiguous row-major version) */
 +EXPORT void fft64_vmp_prepare_contiguous_avx(const MODULE* module,                                // N
 +                                             VMP_PMAT* pmat,                                      // output
 +                                             const int64_t* mat, uint64_t nrows, uint64_t ncols,  // a
 +                                             uint8_t* tmp_space                                   // scratch space
 +);
++
 +/** @brief minimal scratch space byte-size required for the vmp_prepare function */
 +EXPORT uint64_t fft64_vmp_prepare_contiguous_tmp_bytes(const MODULE* module,  // N
 +                                                       uint64_t nrows, uint64_t ncols);
++
 +/** @brief applies a vmp product (result in DFT space) */
 +EXPORT void fft64_vmp_apply_dft_ref(const MODULE* module,                                  // N
 +                                    VEC_ZNX_DFT* res, uint64_t res_size,                   // res
 +                                    const int64_t* a, uint64_t a_size, uint64_t a_sl,      // a
 +                                    const VMP_PMAT* pmat, uint64_t nrows, uint64_t ncols,  // prep matrix
 +                                    uint8_t* tmp_space                                     // scratch space
 +);
++
 +/** @brief applies a vmp product (result in DFT space) */
 +EXPORT void fft64_vmp_apply_dft_avx(const MODULE* module,                                  // N
 +                                    VEC_ZNX_DFT* res, uint64_t res_size,                   // res
 +                                    const int64_t* a, uint64_t a_size, uint64_t a_sl,      // a
 +                                    const VMP_PMAT* pmat, uint64_t nrows, uint64_t ncols,  // prep matrix
 +                                    uint8_t* tmp_space                                     // scratch space
 +);
++
 +/** @brief this inner function could be very handy */
 +EXPORT void fft64_vmp_apply_dft_to_dft_ref(const MODULE* module,                       // N
 +                                           VEC_ZNX_DFT* res, const uint64_t res_size,  // res
 +                                           const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
 +                                           const VMP_PMAT* pmat, const uint64_t nrows,
 +                                           const uint64_t ncols,  // prep matrix
 +                                           uint8_t* tmp_space     // scratch space (a_size*sizeof(reim4) bytes)
 +);
++
 +/** @brief this inner function could be very handy */
 +EXPORT void fft64_vmp_apply_dft_to_dft_avx(const MODULE* module,                       // N
 +                                           VEC_ZNX_DFT* res, const uint64_t res_size,  // res
 +                                           const VEC_ZNX_DFT* a_dft, uint64_t a_size,  // a
 +                                           const VMP_PMAT* pmat, const uint64_t nrows,
 +                                           const uint64_t ncols,  // prep matrix
 +                                           uint8_t* tmp_space     // scratch space (a_size*sizeof(reim4) bytes)
 +);
++
 +/** @brief minimal size of the tmp_space */
 +EXPORT uint64_t fft64_vmp_apply_dft_tmp_bytes(const MODULE* module,           // N
 +                                              uint64_t res_size,              // res
 +                                              uint64_t a_size,                // a
 +                                              uint64_t nrows, uint64_t ncols  // prep matrix
 +);
++
 +/** @brief minimal size of the tmp_space */
 +EXPORT uint64_t fft64_vmp_apply_dft_to_dft_tmp_bytes(const MODULE* module,           // N
 +                                                     uint64_t res_size,              // res
 +                                                     uint64_t a_size,                // a
 +                                                     uint64_t nrows, uint64_t ncols  // prep matrix
 +);
 +#endif  // SPQLIOS_VEC_ZNX_ARITHMETIC_PRIVATE_H