From 3ce1bba1942ae217d6ccaec448e5e66badd40d87 Mon Sep 17 00:00:00 2001
From: Carles Fernandez <carles.fernandez@gmail.com>
Date: Thu, 21 Jan 2016 01:40:29 +0100
Subject: [PATCH] Fix execution of puppets when compiled with clang

---
 ...volk_gnsssdr_16ic_resamplerxnpuppet_16ic.h |  48 ++---
 .../volk_gnsssdr_16ic_x2_dot_prod_16ic.h      | 192 +++++++++---------
 ...olk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic.h |  14 +-
 3 files changed, 127 insertions(+), 127 deletions(-)

diff --git a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_resamplerxnpuppet_16ic.h b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_resamplerxnpuppet_16ic.h
index 10fc07c65..396ebc33b 100644
--- a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_resamplerxnpuppet_16ic.h
+++ b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_resamplerxnpuppet_16ic.h
@@ -47,22 +47,22 @@ static inline void volk_gnsssdr_16ic_resamplerxnpuppet_16ic_generic(lv_16sc_t* r
     float code_phase_step_chips = 0.1;
     int code_length_chips = 1023;
     int num_out_vectors = 3;
-    float * rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float)* num_out_vectors, volk_gnsssdr_get_alignment());
+    float* rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float) * num_out_vectors, volk_gnsssdr_get_alignment());
 
-    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_out_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_out_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_out_vectors; n++)
     {
        rem_code_phase_chips[n] = -0.234; 
-       result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());
+       result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t) * num_points, volk_gnsssdr_get_alignment());
     }
     volk_gnsssdr_16ic_xn_resampler_16ic_xn_generic(result_aux, local_code, rem_code_phase_chips, code_phase_step_chips, code_length_chips, num_out_vectors, num_points);
 
-    memcpy(result, result_aux[0], sizeof(lv_16sc_t)*num_points);
+    memcpy((lv_16sc_t*)result, (lv_16sc_t*)result_aux[0], sizeof(lv_16sc_t) * num_points);
     volk_gnsssdr_free(rem_code_phase_chips);
-//    for(unsigned int n = 0; n < num_out_vectors; n++)
-//    {
-//        volk_gnsssdr_free(result_aux[n]);
-//    }
+    for(unsigned int n = 0; n < num_out_vectors; n++)
+    {
+        volk_gnsssdr_free(result_aux[n]);
+    }
     volk_gnsssdr_free(result_aux);
 }
 
@@ -74,21 +74,21 @@ static inline void volk_gnsssdr_16ic_resamplerxnpuppet_16ic_a_sse2(lv_16sc_t* re
     float code_phase_step_chips = 0.1;
     int code_length_chips = 1023;
     int num_out_vectors = 3;
-    float * rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float)* num_out_vectors, volk_gnsssdr_get_alignment());
-    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_out_vectors, volk_gnsssdr_get_alignment());
+    float * rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float) * num_out_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_out_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_out_vectors; n++)
     {
         rem_code_phase_chips[n] = -0.234; 
-        result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());
+        result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t) * num_points, volk_gnsssdr_get_alignment());
     }
     volk_gnsssdr_16ic_xn_resampler_16ic_xn_a_sse2(result_aux, local_code, rem_code_phase_chips, code_phase_step_chips, code_length_chips, num_out_vectors, num_points);
 
-    memcpy(result, result_aux[0], sizeof(lv_16sc_t)*num_points);
+    memcpy(result, result_aux[0], sizeof(lv_16sc_t) * num_points);
     volk_gnsssdr_free(rem_code_phase_chips);
-//    for(unsigned int n = 0; n < num_out_vectors; n++)
-//    {
-//        volk_gnsssdr_free(result_aux[n]);
-//    }
+    for(unsigned int n = 0; n < num_out_vectors; n++)
+    {
+        volk_gnsssdr_free(result_aux[n]);
+    }
     volk_gnsssdr_free(result_aux);
 }
 
@@ -101,21 +101,21 @@ static inline void volk_gnsssdr_16ic_resamplerxnpuppet_16ic_u_sse2(lv_16sc_t* re
     float code_phase_step_chips = 0.1;
     int code_length_chips = 1023;
     int num_out_vectors = 3;
-    float * rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float)* num_out_vectors, volk_gnsssdr_get_alignment());
-    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_out_vectors, volk_gnsssdr_get_alignment());
+    float * rem_code_phase_chips = (float*)volk_gnsssdr_malloc(sizeof(float) * num_out_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** result_aux =  (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_out_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_out_vectors; n++)
     {
         rem_code_phase_chips[n] = -0.234;
-        result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());
+        result_aux[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t) * num_points, volk_gnsssdr_get_alignment());
     }
     volk_gnsssdr_16ic_xn_resampler_16ic_xn_u_sse2(result_aux, local_code, rem_code_phase_chips, code_phase_step_chips, code_length_chips, num_out_vectors, num_points);
 
-    memcpy(result, result_aux[0], sizeof(lv_16sc_t)*num_points);
+    memcpy(result, result_aux[0], sizeof(lv_16sc_t) * num_points);
     volk_gnsssdr_free(rem_code_phase_chips);
-//    for(unsigned int n = 0; n < num_out_vectors; n++)
-//    {
-//        volk_gnsssdr_free(result_aux[n]);
-//    }
+    for(unsigned int n = 0; n < num_out_vectors; n++)
+    {
+        volk_gnsssdr_free(result_aux[n]);
+    }
     volk_gnsssdr_free(result_aux);
 }
 
diff --git a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dot_prod_16ic.h b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dot_prod_16ic.h
index 3cc180658..b20b4467a 100644
--- a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dot_prod_16ic.h
+++ b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dot_prod_16ic.h
@@ -67,73 +67,73 @@ static inline void volk_gnsssdr_16ic_x2_dot_prod_16ic_generic(lv_16sc_t* result,
 #include <emmintrin.h>
 static inline void volk_gnsssdr_16ic_x2_dot_prod_16ic_a_sse2(lv_16sc_t* out, const lv_16sc_t* in_a, const lv_16sc_t* in_b, unsigned int num_points)
 {
-	  lv_16sc_t dotProduct = lv_cmake((int16_t)0, (int16_t)0);
+    lv_16sc_t dotProduct = lv_cmake((int16_t)0, (int16_t)0);
 
-	    const unsigned int sse_iters = num_points / 4;
+    const unsigned int sse_iters = num_points / 4;
 
-	    const lv_16sc_t* _in_a = in_a;
-	    const lv_16sc_t* _in_b = in_b;
-	    lv_16sc_t* _out = out;
+    const lv_16sc_t* _in_a = in_a;
+    const lv_16sc_t* _in_b = in_b;
+    lv_16sc_t* _out = out;
 
-	    if (sse_iters > 0)
-	        {
-	            __m128i a,b,c, c_sr, mask_imag, mask_real, real, imag, imag1,imag2, b_sl, a_sl, realcacc, imagcacc, result;
+    if (sse_iters > 0)
+        {
+            __m128i a,b,c, c_sr, mask_imag, mask_real, real, imag, imag1,imag2, b_sl, a_sl, realcacc, imagcacc, result;
 
-	            realcacc = _mm_setzero_si128();
-	            imagcacc = _mm_setzero_si128();
+            realcacc = _mm_setzero_si128();
+            imagcacc = _mm_setzero_si128();
 
-	            mask_imag = _mm_set_epi8(255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0);
-	            mask_real = _mm_set_epi8(0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255);
+            mask_imag = _mm_set_epi8(255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0);
+            mask_real = _mm_set_epi8(0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255);
 
-	            for(unsigned int number = 0; number < sse_iters; number++)
-	                {
-	                    //std::complex<T> memory structure: real part -> reinterpret_cast<cv T*>(a)[2*i]
-	                    //imaginery part -> reinterpret_cast<cv T*>(a)[2*i + 1]
-	                    // a[127:0]=[a3.i,a3.r,a2.i,a2.r,a1.i,a1.r,a0.i,a0.r]
-	                    a = _mm_load_si128((__m128i*)_in_a); //load (2 byte imag, 2 byte real) x 4 into 128 bits reg
-	                    b = _mm_load_si128((__m128i*)_in_b);
-	                    c = _mm_mullo_epi16 (a, b); // a3.i*b3.i, a3.r*b3.r, ....
+            for(unsigned int number = 0; number < sse_iters; number++)
+                {
+                    //std::complex<T> memory structure: real part -> reinterpret_cast<cv T*>(a)[2*i]
+                    //imaginery part -> reinterpret_cast<cv T*>(a)[2*i + 1]
+                    // a[127:0]=[a3.i,a3.r,a2.i,a2.r,a1.i,a1.r,a0.i,a0.r]
+                    a = _mm_load_si128((__m128i*)_in_a); //load (2 byte imag, 2 byte real) x 4 into 128 bits reg
+                    b = _mm_load_si128((__m128i*)_in_b);
+                    c = _mm_mullo_epi16 (a, b); // a3.i*b3.i, a3.r*b3.r, ....
 
-	                    c_sr = _mm_srli_si128 (c, 2); // Shift a right by imm8 bytes while shifting in zeros, and store the results in dst.
-	                    real = _mm_subs_epi16 (c,c_sr);
+                    c_sr = _mm_srli_si128 (c, 2); // Shift a right by imm8 bytes while shifting in zeros, and store the results in dst.
+                    real = _mm_subs_epi16 (c,c_sr);
 
-	                    b_sl = _mm_slli_si128(b, 2); // b3.r, b2.i ....
-	                    a_sl = _mm_slli_si128(a, 2); // a3.r, a2.i ....
+                    b_sl = _mm_slli_si128(b, 2); // b3.r, b2.i ....
+                    a_sl = _mm_slli_si128(a, 2); // a3.r, a2.i ....
 
-	                    imag1 = _mm_mullo_epi16(a, b_sl); // a3.i*b3.r, ....
-	                    imag2 = _mm_mullo_epi16(b, a_sl); // b3.i*a3.r, ....
+                    imag1 = _mm_mullo_epi16(a, b_sl); // a3.i*b3.r, ....
+                    imag2 = _mm_mullo_epi16(b, a_sl); // b3.i*a3.r, ....
 
-	                    imag = _mm_adds_epi16(imag1, imag2); //with saturation aritmetic!
+                    imag = _mm_adds_epi16(imag1, imag2); //with saturation aritmetic!
 
-	                    realcacc = _mm_adds_epi16 (realcacc, real);
-	                    imagcacc = _mm_adds_epi16 (imagcacc, imag);
+                    realcacc = _mm_adds_epi16 (realcacc, real);
+                    imagcacc = _mm_adds_epi16 (imagcacc, imag);
 
-	                    _in_a += 4;
-	                    _in_b += 4;
-	                }
+                    _in_a += 4;
+                    _in_b += 4;
+                }
 
-	            realcacc = _mm_and_si128 (realcacc, mask_real);
-	            imagcacc = _mm_and_si128 (imagcacc, mask_imag);
+            realcacc = _mm_and_si128 (realcacc, mask_real);
+            imagcacc = _mm_and_si128 (imagcacc, mask_imag);
 
-	            result = _mm_or_si128 (realcacc, imagcacc);
+            result = _mm_or_si128 (realcacc, imagcacc);
 
-	            __VOLK_ATTR_ALIGNED(16) lv_16sc_t dotProductVector[4];
+            __VOLK_ATTR_ALIGNED(16) lv_16sc_t dotProductVector[4];
 
-	            _mm_store_si128((__m128i*)dotProductVector,result); // Store the results back into the dot product vector
+            _mm_store_si128((__m128i*)dotProductVector,result); // Store the results back into the dot product vector
 
-	            for (int i = 0; i < 4; ++i)
-	                {
-	                    dotProduct = lv_cmake(sat_adds16i(lv_creal(dotProduct), lv_creal(dotProductVector[i])), sat_adds16i(lv_cimag(dotProduct), lv_cimag(dotProductVector[i])));
-	                }
-	        }
+            for (int i = 0; i < 4; ++i)
+                {
+                    dotProduct = lv_cmake(sat_adds16i(lv_creal(dotProduct), lv_creal(dotProductVector[i])), sat_adds16i(lv_cimag(dotProduct), lv_cimag(dotProductVector[i])));
+                }
+        }
 
-	    for (unsigned int i = 0; i < (num_points % 4); ++i)
-	        {
-	            lv_16sc_t tmp = (*_in_a++) * (*_in_b++);
-	            dotProduct = lv_cmake( sat_adds16i(lv_creal(dotProduct), lv_creal(tmp)), sat_adds16i(lv_cimag(dotProduct), lv_cimag(tmp)));
-	        }
+    for (unsigned int i = 0; i < (num_points % 4); ++i)
+        {
+            lv_16sc_t tmp = (*_in_a++) * (*_in_b++);
+            dotProduct = lv_cmake( sat_adds16i(lv_creal(dotProduct), lv_creal(tmp)), sat_adds16i(lv_cimag(dotProduct), lv_cimag(tmp)));
+        }
 
-	    *_out = dotProduct;
+    *_out = dotProduct;
 }
 
 #endif /* LV_HAVE_SSE2 */
@@ -144,73 +144,73 @@ static inline void volk_gnsssdr_16ic_x2_dot_prod_16ic_a_sse2(lv_16sc_t* out, con
 
 static inline void volk_gnsssdr_16ic_x2_dot_prod_16ic_u_sse2(lv_16sc_t* out, const lv_16sc_t* in_a, const lv_16sc_t* in_b, unsigned int num_points)
 {
-	  lv_16sc_t dotProduct = lv_cmake((int16_t)0, (int16_t)0);
+    lv_16sc_t dotProduct = lv_cmake((int16_t)0, (int16_t)0);
 
-	    const unsigned int sse_iters = num_points / 4;
+    const unsigned int sse_iters = num_points / 4;
 
-	    const lv_16sc_t* _in_a = in_a;
-	    const lv_16sc_t* _in_b = in_b;
-	    lv_16sc_t* _out = out;
+    const lv_16sc_t* _in_a = in_a;
+    const lv_16sc_t* _in_b = in_b;
+    lv_16sc_t* _out = out;
 
-	    if (sse_iters > 0)
-	        {
-	            __m128i a,b,c, c_sr, mask_imag, mask_real, real, imag, imag1,imag2, b_sl, a_sl, realcacc, imagcacc, result;
+    if (sse_iters > 0)
+        {
+            __m128i a,b,c, c_sr, mask_imag, mask_real, real, imag, imag1,imag2, b_sl, a_sl, realcacc, imagcacc, result;
 
-	            realcacc = _mm_setzero_si128();
-	            imagcacc = _mm_setzero_si128();
+            realcacc = _mm_setzero_si128();
+            imagcacc = _mm_setzero_si128();
 
-	            mask_imag = _mm_set_epi8(255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0);
-	            mask_real = _mm_set_epi8(0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255);
+            mask_imag = _mm_set_epi8(255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0);
+            mask_real = _mm_set_epi8(0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255, 0, 0, 255, 255);
 
-	            for(unsigned int number = 0; number < sse_iters; number++)
-	                {
-	                    //std::complex<T> memory structure: real part -> reinterpret_cast<cv T*>(a)[2*i]
-	                    //imaginery part -> reinterpret_cast<cv T*>(a)[2*i + 1]
-	                    // a[127:0]=[a3.i,a3.r,a2.i,a2.r,a1.i,a1.r,a0.i,a0.r]
-	                    a = _mm_loadu_si128((__m128i*)_in_a); //load (2 byte imag, 2 byte real) x 4 into 128 bits reg
-	                    b = _mm_loadu_si128((__m128i*)_in_b);
-	                    c = _mm_mullo_epi16 (a, b); // a3.i*b3.i, a3.r*b3.r, ....
+            for(unsigned int number = 0; number < sse_iters; number++)
+                {
+                    //std::complex<T> memory structure: real part -> reinterpret_cast<cv T*>(a)[2*i]
+                    //imaginery part -> reinterpret_cast<cv T*>(a)[2*i + 1]
+                    // a[127:0]=[a3.i,a3.r,a2.i,a2.r,a1.i,a1.r,a0.i,a0.r]
+                    a = _mm_loadu_si128((__m128i*)_in_a); //load (2 byte imag, 2 byte real) x 4 into 128 bits reg
+                    b = _mm_loadu_si128((__m128i*)_in_b);
+                    c = _mm_mullo_epi16 (a, b); // a3.i*b3.i, a3.r*b3.r, ....
 
-	                    c_sr = _mm_srli_si128 (c, 2); // Shift a right by imm8 bytes while shifting in zeros, and store the results in dst.
-	                    real = _mm_subs_epi16 (c,c_sr);
+                    c_sr = _mm_srli_si128 (c, 2); // Shift a right by imm8 bytes while shifting in zeros, and store the results in dst.
+                    real = _mm_subs_epi16 (c,c_sr);
 
-	                    b_sl = _mm_slli_si128(b, 2); // b3.r, b2.i ....
-	                    a_sl = _mm_slli_si128(a, 2); // a3.r, a2.i ....
+                    b_sl = _mm_slli_si128(b, 2); // b3.r, b2.i ....
+                    a_sl = _mm_slli_si128(a, 2); // a3.r, a2.i ....
 
-	                    imag1 = _mm_mullo_epi16(a, b_sl); // a3.i*b3.r, ....
-	                    imag2 = _mm_mullo_epi16(b, a_sl); // b3.i*a3.r, ....
+                    imag1 = _mm_mullo_epi16(a, b_sl); // a3.i*b3.r, ....
+                    imag2 = _mm_mullo_epi16(b, a_sl); // b3.i*a3.r, ....
 
-	                    imag = _mm_adds_epi16(imag1, imag2); //with saturation aritmetic!
+                    imag = _mm_adds_epi16(imag1, imag2); //with saturation aritmetic!
 
-	                    realcacc = _mm_adds_epi16 (realcacc, real);
-	                    imagcacc = _mm_adds_epi16 (imagcacc, imag);
+                    realcacc = _mm_adds_epi16 (realcacc, real);
+                    imagcacc = _mm_adds_epi16 (imagcacc, imag);
 
-	                    _in_a += 4;
-	                    _in_b += 4;
-	                }
+                    _in_a += 4;
+                    _in_b += 4;
+                }
 
-	            realcacc = _mm_and_si128 (realcacc, mask_real);
-	            imagcacc = _mm_and_si128 (imagcacc, mask_imag);
+            realcacc = _mm_and_si128 (realcacc, mask_real);
+            imagcacc = _mm_and_si128 (imagcacc, mask_imag);
 
-	            result = _mm_or_si128 (realcacc, imagcacc);
+            result = _mm_or_si128 (realcacc, imagcacc);
 
-	            __VOLK_ATTR_ALIGNED(16) lv_16sc_t dotProductVector[4];
+            __VOLK_ATTR_ALIGNED(16) lv_16sc_t dotProductVector[4];
 
-	            _mm_storeu_si128((__m128i*)dotProductVector,result); // Store the results back into the dot product vector
+            _mm_storeu_si128((__m128i*)dotProductVector,result); // Store the results back into the dot product vector
 
-	            for (int i = 0; i < 4; ++i)
-	                {
-	                    dotProduct = lv_cmake(sat_adds16i(lv_creal(dotProduct), lv_creal(dotProductVector[i])), sat_adds16i(lv_cimag(dotProduct), lv_cimag(dotProductVector[i])));
-	                }
-	        }
+            for (int i = 0; i < 4; ++i)
+                {
+                    dotProduct = lv_cmake(sat_adds16i(lv_creal(dotProduct), lv_creal(dotProductVector[i])), sat_adds16i(lv_cimag(dotProduct), lv_cimag(dotProductVector[i])));
+                }
+        }
 
-	    for (unsigned int i = 0; i < (num_points % 4); ++i)
-	        {
-	            lv_16sc_t tmp = (*_in_a++) * (*_in_b++);
-	            dotProduct = lv_cmake( sat_adds16i(lv_creal(dotProduct), lv_creal(tmp)), sat_adds16i(lv_cimag(dotProduct), lv_cimag(tmp)));
-	        }
+    for (unsigned int i = 0; i < (num_points % 4); ++i)
+        {
+            lv_16sc_t tmp = (*_in_a++) * (*_in_b++);
+            dotProduct = lv_cmake( sat_adds16i(lv_creal(dotProduct), lv_creal(tmp)), sat_adds16i(lv_cimag(dotProduct), lv_cimag(tmp)));
+        }
 
-	    *_out = dotProduct;
+    *_out = dotProduct;
 }
 #endif /* LV_HAVE_SSE2 */
 
diff --git a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic.h b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic.h
index 10d372065..88ffa5ca0 100644
--- a/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic.h
+++ b/src/algorithms/libs/volk_gnsssdr_module/volk_gnsssdr/kernels/volk_gnsssdr/volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic.h
@@ -45,11 +45,11 @@
 static inline void volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic_generic(lv_16sc_t* result, const lv_16sc_t* local_code, const lv_16sc_t* in, unsigned int num_points)
 {
     int num_a_vectors = 3;
-    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_a_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_a_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_a_vectors; n++)
     {
-       in_a[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());
-       memcpy(in_a[n], in, sizeof(lv_16sc_t)*num_points);
+       in_a[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t) * num_points, volk_gnsssdr_get_alignment());
+       memcpy(in_a[n], in, sizeof(lv_16sc_t) * num_points);
     }
     volk_gnsssdr_16ic_x2_dot_prod_16ic_xn_generic(result, local_code, (const lv_16sc_t**) in_a, num_a_vectors, num_points);
 
@@ -66,11 +66,11 @@ static inline void volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic_generic(lv_16sc_t*
 static inline void volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic_a_sse2(lv_16sc_t* result, const lv_16sc_t* local_code, const lv_16sc_t* in, unsigned int num_points)
 {
     int num_a_vectors = 3;
-    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_a_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_a_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_a_vectors; n++)
     {
-       in_a[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());
-       memcpy(in_a[n], in, sizeof(lv_16sc_t)*num_points);
+       in_a[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t) * num_points, volk_gnsssdr_get_alignment());
+       memcpy((lv_16sc_t*)in_a[n], (lv_16sc_t*)in, sizeof(lv_16sc_t) * num_points);
     }
     volk_gnsssdr_16ic_x2_dot_prod_16ic_xn_a_sse2(result, local_code, (const lv_16sc_t**) in_a, num_a_vectors, num_points);
 
@@ -88,7 +88,7 @@ static inline void volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic_a_sse2(lv_16sc_t* r
 static inline void volk_gnsssdr_16ic_x2_dotprodxnpuppet_16ic_u_sse2(lv_16sc_t* result, const lv_16sc_t* local_code, const lv_16sc_t* in, unsigned int num_points)
 {
     int num_a_vectors = 3;
-    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_a_vectors, volk_gnsssdr_get_alignment());
+    lv_16sc_t** in_a = (lv_16sc_t**)volk_gnsssdr_malloc(sizeof(lv_16sc_t*) * num_a_vectors, volk_gnsssdr_get_alignment());
     for(unsigned int n = 0; n < num_a_vectors; n++)
     {
        in_a[n] = (lv_16sc_t*)volk_gnsssdr_malloc(sizeof(lv_16sc_t)*num_points, volk_gnsssdr_get_alignment());