neon filters: minor optimization from M-HT

This commit is contained in:
notaz 2012-11-07 01:35:01 +02:00
parent e22d791cf8
commit c688b90fe2
3 changed files with 17 additions and 18 deletions

View file

@ -528,8 +528,8 @@
.endif
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q14, q15, q8, q9, q10
bgr1555_to_rgb565 q6, q7, q8, q9, q10
bgr1555_to_rgb565 q14, q15, q8, q9, q10, \reg1
bgr1555_to_rgb565 q6, q7, q8, q9, q10, \reg1
#endif
ubfx \reg1, \counter, #0, #3 @ reg1 = counter & 7
@ -636,8 +636,8 @@
vbsl q7, \qY, q12 @ E4 = < (Z == Y && Z == W) ? Y : C >
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q14, q15, q0, q1, q2
bgr1555_to_rgb565 q6, q7, q0, q1, q2
bgr1555_to_rgb565 q14, q15, q0, q1, q2, \reg1
bgr1555_to_rgb565 q6, q7, q0, q1, q2, \reg1
#endif
vst2.16 {q14-q15}, [\aldst1]! @ [dst] = E1,E2; dst1 += 2*2*8
@ -734,8 +734,8 @@
vbsl q7, \qY, q12 @ E4 = < (Z == Y && Z == W) ? Y : C >
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q14, q15, q8, q9, q10
bgr1555_to_rgb565 q6, q7, q8, q9, q10
bgr1555_to_rgb565 q14, q15, q8, q9, q10, \reg1
bgr1555_to_rgb565 q6, q7, q8, q9, q10, \reg1
#endif
vst2.16 {q14-q15}, [\aldst1]! @ [dst] = E1,E2; dst1 += 2*2*8

View file

@ -30,17 +30,15 @@
#define A256 :256
#endif
.macro bgr1555_to_rgb565 dr0 dr1 t0 t1 t2
str r0, [sp, #-4]
mov r0, #0x07c0
.macro bgr1555_to_rgb565 dr0 dr1 t0 t1 t2 ar
mov \ar, #0x07c0
vshl.u16 \t0, \dr0, #11
vshl.u16 \t1, \dr1, #11
vshl.u16 \dr0, \dr0, #1
vshl.u16 \dr1, \dr1, #1
vdup.16 \t2, r0
vdup.16 \t2, \ar
vsri.u16 \t0, \dr0, #11
vsri.u16 \t1, \dr1, #11
ldr r0, [sp, #-4]
vbif \dr0, \t0, \t2
vbif \dr1, \t1, \t2
.endm

View file

@ -290,7 +290,6 @@
vtbl.8 d17, {d28, d29}, d17 @ S2prev[7] = src[reg1 - 1]
vorr q10, q2, q3 @ C0 = < B == H || D == F >
and \reg1, \counter, #7
vceq.i16 q2, q14, \qH @ tmp2 = < D == H >
@ -313,10 +312,12 @@
vbsl q3, q12, q15 @ E3 = < (C0 || !(H == F)) ? E : F >
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q0, q1, q12, q14, q15
bgr1555_to_rgb565 q2, q3, q12, q14, q15
bgr1555_to_rgb565 q0, q1, q12, q14, q15, \reg1
bgr1555_to_rgb565 q2, q3, q12, q14, q15, \reg1
#endif
and \reg1, \counter, #7
vst2.16 {q0-q1}, [\dst1] @ [dst] = E0,E1
bic \counter, \counter, #7
@ -389,8 +390,8 @@
vbsl q3, q12, q15 @ E3 = < (C0 || !(H == F)) ? E : F >
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q0, q1, q12, q14, q15
bgr1555_to_rgb565 q2, q3, q12, q14, q15
bgr1555_to_rgb565 q0, q1, q12, q14, q15, \reg1
bgr1555_to_rgb565 q2, q3, q12, q14, q15, \reg1
#endif
vst2.16 {q0-q1}, [\aldst1]! @ [dst] = E0,E1; dst1 += 2*2*8
@ -448,8 +449,8 @@
vbsl q3, q12, q15 @ E3 = < (C0 || !(H == F)) ? E : F >
#ifdef DO_BGR_TO_RGB
bgr1555_to_rgb565 q0, q1, q12, q14, q15
bgr1555_to_rgb565 q2, q3, q12, q14, q15
bgr1555_to_rgb565 q0, q1, q12, q14, q15, \reg1
bgr1555_to_rgb565 q2, q3, q12, q14, q15, \reg1
#endif
vst2.16 {q0-q1}, [\aldst1]! @ [dst] = E0,E1; dst1 += 2*2*8