ffmpeg/libswresample/x86/audio_convert.asm

;******************************************************************************
;* Copyright (c) 2012 Michael Niedermayer
;*
;* This file is part of FFmpeg.
;*
;* FFmpeg is free software; you can redistribute it and/or
;* modify it under the terms of the GNU Lesser General Public
;* License as published by the Free Software Foundation; either
;* version 2.1 of the License, or (at your option) any later version.
;*
;* FFmpeg is distributed in the hope that it will be useful,
;* but WITHOUT ANY WARRANTY; without even the implied warranty of
;* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
;* Lesser General Public License for more details.
;*
;* You should have received a copy of the GNU Lesser General Public
;* License along with FFmpeg; if not, write to the Free Software
;* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
;******************************************************************************

%include "libavutil/x86/x86inc.asm"
%include "libavutil/x86/x86util.asm"

SECTION_RODATA
align 32
flt2pm31: times 8 dd 4.6566129e-10
flt2p31 : times 8 dd 2147483648.0
flt2p15 : times 8 dd 32768.0

SECTION .text


;to, from, a/u, log2_outsize, log_intsize, const
%macro PACK_2CH 5-7
cglobal pack_2ch_%2_to_%1_%3, 3, 4, 6, dst, src, len, src2
    mov src2q   , [srcq+gprsize]
    mov srcq    , [srcq]
    mov dstq    , [dstq]
%ifidn %3, a
    test dstq, mmsize-1
        jne pack_2ch_%2_to_%1_u_int %+ SUFFIX
    test srcq, mmsize-1
        jne pack_2ch_%2_to_%1_u_int %+ SUFFIX
    test src2q, mmsize-1
        jne pack_2ch_%2_to_%1_u_int %+ SUFFIX
%else
pack_2ch_%2_to_%1_u_int %+ SUFFIX
%endif
    lea     srcq , [srcq  + (1<<%5)*lenq]
    lea     src2q, [src2q + (1<<%5)*lenq]
    lea     dstq , [dstq  + (2<<%4)*lenq]
    neg     lenq
    %7
.next:
%if %4 >= %5
    mov%3     m0, [         srcq +(1<<%5)*lenq]
    mova      m1, m0
    mov%3     m2, [         src2q+(1<<%5)*lenq]
%if %5 == 1
    punpcklwd m0, m2
    punpckhwd m1, m2
%else
    punpckldq m0, m2
    punpckhdq m1, m2
%endif
    %6
%else
    mov%3     m0, [         srcq +(1<<%5)*lenq]
    mov%3     m1, [mmsize + srcq +(1<<%5)*lenq]
    mov%3     m2, [         src2q+(1<<%5)*lenq]
    mov%3     m3, [mmsize + src2q+(1<<%5)*lenq]
    %6
    mova      m2, m0
    punpcklwd m0, m1
    punpckhwd m2, m1
    SWAP 1,2
%endif
    mov%3 [           dstq+(2<<%4)*lenq], m0
    mov%3 [  mmsize + dstq+(2<<%4)*lenq], m1
%if %4 > %5
    mov%3 [2*mmsize + dstq+(2<<%4)*lenq], m2
    mov%3 [3*mmsize + dstq+(2<<%4)*lenq], m3
    add lenq, 4*mmsize/(2<<%4)
%else
    add lenq, 2*mmsize/(2<<%4)
%endif
        jl .next
    REP_RET
%endmacro

%macro CONV 5-7
cglobal %2_to_%1_%3, 3, 3, 6, dst, src, len
    mov srcq    , [srcq]
    mov dstq    , [dstq]
%ifidn %3, a
    test dstq, mmsize-1
        jne %2_to_%1_u_int %+ SUFFIX
    test srcq, mmsize-1
        jne %2_to_%1_u_int %+ SUFFIX
%else
%2_to_%1_u_int %+ SUFFIX
%endif
    lea     srcq , [srcq  + (1<<%5)*lenq]
    lea     dstq , [dstq  + (1<<%4)*lenq]
    neg     lenq
    %7
.next:
    mov%3     m0, [           srcq +(1<<%5)*lenq]
    mov%3     m1, [  mmsize + srcq +(1<<%5)*lenq]
%if %4 < %5
    mov%3     m2, [2*mmsize + srcq +(1<<%5)*lenq]
    mov%3     m3, [3*mmsize + srcq +(1<<%5)*lenq]
%endif
    %6
    mov%3 [           dstq+(1<<%4)*lenq], m0
    mov%3 [  mmsize + dstq+(1<<%4)*lenq], m1
%if %4 > %5
    mov%3 [2*mmsize + dstq+(1<<%4)*lenq], m2
    mov%3 [3*mmsize + dstq+(1<<%4)*lenq], m3
    add lenq, 4*mmsize/(1<<%4)
%else
    add lenq, 2*mmsize/(1<<%4)
%endif
        jl .next
    REP_RET
%endmacro

%macro INT16_TO_INT32_N 0
    pxor      m2, m2
    pxor      m3, m3
    punpcklwd m2, m1
    punpckhwd m3, m1
    SWAP 4,0
    pxor      m0, m0
    pxor      m1, m1
    punpcklwd m0, m4
    punpckhwd m1, m4
%endmacro

%macro INT32_TO_INT16_N 0
    psrad     m0, 16
    psrad     m1, 16
    psrad     m2, 16
    psrad     m3, 16
    packssdw  m0, m1
    packssdw  m2, m3
    SWAP 1,2
%endmacro

%macro INT32_TO_FLOAT_INIT 0
    mova      m3, [flt2pm31]
%endmacro
%macro INT32_TO_FLOAT_N 0
    cvtdq2ps  m0, m0
    cvtdq2ps  m1, m1
    mulps m0, m0, m3
    mulps m1, m1, m3
%endmacro

%macro FLOAT_TO_INT32_INIT 0
    mova      m3, [flt2p31]
%endmacro
%macro FLOAT_TO_INT32_N 0
    mulps m0, m3
    mulps m1, m3
    cvtps2dq  m2, m0
    cvtps2dq  m4, m1
    cmpnltps m0, m3
    cmpnltps m1, m3
    paddd m0, m2
    paddd m1, m4
%endmacro

%macro INT16_TO_FLOAT_INIT 0
    mova      m5, [flt2pm31]
%endmacro
%macro INT16_TO_FLOAT_N 0
    INT16_TO_INT32_N
    cvtdq2ps  m0, m0
    cvtdq2ps  m1, m1
    cvtdq2ps  m2, m2
    cvtdq2ps  m3, m3
    mulps m0, m0, m5
    mulps m1, m1, m5
    mulps m2, m2, m5
    mulps m3, m3, m5
%endmacro

%macro FLOAT_TO_INT16_INIT 0
    mova      m5, [flt2p15]
%endmacro
%macro FLOAT_TO_INT16_N 0
    mulps m0, m5
    mulps m1, m5
    mulps m2, m5
    mulps m3, m5
    cvtps2dq  m0, m0
    cvtps2dq  m1, m1
    packssdw  m0, m1
    cvtps2dq  m1, m2
    cvtps2dq  m3, m3
    packssdw  m1, m3
%endmacro

INIT_MMX mmx
CONV int32, int16, u, 2, 1, INT16_TO_INT32_N
CONV int32, int16, a, 2, 1, INT16_TO_INT32_N
CONV int16, int32, u, 1, 2, INT32_TO_INT16_N
CONV int16, int32, a, 1, 2, INT32_TO_INT16_N

INIT_XMM sse
CONV int32, int16, u, 2, 1, INT16_TO_INT32_N
CONV int32, int16, a, 2, 1, INT16_TO_INT32_N
CONV int16, int32, u, 1, 2, INT32_TO_INT16_N
CONV int16, int32, a, 1, 2, INT32_TO_INT16_N

PACK_2CH int16, int16, u, 1, 1
PACK_2CH int16, int16, a, 1, 1
PACK_2CH int32, int32, u, 2, 2
PACK_2CH int32, int32, a, 2, 2
PACK_2CH int32, int16, u, 2, 1, INT16_TO_INT32_N
PACK_2CH int32, int16, a, 2, 1, INT16_TO_INT32_N
PACK_2CH int16, int32, u, 1, 2, INT32_TO_INT16_N
PACK_2CH int16, int32, a, 1, 2, INT32_TO_INT16_N

INIT_XMM sse2
CONV float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
CONV float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
CONV int32, float, u, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT
CONV int32, float, a, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT
CONV float, int16, u, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT
CONV float, int16, a, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT
CONV int16, float, u, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT
CONV int16, float, a, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT

PACK_2CH float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
PACK_2CH float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
PACK_2CH int32, float, u, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT
PACK_2CH int32, float, a, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT
PACK_2CH float, int16, u, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT
PACK_2CH float, int16, a, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT
PACK_2CH int16, float, u, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT
PACK_2CH int16, float, a, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT


%if HAVE_AVX
INIT_YMM avx
CONV float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
CONV float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT
%endif
swr: add int16_to_int32_mmx/sse Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 12:23:42 +02:00			`;******************************************************************************`
			`;* Copyright (c) 2012 Michael Niedermayer`
			`;*`
			`;* This file is part of FFmpeg.`
			`;*`
			`;* FFmpeg is free software; you can redistribute it and/or`
			`;* modify it under the terms of the GNU Lesser General Public`
			`;* License as published by the Free Software Foundation; either`
			`;* version 2.1 of the License, or (at your option) any later version.`
			`;*`
			`;* FFmpeg is distributed in the hope that it will be useful,`
			`;* but WITHOUT ANY WARRANTY; without even the implied warranty of`
			`;* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU`
			`;* Lesser General Public License for more details.`
			`;*`
			`;* You should have received a copy of the GNU Lesser General Public`
			`;* License along with FFmpeg; if not, write to the Free Software`
			`;* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA`
			`;******************************************************************************`

			`%include "libavutil/x86/x86inc.asm"`
			`%include "libavutil/x86/x86util.asm"`

swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00			`SECTION_RODATA`
swr: add ff_int32_to_float_a_avx Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-03 15:52:36 +02:00			`align 32`
swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00			`flt2pm31: times 8 dd 4.6566129e-10`
swr: float_to_int32_sse2() Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-29 11:27:22 +02:00			`flt2p31 : times 8 dd 2147483648.0`
swr: float_to_int16_sse2() Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-29 12:18:14 +02:00			`flt2p15 : times 8 dd 32768.0`
swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00
swr: add int16_to_int32_mmx/sse Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 12:23:42 +02:00			`SECTION .text`

swr: int32_to_int16_mmx/sse Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-29 14:10:34 +02:00
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`;to, from, a/u, log2_outsize, log_intsize, const`
			`%macro PACK_2CH 5-7`
swr: fix PACK_2CH register count Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:42:52 +02:00			`cglobal pack_2ch_%2_to_%1_%3, 3, 4, 6, dst, src, len, src2`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`mov src2q , [srcq+gprsize]`
			`mov srcq , [srcq]`
			`mov dstq , [dstq]`
			`%ifidn %3, a`
			`test dstq, mmsize-1`
swr: fix internal asm labels Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:43:11 +02:00			`jne pack_2ch_%2_to_%1_u_int %+ SUFFIX`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`test srcq, mmsize-1`
swr: fix internal asm labels Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:43:11 +02:00			`jne pack_2ch_%2_to_%1_u_int %+ SUFFIX`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`test src2q, mmsize-1`
swr: fix internal asm labels Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:43:11 +02:00			`jne pack_2ch_%2_to_%1_u_int %+ SUFFIX`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`%else`
swr: fix internal asm labels Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:43:11 +02:00			`pack_2ch_%2_to_%1_u_int %+ SUFFIX`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`%endif`
			`lea srcq , [srcq + (1<<%5)*lenq]`
			`lea src2q, [src2q + (1<<%5)*lenq]`
			`lea dstq , [dstq + (2<<%4)*lenq]`
			`neg lenq`
			`%7`
			`.next:`
swr-x86-SIMD: 3 instructions less for stereo planar->packed s32/flt->s16 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-06 12:59:59 +02:00			`%if %4 >= %5`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`mov%3 m0, [ srcq +(1<<%5)*lenq]`
			`mova m1, m0`
			`mov%3 m2, [ src2q+(1<<%5)*lenq]`
			`%if %5 == 1`
			`punpcklwd m0, m2`
			`punpckhwd m1, m2`
			`%else`
			`punpckldq m0, m2`
			`punpckhdq m1, m2`
			`%endif`
			`%6`
swr-x86-SIMD: 3 instructions less for stereo planar->packed s32/flt->s16 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-06 12:59:59 +02:00			`%else`
			`mov%3 m0, [ srcq +(1<<%5)*lenq]`
			`mov%3 m1, [mmsize + srcq +(1<<%5)*lenq]`
			`mov%3 m2, [ src2q+(1<<%5)*lenq]`
			`mov%3 m3, [mmsize + src2q+(1<<%5)*lenq]`
			`%6`
			`mova m2, m0`
			`punpcklwd m0, m1`
			`punpckhwd m2, m1`
			`SWAP 1,2`
			`%endif`
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`mov%3 [ dstq+(2<<%4)*lenq], m0`
			`mov%3 [ mmsize + dstq+(2<<%4)*lenq], m1`
			`%if %4 > %5`
			`mov%3 [2mmsize + dstq+(2<<%4)lenq], m2`
			`mov%3 [3mmsize + dstq+(2<<%4)lenq], m3`
			`add lenq, 4*mmsize/(2<<%4)`
			`%else`
			`add lenq, 2*mmsize/(2<<%4)`
			`%endif`
			`jl .next`
			`REP_RET`
			`%endmacro`

swr: replace planar->planar/packed->packed FLT<->S16/S32 SIMD by new macros this simplifies the code Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:41:39 +02:00			`%macro CONV 5-7`
			`cglobal %2_to_%1_%3, 3, 3, 6, dst, src, len`
			`mov srcq , [srcq]`
			`mov dstq , [dstq]`
			`%ifidn %3, a`
			`test dstq, mmsize-1`
			`jne %2_to_%1_u_int %+ SUFFIX`
			`test srcq, mmsize-1`
			`jne %2_to_%1_u_int %+ SUFFIX`
			`%else`
			`%2_to_%1_u_int %+ SUFFIX`
			`%endif`
			`lea srcq , [srcq + (1<<%5)*lenq]`
			`lea dstq , [dstq + (1<<%4)*lenq]`
			`neg lenq`
			`%7`
			`.next:`
			`mov%3 m0, [ srcq +(1<<%5)*lenq]`
			`mov%3 m1, [ mmsize + srcq +(1<<%5)*lenq]`
			`%if %4 < %5`
			`mov%3 m2, [2mmsize + srcq +(1<<%5)lenq]`
			`mov%3 m3, [3mmsize + srcq +(1<<%5)lenq]`
			`%endif`
			`%6`
			`mov%3 [ dstq+(1<<%4)*lenq], m0`
			`mov%3 [ mmsize + dstq+(1<<%4)*lenq], m1`
			`%if %4 > %5`
			`mov%3 [2mmsize + dstq+(1<<%4)lenq], m2`
			`mov%3 [3mmsize + dstq+(1<<%4)lenq], m3`
			`add lenq, 4*mmsize/(1<<%4)`
			`%else`
			`add lenq, 2*mmsize/(1<<%4)`
			`%endif`
			`jl .next`
			`REP_RET`
			`%endmacro`

swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`%macro INT16_TO_INT32_N 0`
			`pxor m2, m2`
			`pxor m3, m3`
			`punpcklwd m2, m1`
			`punpckhwd m3, m1`
			`SWAP 4,0`
			`pxor m0, m0`
			`pxor m1, m1`
			`punpcklwd m0, m4`
			`punpckhwd m1, m4`
			`%endmacro`

			`%macro INT32_TO_INT16_N 0`
			`psrad m0, 16`
			`psrad m1, 16`
			`psrad m2, 16`
			`psrad m3, 16`
			`packssdw m0, m1`
			`packssdw m2, m3`
			`SWAP 1,2`
			`%endmacro`

			`%macro INT32_TO_FLOAT_INIT 0`
			`mova m3, [flt2pm31]`
			`%endmacro`
			`%macro INT32_TO_FLOAT_N 0`
			`cvtdq2ps m0, m0`
			`cvtdq2ps m1, m1`
			`mulps m0, m0, m3`
			`mulps m1, m1, m3`
			`%endmacro`

			`%macro FLOAT_TO_INT32_INIT 0`
			`mova m3, [flt2p31]`
			`%endmacro`
			`%macro FLOAT_TO_INT32_N 0`
			`mulps m0, m3`
			`mulps m1, m3`
			`cvtps2dq m2, m0`
			`cvtps2dq m4, m1`
			`cmpnltps m0, m3`
			`cmpnltps m1, m3`
			`paddd m0, m2`
			`paddd m1, m4`
			`%endmacro`

			`%macro INT16_TO_FLOAT_INIT 0`
			`mova m5, [flt2pm31]`
			`%endmacro`
			`%macro INT16_TO_FLOAT_N 0`
			`INT16_TO_INT32_N`
			`cvtdq2ps m0, m0`
			`cvtdq2ps m1, m1`
			`cvtdq2ps m2, m2`
			`cvtdq2ps m3, m3`
			`mulps m0, m0, m5`
			`mulps m1, m1, m5`
			`mulps m2, m2, m5`
			`mulps m3, m3, m5`
			`%endmacro`

			`%macro FLOAT_TO_INT16_INIT 0`
			`mova m5, [flt2p15]`
			`%endmacro`
			`%macro FLOAT_TO_INT16_N 0`
			`mulps m0, m5`
			`mulps m1, m5`
			`mulps m2, m5`
			`mulps m3, m5`
			`cvtps2dq m0, m0`
			`cvtps2dq m1, m1`
			`packssdw m0, m1`
			`cvtps2dq m1, m2`
			`cvtps2dq m3, m3`
			`packssdw m1, m3`
			`%endmacro`
swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00
swr: add int16_to_int32_mmx/sse Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 12:23:42 +02:00			`INIT_MMX mmx`
swr: replace the remaining 2 audio convert SIMD macros by the new ones Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:59:57 +02:00			`CONV int32, int16, u, 2, 1, INT16_TO_INT32_N`
			`CONV int32, int16, a, 2, 1, INT16_TO_INT32_N`
			`CONV int16, int32, u, 1, 2, INT32_TO_INT16_N`
			`CONV int16, int32, a, 1, 2, INT32_TO_INT16_N`
swr: add int16_to_int32_mmx/sse Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 12:23:42 +02:00
			`INIT_XMM sse`
swr: replace the remaining 2 audio convert SIMD macros by the new ones Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:59:57 +02:00			`CONV int32, int16, u, 2, 1, INT16_TO_INT32_N`
			`CONV int32, int16, a, 2, 1, INT16_TO_INT32_N`
			`CONV int16, int32, u, 1, 2, INT32_TO_INT16_N`
			`CONV int16, int32, a, 1, 2, INT32_TO_INT16_N`
swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`PACK_2CH int16, int16, u, 1, 1`
			`PACK_2CH int16, int16, a, 1, 1`
			`PACK_2CH int32, int32, u, 2, 2`
			`PACK_2CH int32, int32, a, 2, 2`
			`PACK_2CH int32, int16, u, 2, 1, INT16_TO_INT32_N`
			`PACK_2CH int32, int16, a, 2, 1, INT16_TO_INT32_N`
			`PACK_2CH int16, int32, u, 1, 2, INT32_TO_INT16_N`
			`PACK_2CH int16, int32, a, 1, 2, INT32_TO_INT16_N`

swr: add int32_to_float_sse2 could be done for sse/3dnow too if someone wants Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-04-28 17:04:42 +02:00			`INIT_XMM sse2`
swr: replace planar->planar/packed->packed FLT<->S16/S32 SIMD by new macros this simplifies the code Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:41:39 +02:00			`CONV float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
			`CONV float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
			`CONV int32, float, u, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT`
			`CONV int32, float, a, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT`
			`CONV float, int16, u, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT`
			`CONV float, int16, a, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT`
			`CONV int16, float, u, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT`
			`CONV int16, float, a, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT`
swr: add ff_int32_to_float_a_avx Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-03 15:52:36 +02:00
swr: implement stereo S16/S32/FLT->S16/S32/FLT planar->packed in SSE/SSE2 Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 15:31:06 +02:00			`PACK_2CH float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
			`PACK_2CH float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
			`PACK_2CH int32, float, u, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT`
			`PACK_2CH int32, float, a, 2, 2, FLOAT_TO_INT32_N, FLOAT_TO_INT32_INIT`
			`PACK_2CH float, int16, u, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT`
			`PACK_2CH float, int16, a, 2, 1, INT16_TO_FLOAT_N, INT16_TO_FLOAT_INIT`
			`PACK_2CH int16, float, u, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT`
			`PACK_2CH int16, float, a, 1, 2, FLOAT_TO_INT16_N, FLOAT_TO_INT16_INIT`


swr: add ff_int32_to_float_a_avx Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-03 15:52:36 +02:00			`%if HAVE_AVX`
			`INIT_YMM avx`
swr: replace planar->planar/packed->packed FLT<->S16/S32 SIMD by new macros this simplifies the code Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-05 19:41:39 +02:00			`CONV float, int32, u, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
			`CONV float, int32, a, 2, 2, INT32_TO_FLOAT_N, INT32_TO_FLOAT_INIT`
swr: add ff_int32_to_float_a_avx Signed-off-by: Michael Niedermayer <michaelni@gmx.at> 2012-05-03 15:52:36 +02:00			`%endif`