Float point instructions on ARM assembly

Question

I'm trying to create an ARM benchmark that loop over the following instructions (in assembly), alone and in combination:

Integer additions
Integer multiplications
Float point additions
Float point multiplications

This is my code for integer operations:

int additions_int(int n) {

    int i, dummyValue = n;

    __asm (
        "MOV R0, #2
"
        "MOV R1, #6
"
    );

    for (i = 0; i < n/LOOP_STEP; i++) {

        __asm (
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
            "ADD R0, R0, R1
"
        );
    }

    return dummyValue;
}


int multiplications_int(int n) {

    int i, dummyValue=n;

    __asm (
        "MOV R0, #2
"
        "MOV R1, #6
"
    );

    for (i = 0; i < n/LOOP_STEP; i++) {

        __asm (

            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"
            "MUL R0, R0, R1
"

        );

    }

    return dummyValue;
}

The problem is in the float point operations. I checked this documentation, and I've tryed to do something like this:

float multiplications_fp(int n) {
    int i;
    float fn=n, dummyValue = fn;

    for (i = 0; i < n/LOOP_STEP; i++) {
        __asm (
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
            "VMUL.F32 R0, R0, R1
"
        );
    }

    return dummyValue;
}


float additions_fp(int n) {
    int i;
    float fn=n, dummyValue = fn;

    for (i = 0; i < n/LOOP_STEP; i++) {
        __asm (
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
"
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
" 
            "VADD.F32 R0, R0, R1
"  
        );
    }

    return dummyValue;
}

Compiling with:

arm-linux-gnueabi-gcc -static -march=armv7-a microbenchmark_arm.c -o microbenchmark_arm

I'm getting this error:

Error: selected processor does not support ARM mode `vmul.f32 R0,R0,R1'
Error: selected processor does not support ARM mode `vadd.f32 R0,R0,R1'

Can anyone say me what I'm doing wrong?

Can anyone show me an example of float point additions or multiplications for ARM Cortex-A architecture?

Float point instructions on ARM assembly

Answers (1)

Related Questions