точность сравнения двойных значений с EPSILON в C

Выполнение функции, которая берет 2 массива (столбец1 и столбец2) из ​​структуры CSV D и строит из нее график.

Идея состоит в том, чтобы найти максимальное и минимальное значения каждого массива, а затем разбить диапазон между min-EPSILON и max+EPSILON до 600 равных регионов, где EPSILON = 10^(−6)

Проблема в том, что функция не отображает нижнюю линию должным образом, я думаю, что проблема заключается в сравнении значения из массива с min-EPSILON, не уверен. Пожалуйста посоветуй.

Вот мой код.

void   
do_plot(CSV *D, int column1, int column2) {
#define Y_REGIONS 600
#define X_REGIONS 600
#define EPSILON 0.000001
int col1=column1-1;                     //since indexing in C language starts from 0, to be more user friendly values increased by 1
int col2=column2-1;
double  min_y = D->values[0][col1]; //min val of column
double  max_y = D->values[0][col1]; //max val of column
double  min_x = D->values[0][col2]; //min val of column
double  max_x = D->values[0][col2]; //max val of column
int     i=0,j=0,k=0;                //iteration variables
double  interval_x, interval_y;     //region
int     counter;                    //counts how many elements of "col1" and "column2" are in bucket
int     plotval;                    //plotted value
double  upper_bound_y[Y_REGIONS+1],lower_bound_y[Y_REGIONS+1];      //arrays for lower and upper bounds of regions in y (added extra 1 not to run out of regions)
double  upper_bound_x[X_REGIONS+1],lower_bound_x[X_REGIONS+1];      //arrays for lower and upper bounds of regions in x
while (i < D->number_of_rows){      
    if (D->values[i][col1] > max_y){
        max_y = D->values[i][col1];
    }
    if (D->values[i][col1] < min_y){
        min_y = D->values[i][col1];
    }
    if (D->values[i][col2] > max_x){
        max_x = D->values[i][col2];
    }
    if (D->values[i][col2] < min_x){
        min_x = D->values[i][col2];
    }
    i++;
}
/* adding EPSILON val to max and min */
max_x=max_x+EPSILON;
max_y=max_y+EPSILON;
min_x=min_x-EPSILON;
min_y=min_y-EPSILON;
interval_y=(max_y-min_y)/Y_REGIONS; //breaking y axis into Y_REGIONS equal regions
interval_x=(max_x-min_x)/X_REGIONS; //breaking x axis into Y_REGIONS equal regions
/* calculating regions of y*/
upper_bound_y[0]=max_y;             //upper bound of the first region in y
lower_bound_y[0]=max_y-interval_y;  //lower bound of the first region in y
for (j=0; j<Y_REGIONS; j++){
    upper_bound_y[j+1]=upper_bound_y[j]-interval_y;
    lower_bound_y[j+1]=lower_bound_y[j]-interval_y;
}
/* calculating regions of x */
upper_bound_x[0]=min_x+interval_x;  //upper bound of the first region in y
lower_bound_x[0]=min_x;             //lower bound of the first region in y
for (j=0; j<X_REGIONS; j++){
    upper_bound_x[j+1]=upper_bound_x[j]+interval_x;
    lower_bound_x[j+1]=lower_bound_x[j]+interval_x;
}
/* plotting the graph */
for (i=0; i<Y_REGIONS; i++){
    printf("\n%6.20lf--%6.20lf: ", lower_bound_y[i], upper_bound_y[i]); //plotting y axis
    for (j=0; j<X_REGIONS; j++){    //x axis
        counter=0;          //resetting counter
        while (k <= D->number_of_rows){
            k++;
            /* checking whether element of input lies within region and counting number of elements */
            if (D->values[k][col1] < upper_bound_y[i] && D->values[k][col1] > lower_bound_y[i]){
                if (D->values[k][col2] < upper_bound_x[j] && D->values[k][col2] > lower_bound_x[j] ){
                    counter++;
                }
            }               
        }
        k=0; //resetting counter
        plotval=floor(log(counter+1)/log(2)); //formula to show number of values in bucket
        /* plotting x lines */
        if (plotval==0){
            printf(".");
        }
        else{
            printf("%d",plotval);
        }
    }
}
printf("\n");
return;
}

person DvaNapasa    schedule 24.05.2015    source источник
comment
если задаешь вопрос, то хотя бы поясни почему (-_-)   -  person DvaNapasa    schedule 24.05.2015
comment
@ MotherLand: Пост CSV типа. EPSILON. Insure post компилируется (что такое vauess)?   -  person chux - Reinstate Monica    schedule 24.05.2015
comment
@chux, спасибо, приятель, исправил vauess, определил EPSILON. CSV из которого используется массив D->values[a][b]   -  person DvaNapasa    schedule 25.05.2015


Ответы (1)


Вычисления границ запутаны и имеют дыры.

Смотрите, что upper_bound_x[n] == lower_bound_x[n+1]. Затем, когда происходит сравнение с (D->values[k][col2] == upper_bound_x[n], оно не подходит ни к региону n, ни к региону n+1.

// Existing code
upper_bound_x[0]=min_x+interval_x;  //upper bound of the first region in y
lower_bound_x[0]=min_x;             //lower bound of the first region in y
for (j=0; j<X_REGIONS; j++){
    upper_bound_x[j+1]=upper_bound_x[j]+interval_x;
    lower_bound_x[j+1]=lower_bound_x[j]+interval_x;
}
....
if (D->values[k][col2] < upper_bound_x[j] && D->values[k][col2] > lower_bound_x[j] ){

Предложите переписать и использовать массив bound_x[X_REGIONS+1], а затем использовать сравнение:

if (D->values[k][col2] >= bound_x[j] && D->values[k][col2] < bound_x[j] ){

С другой стороны, код может пропускать массивы bound[] (x&y) и вычислять границы на лету.

Незначительный:

Повторяющийся код: создайте вспомогательные функции для вычисления минимума и максимума, а затем выполните вызов по одному разу для расчета x и y.

Код должен публиковать определение CSV. Это путаница иметь x в одном столбце и y в другом. Лучше иметь массив из point (создать собственную структуру, содержащую x и y), а не массив из double пар.

Обязательно #include <math.h>

person chux - Reinstate Monica    schedule 25.05.2015