neural_network.h changes

2023-09-23 15:44:18 +02:00 · 2023-09-23 15:44:18 +02:00 · 37fbaa2e26
commit 37fbaa2e26
parent cb88b2a397
4 changed files with 97 additions and 41 deletions
--- a/main.c
+++ b/main.c
@ -14,7 +14,8 @@ int main() {
-//    for (int i = 0; i < 20000; ++i) {
+//    for (int i = 0; i < 60000; ++i) {
 //        train_network(nn, images[i], images[i]->label);
 //        matrix_print(nn->weights_output);
 //    }
@ -22,6 +23,6 @@ int main() {
 //    train_network(nn, images[0], images[0]->label);
 //    train_network(nn, images[0], images[0]->label);
-    printf("%lf\n", measure_network_accuracy(nn, images, 2000));
+    printf("%lf\n", measure_network_accuracy(nn, images, 10000));
 }
--- a/matrix.c
+++ b/matrix.c
@ -383,4 +383,20 @@ void matrix_randomize(Matrix* matrix, int n) {
            matrix->numbers[i][j] = min + (1.0 * (rand() % scaled_difference) / scaling_value);
        }
    }
 }
 Matrix* matrix_add_bias(Matrix* matrix) {
    if(matrix->columns != 1) {
        printf("ERROR: The size of the matrix does not match an input matrix! (matrix_add_bias)");
        exit(1);
    }
    Matrix* result = matrix_create(matrix->rows + 1, matrix->columns);
    result->numbers[0][0] = 1.0;
    for (int i = 0; i < matrix->rows; ++i) {
        result->numbers[i + 1][0] = result->numbers[i][0];
    }
    return result;
 }
--- a/matrix.h
+++ b/matrix.h
@ -21,6 +21,7 @@ Matrix* load_next_matrix(FILE * save_file);
 void matrix_randomize(Matrix* matrix, int n); // don't understand the usage of the n
 int matrix_argmax(Matrix* matrix);
 Matrix* matrix_flatten(Matrix* matrix, int axis);
 Matrix* matrix_add_bias(Matrix* matrix);
 /*
 * These methods won't change or free the input matrix.
@ -37,7 +38,4 @@ Matrix* apply(double (*function)(double), Matrix* matrix);
 Matrix* scale(Matrix* matrix, double value);
 Matrix* addScalar(Matrix* matrix, double value);
 Matrix* transpose(Matrix* matrix);
-double matrix_sum(Matrix* matrix);
+double matrix_sum(Matrix* matrix);
--- a/neuronal_network.c
+++ b/neuronal_network.c
@ -10,20 +10,21 @@ Matrix * backPropagation(double learning_rate, Matrix* weights, Matrix* biases,
 Neural_Network* new_network(int input_size, int hidden_size, int hidden_amount, int output_size, double learning_rate){
    Neural_Network* network = malloc(sizeof(Neural_Network));
-    // initialize networks variables
+
    network->hidden_size = hidden_size;
    network->input_size = input_size;
    network->hidden_size = hidden_size;
    network->hidden_amount = hidden_amount;
    network->output_size = output_size;
    network->learning_rate = learning_rate;
-    Matrix** weights = malloc(sizeof(Matrix)*(hidden_amount + 1));
+    Matrix** weights = malloc(sizeof(Matrix*) * (hidden_amount + 1));
    network->weights = weights;
-    network->weights[0] = matrix_create(hidden_size, input_size+1);
+    network->weights[0] = matrix_create(hidden_size, input_size + 1);
    for(int i=1;i<hidden_amount;i++){
-        network->weights[i] = matrix_create(hidden_size, hidden_size+1);
+        network->weights[i] = matrix_create(hidden_size, hidden_size + 1);
    }
-    network->weights[hidden_amount] = matrix_create(output_size, hidden_size);
+    network->weights[hidden_amount] = matrix_create(output_size, hidden_size + 1);
    return network;
 }
@ -131,51 +132,91 @@ Matrix* predict_image(Neural_Network* network, Image* image){
 }
 Matrix* predict(Neural_Network* network, Matrix* image_data) {
    Matrix* h1_dot = dot(network->weights_1, image_data);
    Matrix* h1_add = add(h1_dot, network->bias_1);
    Matrix* h1_outputs = apply(sigmoid, h1_add);
-    Matrix* h2_dot = dot(network->weights_2, h1_outputs);
+    Matrix* input = matrix_add_bias(image_data);
    Matrix* h2_add = add(h2_dot, network->bias_2);
    Matrix* h2_outputs = apply(sigmoid, h2_add);
-    Matrix* h3_dot = dot(network->weights_3, h2_outputs);
+    Matrix* output[network->hidden_amount + 1];
-    Matrix* h3_add = add(h3_dot, network->bias_3);
+    for (int i = 0; i < network->hidden_amount + 1; ++i) {
-    Matrix* h3_outputs = apply(sigmoid, h3_add);
+        Matrix* neuron_input = dot(network->weights[i], input);
        Matrix* neuron_activation = apply(sigmoid, neuron_input);
-    Matrix* final_dot = dot(network->weights_output, h3_outputs);
+        output[i] = neuron_activation;
    Matrix* final_add = add(final_dot, network->bias_output);
    Matrix* final_outputs = apply(sigmoid, final_add);
-    matrix_free(h1_dot);
+        matrix_free(neuron_input);
-    matrix_free(h1_add);
+        matrix_free(input);
    matrix_free(h1_outputs);
-    matrix_free(h2_dot);
+        input = matrix_add_bias(neuron_activation);
-    matrix_free(h2_add);
+    }
    matrix_free(h2_outputs);
-    matrix_free(h3_dot);
+    for (int i = 0; i < network->hidden_amount; ++i) {
-    matrix_free(h3_add);
+        matrix_free(output[i]);
-    matrix_free(h3_outputs);
+    }
-    matrix_free(final_dot);
+    matrix_free(input);
    matrix_free(final_add);
-    return final_outputs;
+    return output[network->hidden_amount + 1];
 }
 void train_network(Neural_Network* network, Image *image, int label) {
-    Matrix* input = matrix_flatten(image->pixel_values, 0);
+    Matrix* image_data = matrix_flatten(image->pixel_values, 0);
-
+    Matrix* input = matrix_add_bias(image_data);
    // Forward Pass
    Matrix* h1_dot = dot(network->weights_1, input);
    Matrix* h1_add = add()
    Matrix* output[network->hidden_amount + 1];
    for (int i = 0; i < network->hidden_amount + 1; ++i) {
        Matrix* neuron_input = dot(network->weights[i], input);
        Matrix* neuron_activation = apply(sigmoid, neuron_input);
        output[i] = neuron_activation;
        matrix_free(neuron_input);
        matrix_free(input);
        input = matrix_add_bias(neuron_activation);
    }
    // calculate the derivative of the sigmoid function of the input of the result layer
    Matrix* ones = matrix_create(output[network->hidden_amount]->rows, output[network->hidden_amount]->columns);
    matrix_fill(ones, 1);
    Matrix* ones_minus_out = subtract(ones, output[network->hidden_amount]);
    Matrix* sigmoid_derivative = multiply(output[network->hidden_amount], ones_minus_out);
    // create wanted out-put matrix
    Matrix* wanted_output = matrix_create(output[network->hidden_amount]->rows, output[network->hidden_amount]->columns);
    matrix_fill(wanted_output, 0);
    wanted_output->numbers[label][0] = 1;
    // calculate difference to actual out-put
    Matrix* error = subtract(wanted_output, output[network->hidden_amount]);
    // calculate delta for output layer nodes
    Matrix* delta = multiply(sigmoid_derivative, error);
    //calculate the delta for all weights
    Matrix* previous_out_with_one = matrix_add_bias(output[network->hidden_amount - 1]);
    Matrix* transposed_previous_out_with_bias = transpose(previous_out_with_one);
    Matrix* weights_delta_matrix = dot(delta, transposed_previous_out_with_bias);
    // De-allocate stuff
    matrix_free(image_data);
    matrix_free(input);
    for (int i = 0; i < network->hidden_amount + 1; ++i) {
        matrix_free(output[i]);
    }
    matrix_free(ones);
    matrix_free(sigmoid_derivative);
    matrix_free(sigmoid_derivative);
    matrix_free(wanted_output);
    matrix_free(error);
    matrix_free(delta);
    matrix_free(previous_out_with_one);
    matrix_free(weights_delta_matrix);
 }
 Matrix * backPropagation(double learning_rate, Matrix* weights, Matrix* biases, Matrix* current_layer_activation, Matrix* previous_layer_activation, Matrix* sigma_old) {