From 37fbaa2e26de39947789fe1114d00291e66849a6 Mon Sep 17 00:00:00 2001
From: Thomas <thschleicher@edu.aau.at>
Date: Sat, 23 Sep 2023 15:44:18 +0200
Subject: [PATCH] neural_network.h changes

---
 main.c             |   5 +-
 matrix.c           |  16 +++++++
 matrix.h           |   6 +--
 neuronal_network.c | 111 +++++++++++++++++++++++++++++++--------------
 4 files changed, 97 insertions(+), 41 deletions(-)

diff --git a/main.c b/main.c
index c67a639..3e1c229 100644
--- a/main.c
+++ b/main.c
@@ -14,7 +14,8 @@ int main() {
 
 
 
-//    for (int i = 0; i < 20000; ++i) {
+//    for (int i = 0; i < 60000; ++i) {
+
 //        train_network(nn, images[i], images[i]->label);
 //        matrix_print(nn->weights_output);
 //    }
@@ -22,6 +23,6 @@ int main() {
 //    train_network(nn, images[0], images[0]->label);
 //    train_network(nn, images[0], images[0]->label);
 
-    printf("%lf\n", measure_network_accuracy(nn, images, 2000));
+    printf("%lf\n", measure_network_accuracy(nn, images, 10000));
 
 }
\ No newline at end of file
diff --git a/matrix.c b/matrix.c
index fd42480..449c96e 100644
--- a/matrix.c
+++ b/matrix.c
@@ -383,4 +383,20 @@ void matrix_randomize(Matrix* matrix, int n) {
             matrix->numbers[i][j] = min + (1.0 * (rand() % scaled_difference) / scaling_value);
         }
     }
+}
+
+Matrix* matrix_add_bias(Matrix* matrix) {
+    if(matrix->columns != 1) {
+        printf("ERROR: The size of the matrix does not match an input matrix! (matrix_add_bias)");
+        exit(1);
+    }
+
+    Matrix* result = matrix_create(matrix->rows + 1, matrix->columns);
+
+    result->numbers[0][0] = 1.0;
+    for (int i = 0; i < matrix->rows; ++i) {
+        result->numbers[i + 1][0] = result->numbers[i][0];
+    }
+
+    return result;
 }
\ No newline at end of file
diff --git a/matrix.h b/matrix.h
index d14bfd8..2e0e5a9 100644
--- a/matrix.h
+++ b/matrix.h
@@ -21,6 +21,7 @@ Matrix* load_next_matrix(FILE * save_file);
 void matrix_randomize(Matrix* matrix, int n); // don't understand the usage of the n
 int matrix_argmax(Matrix* matrix);
 Matrix* matrix_flatten(Matrix* matrix, int axis);
+Matrix* matrix_add_bias(Matrix* matrix);
 
 /*
  * These methods won't change or free the input matrix.
@@ -37,7 +38,4 @@ Matrix* apply(double (*function)(double), Matrix* matrix);
 Matrix* scale(Matrix* matrix, double value);
 Matrix* addScalar(Matrix* matrix, double value);
 Matrix* transpose(Matrix* matrix);
-double matrix_sum(Matrix* matrix);
-
-
-
+double matrix_sum(Matrix* matrix);
\ No newline at end of file
diff --git a/neuronal_network.c b/neuronal_network.c
index c28822e..87e3ec2 100644
--- a/neuronal_network.c
+++ b/neuronal_network.c
@@ -10,20 +10,21 @@ Matrix * backPropagation(double learning_rate, Matrix* weights, Matrix* biases,
 
 Neural_Network* new_network(int input_size, int hidden_size, int hidden_amount, int output_size, double learning_rate){
     Neural_Network* network = malloc(sizeof(Neural_Network));
-    // initialize networks variables
-    network->hidden_size = hidden_size;
+
     network->input_size = input_size;
+    network->hidden_size = hidden_size;
+    network->hidden_amount = hidden_amount;
     network->output_size = output_size;
     network->learning_rate = learning_rate;
 
-    Matrix** weights = malloc(sizeof(Matrix)*(hidden_amount + 1));
+    Matrix** weights = malloc(sizeof(Matrix*) * (hidden_amount + 1));
     network->weights = weights;
 
-    network->weights[0] = matrix_create(hidden_size, input_size+1);
+    network->weights[0] = matrix_create(hidden_size, input_size + 1);
     for(int i=1;i<hidden_amount;i++){
-        network->weights[i] = matrix_create(hidden_size, hidden_size+1);
+        network->weights[i] = matrix_create(hidden_size, hidden_size + 1);
     }
-    network->weights[hidden_amount] = matrix_create(output_size, hidden_size);
+    network->weights[hidden_amount] = matrix_create(output_size, hidden_size + 1);
 
     return network;
 }
@@ -131,51 +132,91 @@ Matrix* predict_image(Neural_Network* network, Image* image){
 }
 
 Matrix* predict(Neural_Network* network, Matrix* image_data) {
-    Matrix* h1_dot = dot(network->weights_1, image_data);
-    Matrix* h1_add = add(h1_dot, network->bias_1);
-    Matrix* h1_outputs = apply(sigmoid, h1_add);
 
-    Matrix* h2_dot = dot(network->weights_2, h1_outputs);
-    Matrix* h2_add = add(h2_dot, network->bias_2);
-    Matrix* h2_outputs = apply(sigmoid, h2_add);
+    Matrix* input = matrix_add_bias(image_data);
 
-    Matrix* h3_dot = dot(network->weights_3, h2_outputs);
-    Matrix* h3_add = add(h3_dot, network->bias_3);
-    Matrix* h3_outputs = apply(sigmoid, h3_add);
+    Matrix* output[network->hidden_amount + 1];
+    for (int i = 0; i < network->hidden_amount + 1; ++i) {
+        Matrix* neuron_input = dot(network->weights[i], input);
+        Matrix* neuron_activation = apply(sigmoid, neuron_input);
 
-    Matrix* final_dot = dot(network->weights_output, h3_outputs);
-    Matrix* final_add = add(final_dot, network->bias_output);
-    Matrix* final_outputs = apply(sigmoid, final_add);
+        output[i] = neuron_activation;
 
-    matrix_free(h1_dot);
-    matrix_free(h1_add);
-    matrix_free(h1_outputs);
+        matrix_free(neuron_input);
+        matrix_free(input);
 
-    matrix_free(h2_dot);
-    matrix_free(h2_add);
-    matrix_free(h2_outputs);
+        input = matrix_add_bias(neuron_activation);
+    }
 
-    matrix_free(h3_dot);
-    matrix_free(h3_add);
-    matrix_free(h3_outputs);
+    for (int i = 0; i < network->hidden_amount; ++i) {
+        matrix_free(output[i]);
+    }
 
-    matrix_free(final_dot);
-    matrix_free(final_add);
+    matrix_free(input);
 
-    return final_outputs;
+    return output[network->hidden_amount + 1];
 }
 
 void train_network(Neural_Network* network, Image *image, int label) {
 
-    Matrix* input = matrix_flatten(image->pixel_values, 0);
-
-    // Forward Pass
-    Matrix* h1_dot = dot(network->weights_1, input);
-    Matrix* h1_add = add()
+    Matrix* image_data = matrix_flatten(image->pixel_values, 0);
+    Matrix* input = matrix_add_bias(image_data);
 
+    Matrix* output[network->hidden_amount + 1];
+    for (int i = 0; i < network->hidden_amount + 1; ++i) {
+        Matrix* neuron_input = dot(network->weights[i], input);
+        Matrix* neuron_activation = apply(sigmoid, neuron_input);
+
+        output[i] = neuron_activation;
+
+        matrix_free(neuron_input);
+        matrix_free(input);
+
+        input = matrix_add_bias(neuron_activation);
+    }
+
+    // calculate the derivative of the sigmoid function of the input of the result layer
+    Matrix* ones = matrix_create(output[network->hidden_amount]->rows, output[network->hidden_amount]->columns);
+    matrix_fill(ones, 1);
+    Matrix* ones_minus_out = subtract(ones, output[network->hidden_amount]);
+    Matrix* sigmoid_derivative = multiply(output[network->hidden_amount], ones_minus_out);
+
+    // create wanted out-put matrix
+    Matrix* wanted_output = matrix_create(output[network->hidden_amount]->rows, output[network->hidden_amount]->columns);
+    matrix_fill(wanted_output, 0);
+    wanted_output->numbers[label][0] = 1;
+
+    // calculate difference to actual out-put
+    Matrix* error = subtract(wanted_output, output[network->hidden_amount]);
+
+    // calculate delta for output layer nodes
+    Matrix* delta = multiply(sigmoid_derivative, error);
+
+    //calculate the delta for all weights
+    Matrix* previous_out_with_one = matrix_add_bias(output[network->hidden_amount - 1]);
+    Matrix* transposed_previous_out_with_bias = transpose(previous_out_with_one);
+    Matrix* weights_delta_matrix = dot(delta, transposed_previous_out_with_bias);
 
 
+    // De-allocate stuff
+    matrix_free(image_data);
     matrix_free(input);
+
+    for (int i = 0; i < network->hidden_amount + 1; ++i) {
+        matrix_free(output[i]);
+    }
+
+    matrix_free(ones);
+    matrix_free(sigmoid_derivative);
+    matrix_free(sigmoid_derivative);
+    matrix_free(wanted_output);
+    matrix_free(error);
+    matrix_free(delta);
+    matrix_free(previous_out_with_one);
+    matrix_free(weights_delta_matrix);
+
+
+
 }
 
 Matrix * backPropagation(double learning_rate, Matrix* weights, Matrix* biases, Matrix* current_layer_activation, Matrix* previous_layer_activation, Matrix* sigma_old) {