|
| 1 | +/* |
| 2 | +Φοιτήτρια: Ματίνα Ναδάλη |
| 3 | +Καθηγητής: Αυγερινός Αθανάσιος |
| 4 | +Μάθημα: Εισαγωγή στον προγραμματισμό |
| 5 | +Πρόγραμμα dna.c : Εκτυπώνει την μέγιστη κοινή αλυσίδα DNA ανάμεσα σε δύο |
| 6 | +δείγματα |
| 7 | +*/ |
| 8 | + |
| 9 | +#include <stdio.h> |
| 10 | +#include <stdlib.h> |
| 11 | +int dna1_length, dna2_length; |
| 12 | +int max_length = 0; |
| 13 | +int starting_index = 0; //η θέση του πρώτου στοιχείου της μέγιστης κοινής ακολουθίας στο dna1 |
| 14 | + |
| 15 | +//ελέγχει αν ο χαρακτήρας είναι κάποια έγκυρη βάση |
| 16 | +int is_base(char character) { |
| 17 | + return character == 'A' || |
| 18 | + character == 'C' || |
| 19 | + character == 'G' || |
| 20 | + character == 'T'; |
| 21 | +} |
| 22 | + |
| 23 | +//θέτει τη global μεταβλητή starting_index στο index του χαρακτήρα του dna1, από |
| 24 | +//τον οποίο αρχίζει η μέγιστη κοινή ακολουθία σχόλιο 2 στο README.md |
| 25 | +void find_longest_common_sequence(int *common_suffixes, int dna2_index,char *dna1, char *dna2) { |
| 26 | + //συνθήκη τερματισμού - δεν υπάρχουν άλλες βάσεις στο dna2 για να συγκριθούν |
| 27 | + if (dna2_index < 0) { |
| 28 | + free(common_suffixes); |
| 29 | + return; |
| 30 | + } |
| 31 | + //δεσμεύει μνήμη για τα νέα μήκη των μέγιστων κοινών καταλήξεων - όλες οι |
| 32 | + //τιμές αρχικοποιούνται στο 0 |
| 33 | + int *new_common_suffixes = calloc(dna1_length, sizeof(int)); |
| 34 | + for (int i = 0; i < dna1_length; i++) { |
| 35 | + if (dna1[i] == dna2[dna2_index]) { |
| 36 | + //βρέθηκε νέος κοινός χαρακτήρας - η κοινή ακολουθία συνεχίζεται και το |
| 37 | + //μήκος της αυξάνεται κατά 1 |
| 38 | + new_common_suffixes[i] = 1; |
| 39 | + if (i < dna1_length - 1) { |
| 40 | + new_common_suffixes[i] += common_suffixes[i + 1]; |
| 41 | + } |
| 42 | + //ανανεώνει το μέγιστο μήκος της κοινής ακολουθίας και το starting_index |
| 43 | + if (new_common_suffixes[i] > max_length) { |
| 44 | + max_length = new_common_suffixes[i]; |
| 45 | + starting_index = i; |
| 46 | + } |
| 47 | + } |
| 48 | + } |
| 49 | + //ελευθέρωνει τη μνήμη για τα προηγούμενα μήκη των κοινών καταλήξεων |
| 50 | + free(common_suffixes); |
| 51 | + //ξανακαλεί τη συνάρτηση για τον προηγούμενο χαρακτήρα του dna2 |
| 52 | + find_longest_common_sequence(new_common_suffixes, dna2_index - 1, dna1, dna2); |
| 53 | +} |
| 54 | + |
| 55 | +int main(int argc, char **argv) { |
| 56 | + //ελέγχει τον αριθμό των ορισμάτων |
| 57 | + if (argc != 3) { |
| 58 | + perror("Error: arguments missing. Usage: ./dna dnafile1 dnafile2"); |
| 59 | + exit(1); |
| 60 | + } |
| 61 | + FILE *dna1_in = fopen(argv[1], "r"); |
| 62 | + FILE *dna2_in = fopen(argv[2], "r"); |
| 63 | + if (!dna1_in || !dna2_in) { |
| 64 | + perror("Error: Could not open files"); |
| 65 | + exit(1); |
| 66 | + } |
| 67 | + //δεσμεύει μνήμη στο σωρό για την αποθήκευση των ακολουθιών DNA - χρησιμοποιεί |
| 68 | + //το μέγιστο δυνατό μήκος |
| 69 | + char *dna1 = malloc(100000 * sizeof(char)); |
| 70 | + char *dna2 = malloc(100000 * sizeof(char)); |
| 71 | + if (!dna1 || !dna2) { |
| 72 | + perror("Memory allocation failed"); |
| 73 | + exit(1); |
| 74 | + } |
| 75 | + char new_character; |
| 76 | + |
| 77 | + //διαβάζει τους χαρακτήρες από τα αρχεία και τα καταχωρεί στους αντίστοιχους |
| 78 | + //πίνακες μόνο αν αντιστοιχούν σε έγκυρη βάση |
| 79 | + while (fscanf(dna1_in, "%c", &new_character) != EOF) { |
| 80 | + if (is_base(new_character)) { |
| 81 | + dna1[dna1_length] = new_character; |
| 82 | + dna1_length++; |
| 83 | + } |
| 84 | + } |
| 85 | + while (fscanf(dna2_in, "%c", &new_character) != EOF) { |
| 86 | + if (is_base(new_character)) { |
| 87 | + dna2[dna2_length] = new_character; |
| 88 | + dna2_length++; |
| 89 | + } |
| 90 | + } |
| 91 | + |
| 92 | + //δεσμεύει μνήμη για να αποθηκεύσει τα μήκη των μέγιστων ακολουθιών που |
| 93 | + //περιέχουν κάθε χαρακτήρα του dna1 η δέσμευση γίνεται με την calloc ώστε οι |
| 94 | + //τιμές να αρχικοποιηθούν στο 0 |
| 95 | + int *common_suffixes = calloc(dna1_length, sizeof(int)); |
| 96 | + |
| 97 | + for (int i = 0; i < dna1_length; i++) { |
| 98 | + if (dna1[i] == dna2[dna2_length - 1]) { |
| 99 | + common_suffixes[i] = 1; |
| 100 | + } |
| 101 | + } |
| 102 | + find_longest_common_sequence(common_suffixes, dna2_length - 2, dna1, dna2); |
| 103 | + |
| 104 | + //εκτυπώνει τη μέγιστη κοινή ακολουθία |
| 105 | + for (int i = starting_index; i < starting_index + max_length; i++) { |
| 106 | + printf("%c", dna1[i]); |
| 107 | + } |
| 108 | + printf("\n"); |
| 109 | + //απελευθερώνει τη δεσμευμένη μνήμη |
| 110 | + free(dna1); |
| 111 | + free(dna2); |
| 112 | + |
| 113 | + fclose(dna1_in); |
| 114 | + fclose(dna2_in); |
| 115 | + return 0; |
| 116 | +} |
0 commit comments