Η επιστήμη των δεδομένων είναι ένα τεράστιο πεδίο, μέρος της οποίας φιλοδοξούμε να καλύψουμε με αυτό το μάθημα. Αν επιχειρήσουμε έναν απλοϊκό χωρισμό της ανάλυσης των δεδομένων στα αντικείμενα της δημιουργίας υποθέσεων και του ελέγχου των υποθέσεων, τότε σίγουρα αυτό το μάθημα έχει προσανατολισμό στο πρώτο κομμάτι, τη δημιουργία υποθέσεων ή αλλιώς την εξερεύνηση των δεδομένων. Θα μάθουμε πως χειριζόμαστε και αναλύουμε τα δεδομένα ώστε να μπορούμε να υποστηρίξουμε τη δύσκολη διαδικασία της έρευνας, να υποστηρίξουμε την έρευνα κατευθύνοντας τους ερευνητές προς την κατανόηση συμπεριφορών και τελικά τη διατύπωση εύστοχων ερευνητικών ερωτημάτων. Η επιστήμη των δεδομένων δεν μπορεί να νοηθεί χωριστά από προγραμματιστικά εργαλεία. Έτσι, και σε αυτό το μάθημα όλες οι διαλέξεις θα πραγματοποιούνται παράλληλα με την επίδειξη εφαρμογών στη γλώσσα R. Αναλυτικά, το πρόγραμμα των διαλέξεων θα περιλαμβάνει:

 

-       ΕΝΟΤΗΤΑ 1: ΔΙΕΡΕΥΝΗΣΗ

o   Οπτικοποίηση Δεδομένων

o   Μετατροπές Δεδομένων

o   Διερευνητική Ανάλυση Δεδομένων

-       ΕΝΟΤΗΤΑ 2: ΠΡΟΕΤΟΙΜΑΣΙΑ

o   Εισαγωγή Δεδομένων

o   Τακτοποίηση Δεδομένων και Σχεσιακά Δεδομένα

o   Χειρισμός αλφαριθμητικών, παραγόντων, και χρονοσημάνσεων

-       ΕΝΟΤΗΤΑ 3: ΣΤΟΙΧΕΙΑ ΠΡΟΓΡΑΜΜΑΤΩΝ ΚΑΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗΣ

o   Διασωλήνωση, Συναρτήσεις, Διανύσματα

o   Δομές Επανάληψης

o   Κατασκευή Μοντέλων

-       ΕΝΟΤΗΤΑ 4: ΤΕΧΝΙΚΕΣ ΑΝΑΛΥΣΗΣ

o   Ομαδοποίηση

o   Δένδρα Αποφάσεων

o   Εξόρυξη Διαδικασιών

 

Προαπαιτούμενα: Το μάθημα έχει σχεδιαστεί για να διδάσκεται χωρίς να υποθέτει κάποια προηγούμενη γνώση των φοιτητών, ωστόσο γνώσεις προγραμματισμού και ποσοτικών μεθόδων σίγουρα θα διευκολύνουν την παρακολούθηση. Για όσους φοιτητές επιθυμούν να προετοιμαστούν αποκτώντας μία επαφή με τη γλώσσα R, προτείνεται το δωρεάν σύγγραμμα https://rstudio-education.github.io/hopr/index.html

Για πιο αποτελεσματική παρακολούθηση, προτείνεται οι φοιτητές να βρίσκονται μπροστά σε υπολογιστή με εγκατεστημένο το RStudio