Διαχείριση Μεγάλου Όγκου Δεδομένων

Στα πλαίσια αυτού του μαθήματος θα επικεντρωθούμε στην έννοια “μεγάλου όγκου δεδομένα” (big data) και θα μελετήσουμε μοντέρνες τεχνικές και πλατφόρμες αποθήκευσης και διαχείρισης τέτοιων δεδομένων. Συγκεκριμένα, θα μελετηθούν: Aρχιτεκτονικές και συστήματα μεγάλης κλίμακας: Δίκτυα ομοτίμων (Peer-to-Peer) και Υπολογιστικά Νέφη (Cloud Computing). Βάσεις δεδομένων στο διαδίκτυο: Σχεσιακές, παράλληλες και κατανεμημένες βάσεις, με έμφαση στις τεχνολογίες κατανεμημένων συστημάτων αρχείων (HDFS), ΝοSQL (HBase, Cassandra), graph-databases(Neo4j), NewSQL. Μοντέλα υπολογισμού μεγάλου όγκου δεδομένων (MapReduce, BSP) και πλατφόρμες που τις εφαρμόζουν (Hadoop, Hama, Spark, κλπ). Εφαρμογές των παραπάνω και υλοποίηση αλγορίθμων με κατανεμημένο τρόπο.
Code Hours Type eClass Semester
DCS262 4 Επιλογής e-Class 7

Βιβλιογραφία:

  • “Εξόρυξη από Μεγάλα Σύνολα Δεδομένων, Anand Rajaraman, Jeffrey David Ullman”eudoxus link
  • ” Η ΜΕΘΟΔΟΣ PAGERANK ΤΗΣ GOOGLE ΚΑΙ ΑΛΛΑ ΣΥΣΤΗΜΑΤΑ ΚΑΤΑΤΑΞΗΣ ΙΣΤΟΣΕΛΙΔΩΝ, LANGVILLE AMY, MEYER CARL”eudoxus link