Δεν είναι το κατάλληλο σημείο να το ανοίξω - αλλά δεν βρήκα κάτι καλύτερο. Όσο ήμουν προπτυχιακός στην Ελλάδα δεν είχα συνειδητοποιήσει τον πλούσιο κόσμο των βάσεων δεδομένων εκτός του ότι κάνει το πανεπιστήμιό μας. Νόμιζα ότι οι βάσεις δεδομένων είναι βαρετές, τετριμμένες και δεν είναι το αντικείμενο που ξεκίνησα να κάνω το διδακτορικό μου. Τελείωσα το προπτυχιακό έχοντας διαβάσει κανα δυο papers (στα Κατανεμημένα) + δύο ακόμα του κ.Βασσάλου, πράγμα που δεν γίνεται στις ΗΠΑ... Τα παιδιά εδώ έχοντας επαφή μερικούς μήνες μόνο με την πληροφορική χώνονται σε ερευνητικά projects και διαβάζουν papers και γράφουν κώδικα σε άγνωστες για αυτούς γλώσσες, ακόμα και αν δεν κάνουν major στην πληροφορική...Για τα papers και την έρευνα στα μαθήματα ακόμα και στα Μεταπτυχιακά δεν δίνεται έμφανση στα κύρια papers στους τομείς ώστε όσοι ενδιαφέρονται για την έρευνα ή απλά ενδιαφέρονται να βρούν από κάπου να πιαστούν..
Εδώ θα προτείνω μερικές δημοσιεύσεις (έστω και παλιές) στον τομέα των Βάσεων, των Κατανεμημένων και στην Οπτικοποίηση που μπορούν να βρουν ενδιαφέρουσες πιστεύω πολλά άτομα... Προτείνω να ανοίξουν αντίστοιχα topics για άλλους τομείς οι εκάστοτε ενδιαφερόμενοι (αν υπάρχουν) και ερευνητές - έβαλα links που δεν χρειάζεται να είστε συνδρομιτές σε acm/ieee/sigmod/ κτλ. Τα περισσότερα είναι δουλείες καθηγητών του Brown μαζί με MIT, Brandeis κτλ..ή καθηγητών που ήταν στο Berkley και ήρθαν στο Brown. Επίσης κάποια είναι άσχετα όπως το Pastry και κάποια είναι industrial papers όπως της Google και της Amazon (πολύ καλά papers γενικά)
newSQL and noSQL + other large scale database technologies
Dynamo: Amazon’s Highly Available Key-value Store
http://www.allthingsdistributed.com/fil ... sp2007.pdf
Αν ενδιαφέρεστε για key-value stores όπως το Dynamo κοιτάξτε το Riak http://basho.com/riak/, το Apache Cassandra http://cassandra.apache.org/
(ενδιαφέρον από P2P άποψη - για το από πάνω)
Pastry: Scalable, decentralized object location and routing for large-scale peer-to-peer systems
https://www.scss.tcd.ie/Stephen.Barrett ... pastry.pdf
(Google) Bigtable: A Distributed Storage System for Structured Data
http://static.googleusercontent.com/ext ... osdi06.pdf
(Google) Spanner: Google’s Globally-Distributed Database
http://static.googleusercontent.com/ext ... di2012.pdf
(Google) MapReduce: Simplified Data Processing on Large Clusters
http://storageconference.org/2010/Paper ... vachko.pdf
Το Hadoop είναι η ανοικτού κώδικα υλοποίηση του MapReduce της Google
(Yahoo) The Hadoop Distributed File System (HDFS)
http://storageconference.org/2010/Paper ... vachko.pdf
(Yahoo) Pig Latin - A Not-So-Foreign Language for Data Processing (on top of Hadoop)
http://infolab.stanford.edu/~usriv/papers/pig-latin.pdf
(Facebook) Hive - A Petabyte Scale Warehouse Using Hadoop
http://infolab.stanford.edu/~ragho/hive-icde2010.pdf
Apache Hadoop Goes Realtime at Facebook
http://borthakur.com/ftp/RealtimeHadoopSigmod2011.pdf
(Brown University,MIT,Yale,Vertica) H-Store:A High Performance,Distributed Main Memory Transaction Processing System
http://www.vldb.org/pvldb/1/1454211.pdf
(MIT,Brown Univesity,UMass, Brandeis) C-Store: A Column-oriented DBMS
http://people.csail.mit.edu/tdanford/68 ... cstore.pdf
Overview of SciDB: Large Scale Array Storage, Processing and Analysis
http://www.scidb.org/Documents/sigmod691-brown.pdf
Data Exploration/Tracing + Visualization
Query Steering for Interactive Data Exploration
http://www.cidrdb.org/cidr2013/Papers/C ... aper98.pdf
SCOUT: Prefetching for Latent Structure Following Queries
http://vldb.org/pvldb/vol5/p1531_farhan ... db2012.pdf
Polaris: A System for Query, Analysis, and Visualization of Multidimensional Databases
http://graphics.stanford.edu/papers/polaris/polaris.pdf
CroudSourcing + Databases
CrowdDB: Answering Queries with Crowdsourcing
http://www.cs.berkeley.edu/~rxin/papers ... od2011.pdf
Machine Learning + Databases
MLbase: A Distributed Machine-learning System
http://www.cs.berkeley.edu/~ameet/mlbase.pdf
Large Data Scale Analysis comparison
A Comparison of Approaches to Large-Scale Data Analysis
http://database.cs.brown.edu/sigmod09/b ... gmod09.pdf
Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων
Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων
Πολύ ενδιαφέρον θέμα, ευχαριστούμε για τα links
- Zifnab
- Venus Former Team Member
- Posts: 7581
- Joined: Tue Nov 15, 2005 2:42 am
- Academic status: MSc
- Gender: ♂
- Location: Connecticut
- Contact:
Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων
προσέθεσα μερικά ακόμα papers (το Hive, το Pig, το HDFS και το τελευταίο που είναι benchmark)
- Zifnab
- Venus Former Team Member
- Posts: 7581
- Joined: Tue Nov 15, 2005 2:42 am
- Academic status: MSc
- Gender: ♂
- Location: Connecticut
- Contact:
Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων
Μέχρι να μπορέσω να επεξεργαστώ το πάνω post φυσικά είχα ξεχάσει:
(Berkeley) Spark: Cluster Computing with Working Sets
Μια βελτιωμένη έκδοση του Hadoop
http://www.cs.berkeley.edu/~matei/paper ... _spark.pdf
(Berkeley) Spark: Cluster Computing with Working Sets
Μια βελτιωμένη έκδοση του Hadoop
http://www.cs.berkeley.edu/~matei/paper ... _spark.pdf