Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων

Εδώ μπαίνουν θέματα σχετικά με βιβλία.
Post Reply
User avatar
Zifnab
Venus Former Team Member
Posts: 7581
Joined: Tue Nov 15, 2005 2:42 am
Academic status: MSc
Gender:
Location: Connecticut
Contact:

Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων

Post by Zifnab » Wed Feb 27, 2013 8:20 am

Δεν είναι το κατάλληλο σημείο να το ανοίξω - αλλά δεν βρήκα κάτι καλύτερο. Όσο ήμουν προπτυχιακός στην Ελλάδα δεν είχα συνειδητοποιήσει τον πλούσιο κόσμο των βάσεων δεδομένων εκτός του ότι κάνει το πανεπιστήμιό μας. Νόμιζα ότι οι βάσεις δεδομένων είναι βαρετές, τετριμμένες και δεν είναι το αντικείμενο που ξεκίνησα να κάνω το διδακτορικό μου. Τελείωσα το προπτυχιακό έχοντας διαβάσει κανα δυο papers (στα Κατανεμημένα) + δύο ακόμα του κ.Βασσάλου, πράγμα που δεν γίνεται στις ΗΠΑ... Τα παιδιά εδώ έχοντας επαφή μερικούς μήνες μόνο με την πληροφορική χώνονται σε ερευνητικά projects και διαβάζουν papers και γράφουν κώδικα σε άγνωστες για αυτούς γλώσσες, ακόμα και αν δεν κάνουν major στην πληροφορική...Για τα papers και την έρευνα στα μαθήματα ακόμα και στα Μεταπτυχιακά δεν δίνεται έμφανση στα κύρια papers στους τομείς ώστε όσοι ενδιαφέρονται για την έρευνα ή απλά ενδιαφέρονται να βρούν από κάπου να πιαστούν..

Εδώ θα προτείνω μερικές δημοσιεύσεις (έστω και παλιές) στον τομέα των Βάσεων, των Κατανεμημένων και στην Οπτικοποίηση που μπορούν να βρουν ενδιαφέρουσες πιστεύω πολλά άτομα... Προτείνω να ανοίξουν αντίστοιχα topics για άλλους τομείς οι εκάστοτε ενδιαφερόμενοι (αν υπάρχουν) και ερευνητές :) - έβαλα links που δεν χρειάζεται να είστε συνδρομιτές σε acm/ieee/sigmod/ κτλ. Τα περισσότερα είναι δουλείες καθηγητών του Brown μαζί με MIT, Brandeis κτλ..ή καθηγητών που ήταν στο Berkley και ήρθαν στο Brown. Επίσης κάποια είναι άσχετα όπως το Pastry και κάποια είναι industrial papers όπως της Google και της Amazon (πολύ καλά papers γενικά)

newSQL and noSQL + other large scale database technologies

Dynamo: Amazon’s Highly Available Key-value Store
http://www.allthingsdistributed.com/fil ... sp2007.pdf
Αν ενδιαφέρεστε για key-value stores όπως το Dynamo κοιτάξτε το Riak http://basho.com/riak/, το Apache Cassandra http://cassandra.apache.org/

(ενδιαφέρον από P2P άποψη - για το από πάνω)
Pastry: Scalable, decentralized object location and routing for large-scale peer-to-peer systems
https://www.scss.tcd.ie/Stephen.Barrett ... pastry.pdf

(Google) Bigtable: A Distributed Storage System for Structured Data
http://static.googleusercontent.com/ext ... osdi06.pdf

(Google) Spanner: Google’s Globally-Distributed Database
http://static.googleusercontent.com/ext ... di2012.pdf

(Google) MapReduce: Simplified Data Processing on Large Clusters
http://storageconference.org/2010/Paper ... vachko.pdf

Το Hadoop είναι η ανοικτού κώδικα υλοποίηση του MapReduce της Google

(Yahoo) The Hadoop Distributed File System (HDFS)
http://storageconference.org/2010/Paper ... vachko.pdf

(Yahoo) Pig Latin - A Not-So-Foreign Language for Data Processing (on top of Hadoop)
http://infolab.stanford.edu/~usriv/papers/pig-latin.pdf

(Facebook) Hive - A Petabyte Scale Warehouse Using Hadoop
http://infolab.stanford.edu/~ragho/hive-icde2010.pdf

Apache Hadoop Goes Realtime at Facebook
http://borthakur.com/ftp/RealtimeHadoopSigmod2011.pdf

(Brown University,MIT,Yale,Vertica) H-Store:A High Performance,Distributed Main Memory Transaction Processing System
http://www.vldb.org/pvldb/1/1454211.pdf

(MIT,Brown Univesity,UMass, Brandeis) C-Store: A Column-oriented DBMS
http://people.csail.mit.edu/tdanford/68 ... cstore.pdf

Overview of SciDB: Large Scale Array Storage, Processing and Analysis
http://www.scidb.org/Documents/sigmod691-brown.pdf

Data Exploration/Tracing + Visualization
Query Steering for Interactive Data Exploration
http://www.cidrdb.org/cidr2013/Papers/C ... aper98.pdf

SCOUT: Prefetching for Latent Structure Following Queries
http://vldb.org/pvldb/vol5/p1531_farhan ... db2012.pdf

Polaris: A System for Query, Analysis, and Visualization of Multidimensional Databases
http://graphics.stanford.edu/papers/polaris/polaris.pdf

CroudSourcing + Databases
CrowdDB: Answering Queries with Crowdsourcing
http://www.cs.berkeley.edu/~rxin/papers ... od2011.pdf

Machine Learning + Databases
MLbase: A Distributed Machine-learning System
http://www.cs.berkeley.edu/~ameet/mlbase.pdf

Large Data Scale Analysis comparison
A Comparison of Approaches to Large-Scale Data Analysis
http://database.cs.brown.edu/sigmod09/b ... gmod09.pdf
g.panag
byte level
byte level
Posts: 96
Joined: Mon Jul 12, 2010 2:58 pm
Academic status: 4th year
Gender:

Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων

Post by g.panag » Fri Apr 05, 2013 1:28 am

Πολύ ενδιαφέρον θέμα, ευχαριστούμε για τα links :smt004
User avatar
Zifnab
Venus Former Team Member
Posts: 7581
Joined: Tue Nov 15, 2005 2:42 am
Academic status: MSc
Gender:
Location: Connecticut
Contact:

Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων

Post by Zifnab » Mon Sep 23, 2013 10:38 pm

προσέθεσα μερικά ακόμα papers (το Hive, το Pig, το HDFS και το τελευταίο που είναι benchmark)
User avatar
Zifnab
Venus Former Team Member
Posts: 7581
Joined: Tue Nov 15, 2005 2:42 am
Academic status: MSc
Gender:
Location: Connecticut
Contact:

Re: Δημοσιεύσεις και Έρευνα στις Βάσεις Δεδομένων

Post by Zifnab » Tue Jul 01, 2014 8:00 pm

Μέχρι να μπορέσω να επεξεργαστώ το πάνω post φυσικά είχα ξεχάσει:

(Berkeley) Spark: Cluster Computing with Working Sets
Μια βελτιωμένη έκδοση του Hadoop
http://www.cs.berkeley.edu/~matei/paper ... _spark.pdf
Post Reply

Return to “Βιβλία”