Page 1 of 2

Βάσεις - Τελική Εξέταση

Posted: Wed Feb 08, 2006 11:10 pm
by yocto
Sreak, όπως είπαμε ... όλα είναι θέμα καλής οργάνωσης.

Posted: Thu Feb 09, 2006 10:10 am
by Sreak
Έτσι έτσι...

Posted: Sat Feb 11, 2006 12:52 pm
by Sreak
Να ρωτήσω κάτι; Έχει κοιτάξει κανείς τις διαφάνειες του Βαζιργιάννη? Δεν είναι λίγο πως να το πω, λίγο έντονες;;;;;;

Απλά μιας και το θυμήθηκα, θυμάται κανείς τις διαφορές του pageRank με Erank και Τrank? Όχι ότι νομίζω ότι θα βάλει κάτι σχετικό αλλά κουβέντα να γίνεται.

Posted: Sat Feb 11, 2006 4:45 pm
by evrikleia
Παιδιά, έχει κανείς παράδειγμα με τον DBSCAN, όπως π.χ. αυτό που έβαλε τον Ιανουάριο 2005 στο προπτυχιακό "Εξόρυξη Γνώσης από ΒΔ και τον ΠΙ";

Για όσους δεν τα έχουν τα θέματα υπάρχουν στο e-class στο αντίστοιχο μάθημα στα έγγραφα με τίτλο exams2004.pdf.

Καλό διάβασμα

Posted: Sat Feb 11, 2006 10:08 pm
by costantis
Δε βρήκα κάτι καλύτερο για να τρέξω τον DBSCAN από την περιγραφή του αλγορίθμου σε ψευδοκώδικα στο βιβλίο του Βαζιργιάννη (πορτοκαλί, σελ. 90).

Btw, σ' εμένα όλα βγήκαν σε 1 συστάδα με τον DBSCAN για το θέμα που λες :smt102
Κανένας άλλος; :?:

Posted: Sat Feb 11, 2006 10:45 pm
by aagis
Παιδιά,
για τον DBSCAN μην χολοσκάτε!
είναι πολύ εύκολος στην λογική του και σε 5 λεπτά τον μαθαίνετε
απλά φέρτε 1...διαβήτη την Δευτέρα μαζί σας και λίγο πριν τις εξετάσεις θα
σας εξηγήσω.
(BWT σωστά βγαίνει ένα cluster με όλα τα σημείαγια τα δεδομένα που έδωσε στην άσκηση! ,για ε=3 βγαίνει πάλι ένα cluster με όλα τα σημεία και για ε=2 βγαίνει ένα cluster για όλα τα σημεία εκτός του J που λαμβάνεται ως θόρυθος )

Posted: Sat Feb 11, 2006 10:45 pm
by peavey
Πάρτε και τις διαφάνειες που είχε κάνει για OLAP και data cubes

Page Rank

Posted: Sat Feb 11, 2006 11:00 pm
by olga
Sreak wrote:Να ρωτήσω κάτι; Έχει κοιτάξει κανείς τις διαφάνειες του Βαζιργιάννη? Δεν είναι λίγο πως να το πω, λίγο έντονες;;;;;;

Απλά μιας και το θυμήθηκα, θυμάται κανείς τις διαφορές του pageRank με Erank και Τrank? Όχι ότι νομίζω ότι θα βάλει κάτι σχετικό αλλά κουβέντα να γίνεται.
Στέλιο τις διαφορές φαντάζομαι θυμάσαι ότι τις ανέφερε ο Βαζιργιάννης στο μάθημα γιατί σε κανένα από τα βιβλία πού έχω δεν υπάρχει σύγκριση page-rank και υπολοίπων.

Το μόνο σχετικό που έχω δει είναι η προσθηκη που κάνανε στον PageRank για να αποφύγουμε το πρόβλημα της κυκλικής αναφοράς (δλδ η Α δείχνει Β και η Β δείχνει Α).
Επίσης στις διάφανειες υπάρχει το εξής:
ο personalised PageRank που αντικαθιστά τον πρώτο όρο με dv (καταλαβαίνει κανείς γιατί;;;;;;;;;)

ο Τ-Ranκ που λαμβάνει υπόψιν το freshness ενός κόμβου και ο Ε-Rank που χρησιμοποιεί την emerging authority.

Ti ακριβώς εννοεί emerging authority;

Τέλος μπορεί κανείς να συνοψίσει τους αλγορίθμους που θεωρεί ότι πρέπει να ξέρουμε να τρέχουμε;

Ευχαριστώ

Όλγα

Posted: Sun Feb 12, 2006 1:21 am
by evangelie
Παιδιά έχω απορίες στους BIRCH, CURE και ROCK. Να κάτσω να ασχοληθώ
ή δεν είναι σημαντικοί;

Το θέμα με την ανάκτηση πληροφοριών το έχετε δεί;
Το SVD-LSI το πιάσαμε;;;;;

Επίσης, θυμάται κανείς αν επιτρέπονται οι φορητοί, για να μην εκτυπώσω τα πάντα?????

TF-IDF

Posted: Sun Feb 12, 2006 1:34 am
by Shadowcaster
Ίσως σας φανεί αστεία η ερώτησή μου, αλλά μήπως έχει εντοπίσει κανείς σας κάτι σχετικό με TF-IDF πέρα από τις διαφάνειες του Τσατσαρώνη; Ήταν θέμα στο προπτυχιακό.. Just to be on the safe side! :-)
Σχετικά με τους φορητούς , προσωπικά επιμένω παραδοσιακά, αλλά δε νομίζω να έχει πρόβλημα. Οι πιο πολλοί θα φέρουν laptop , οπότε....
Καλό διάβασμα!


PS:Nice job peavey!

TF-IDF

Posted: Sun Feb 12, 2006 1:08 pm
by olga
Το θέμα ΤF-IDF υπάρχει σε ένα ebook ΜΙΤ -Principle of Data Mining σελίδα 254- 277.

Ενώ το ΤF είναι απλά Τerm Frequency το IDF αν κατάλαβα καλά υπολογίζεται με εξής λογάριθμο log (N\nj), όπου Ν ο συνολικός αριθμός των των documents και nj τα documents που περιέχουν τον όρο j. Τωρα γιατί το κλάσμα είναι έτσι δεν ξέρω. Το λογικό δεν θα ήταν το αντίστροφο;. Στη συνέχεια υπολογίζει μια μήτρα αλλά δεν ειμαι ακόμα σίγουρη για το πως. Το θέμα στο προπτυχιακό ήτανε να υπολόγίσεις τη μήτρα;

Εχει καταλάβει κανείς τι γίνεται με τα 0/1 vectors όταν σε ένα query υπάρχει το ΝΟΤ;;

Όλγα

Re: TF-IDF

Posted: Sun Feb 12, 2006 2:32 pm
by Brashear
olga wrote:Το θέμα ΤF-IDF υπάρχει σε ένα ebook ΜΙΤ -Principle of Data Mining σελίδα 254- 277.

Ενώ το ΤF είναι απλά Τerm Frequency το IDF αν κατάλαβα καλά υπολογίζεται με εξής λογάριθμο log (N\nj), όπου Ν ο συνολικός αριθμός των των documents και nj τα documents που περιέχουν τον όρο j. Τωρα γιατί το κλάσμα είναι έτσι δεν ξέρω. Το λογικό δεν θα ήταν το αντίστροφο;. Στη συνέχεια υπολογίζει μια μήτρα αλλά δεν ειμαι ακόμα σίγουρη για το πως. Το θέμα στο προπτυχιακό ήτανε να υπολόγίσεις τη μήτρα;

Όλγα
Εγω το μόνο που ηξερα μέχρι τώρα απο TF IDF ήταν ο τύπος υπολογισμού του IDF που σε σημειώσεις του εργαστηρίου είναι= log((1+N)/nj). Ποιός είναι τελικά σωστός? Ξέρει κανείς σίγουρα? Οσο για το πώς βρίσκουμε τη μήτρα ιδέα δεν έχω. Δεν βρήκα πουθενά ενα καλό παράδειγμα. Το άλλο με το LSI το έχει καταλάβει κανείς?
Μου αρέσει που όλοι ρωτάμε και δεν απαντάει κανείς. Κανείς δεν το κατέχει το "σπόρ"? :roll: 8-[

IDF

Posted: Sun Feb 12, 2006 3:45 pm
by olga
Σε ένα αλλο βιβλίο βρήκα το εξής:

ο τύπος υπολογισμού IDF= log(N/nj)+1.


Προτείνω εάν βάλει σχετική ερώτηση να τον ρωτήσουμε ποιον τύπο θέλει να χρησιμοποιήσουμε.

Posted: Sun Feb 12, 2006 3:58 pm
by pumpkin
ρε παιδια κατάλαβε κανεις τι εννοεί στο Θέμα 3 στο Β όταν λέει itemset{1,2}->itemset{1} ...? αφου τα items είναι της μορφής α* κλπ. ...

Posted: Sun Feb 12, 2006 4:12 pm
by yocto
Εννοεί ότι θα υπάρχουν 2 itemsets αριστερά και ένα δεξιά.
πχ. α2 AND b3 ==> c3

Posted: Sun Feb 12, 2006 4:26 pm
by pumpkin
να σου πω τελευταιο itemset δεν είναι το a2 b3 c3; ...
οι κανόνες θα ναι οι συνδυασμοί τους; (3 κανόνες δλδ) ;

Posted: Sun Feb 12, 2006 4:32 pm
by yocto
a2 AND b3 ==> c3
a2 AND c3 ==> b3
b3 AND c3 ==> a2

(με 100 ευρώ είμαστε ΟΚ)

Posted: Sun Feb 12, 2006 4:34 pm
by pumpkin
χεχε...thanx mate!

Posted: Sun Feb 12, 2006 6:43 pm
by kmast
Τους τυπους στο LSI ΜΕ ΤΙς ΙΔΙΟΤΙΜΈς ΤΟΥς ΚΑΤΑΛΑΒΑΊΝΕΙ ΚΑΝΕΊΣ;
tdf μόνο στου εργαστηρίου τις διαφάνειες δεν έχει;

Posted: Sun Feb 12, 2006 6:46 pm
by pumpkin
ρε σεις εχει κανενας κανα κομπιουτεράκι ξέμπαρκο;...γιατί δεν βρίσκω το δικό μου...μήπως το δωσα σε κανέναν και το πήρε μαζί του απο λάθος;

Posted: Sun Feb 12, 2006 10:43 pm
by pumpkin
λοιπόν για πείτε υπάρχει κανεις που να έλυσε το θέμα 1 από τα θέματα του 2005 (exams2004.pdf) ; αν ναι ας δωσει καμια οδηγία...

IDF & LSI

Posted: Sun Feb 12, 2006 10:48 pm
by Quasar
Ναι, παιδια, αν υπάρχει κανείς που να μπορεί να στείλει κάτι, η πατρίς (κι εμεις) θα το ευγνωμωνεί! :smt100