Βάσεις - Τελική Εξέταση
Βάσεις - Τελική Εξέταση
Sreak, όπως είπαμε ... όλα είναι θέμα καλής οργάνωσης.
Παιδιά,
για τον DBSCAN μην χολοσκάτε!
είναι πολύ εύκολος στην λογική του και σε 5 λεπτά τον μαθαίνετε
απλά φέρτε 1...διαβήτη την Δευτέρα μαζί σας και λίγο πριν τις εξετάσεις θα
σας εξηγήσω.
(BWT σωστά βγαίνει ένα cluster με όλα τα σημείαγια τα δεδομένα που έδωσε στην άσκηση! ,για ε=3 βγαίνει πάλι ένα cluster με όλα τα σημεία και για ε=2 βγαίνει ένα cluster για όλα τα σημεία εκτός του J που λαμβάνεται ως θόρυθος )
για τον DBSCAN μην χολοσκάτε!
είναι πολύ εύκολος στην λογική του και σε 5 λεπτά τον μαθαίνετε
απλά φέρτε 1...διαβήτη την Δευτέρα μαζί σας και λίγο πριν τις εξετάσεις θα
σας εξηγήσω.
(BWT σωστά βγαίνει ένα cluster με όλα τα σημείαγια τα δεδομένα που έδωσε στην άσκηση! ,για ε=3 βγαίνει πάλι ένα cluster με όλα τα σημεία και για ε=2 βγαίνει ένα cluster για όλα τα σημεία εκτός του J που λαμβάνεται ως θόρυθος )
Πάρτε και τις διαφάνειες που είχε κάνει για OLAP και data cubes
Χρησιμοποιώ κάποια δόση υπερβολής...
- olga
- byte level
- Posts: 86
- Joined: Fri Oct 14, 2005 1:19 pm
- Academic status: 3rd year
- Gender: ♀
- Location: Where the wild roses grow...
Page Rank
Στέλιο τις διαφορές φαντάζομαι θυμάσαι ότι τις ανέφερε ο Βαζιργιάννης στο μάθημα γιατί σε κανένα από τα βιβλία πού έχω δεν υπάρχει σύγκριση page-rank και υπολοίπων.Sreak wrote:Να ρωτήσω κάτι; Έχει κοιτάξει κανείς τις διαφάνειες του Βαζιργιάννη? Δεν είναι λίγο πως να το πω, λίγο έντονες;;;;;;
Απλά μιας και το θυμήθηκα, θυμάται κανείς τις διαφορές του pageRank με Erank και Τrank? Όχι ότι νομίζω ότι θα βάλει κάτι σχετικό αλλά κουβέντα να γίνεται.
Το μόνο σχετικό που έχω δει είναι η προσθηκη που κάνανε στον PageRank για να αποφύγουμε το πρόβλημα της κυκλικής αναφοράς (δλδ η Α δείχνει Β και η Β δείχνει Α).
Επίσης στις διάφανειες υπάρχει το εξής:
ο personalised PageRank που αντικαθιστά τον πρώτο όρο με dv (καταλαβαίνει κανείς γιατί;;;;;;;;;)
ο Τ-Ranκ που λαμβάνει υπόψιν το freshness ενός κόμβου και ο Ε-Rank που χρησιμοποιεί την emerging authority.
Ti ακριβώς εννοεί emerging authority;
Τέλος μπορεί κανείς να συνοψίσει τους αλγορίθμους που θεωρεί ότι πρέπει να ξέρουμε να τρέχουμε;
Ευχαριστώ
Όλγα
Η πιο όμορφη θάλασσα ειναι αυτη που δεν την ταξιδέψαμε ακόμα....
-
- bit level
- Posts: 11
- Joined: Thu Jan 05, 2006 6:13 pm
- Location: DPMLAB
TF-IDF
Ίσως σας φανεί αστεία η ερώτησή μου, αλλά μήπως έχει εντοπίσει κανείς σας κάτι σχετικό με TF-IDF πέρα από τις διαφάνειες του Τσατσαρώνη; Ήταν θέμα στο προπτυχιακό.. Just to be on the safe side!
Σχετικά με τους φορητούς , προσωπικά επιμένω παραδοσιακά, αλλά δε νομίζω να έχει πρόβλημα. Οι πιο πολλοί θα φέρουν laptop , οπότε....
Καλό διάβασμα!
PS:Nice job peavey!

Σχετικά με τους φορητούς , προσωπικά επιμένω παραδοσιακά, αλλά δε νομίζω να έχει πρόβλημα. Οι πιο πολλοί θα φέρουν laptop , οπότε....
Καλό διάβασμα!
PS:Nice job peavey!
- olga
- byte level
- Posts: 86
- Joined: Fri Oct 14, 2005 1:19 pm
- Academic status: 3rd year
- Gender: ♀
- Location: Where the wild roses grow...
TF-IDF
Το θέμα ΤF-IDF υπάρχει σε ένα ebook ΜΙΤ -Principle of Data Mining σελίδα 254- 277.
Ενώ το ΤF είναι απλά Τerm Frequency το IDF αν κατάλαβα καλά υπολογίζεται με εξής λογάριθμο log (N\nj), όπου Ν ο συνολικός αριθμός των των documents και nj τα documents που περιέχουν τον όρο j. Τωρα γιατί το κλάσμα είναι έτσι δεν ξέρω. Το λογικό δεν θα ήταν το αντίστροφο;. Στη συνέχεια υπολογίζει μια μήτρα αλλά δεν ειμαι ακόμα σίγουρη για το πως. Το θέμα στο προπτυχιακό ήτανε να υπολόγίσεις τη μήτρα;
Εχει καταλάβει κανείς τι γίνεται με τα 0/1 vectors όταν σε ένα query υπάρχει το ΝΟΤ;;
Όλγα
Ενώ το ΤF είναι απλά Τerm Frequency το IDF αν κατάλαβα καλά υπολογίζεται με εξής λογάριθμο log (N\nj), όπου Ν ο συνολικός αριθμός των των documents και nj τα documents που περιέχουν τον όρο j. Τωρα γιατί το κλάσμα είναι έτσι δεν ξέρω. Το λογικό δεν θα ήταν το αντίστροφο;. Στη συνέχεια υπολογίζει μια μήτρα αλλά δεν ειμαι ακόμα σίγουρη για το πως. Το θέμα στο προπτυχιακό ήτανε να υπολόγίσεις τη μήτρα;
Εχει καταλάβει κανείς τι γίνεται με τα 0/1 vectors όταν σε ένα query υπάρχει το ΝΟΤ;;
Όλγα
Η πιο όμορφη θάλασσα ειναι αυτη που δεν την ταξιδέψαμε ακόμα....
Re: TF-IDF
Εγω το μόνο που ηξερα μέχρι τώρα απο TF IDF ήταν ο τύπος υπολογισμού του IDF που σε σημειώσεις του εργαστηρίου είναι= log((1+N)/nj). Ποιός είναι τελικά σωστός? Ξέρει κανείς σίγουρα? Οσο για το πώς βρίσκουμε τη μήτρα ιδέα δεν έχω. Δεν βρήκα πουθενά ενα καλό παράδειγμα. Το άλλο με το LSI το έχει καταλάβει κανείς?olga wrote:Το θέμα ΤF-IDF υπάρχει σε ένα ebook ΜΙΤ -Principle of Data Mining σελίδα 254- 277.
Ενώ το ΤF είναι απλά Τerm Frequency το IDF αν κατάλαβα καλά υπολογίζεται με εξής λογάριθμο log (N\nj), όπου Ν ο συνολικός αριθμός των των documents και nj τα documents που περιέχουν τον όρο j. Τωρα γιατί το κλάσμα είναι έτσι δεν ξέρω. Το λογικό δεν θα ήταν το αντίστροφο;. Στη συνέχεια υπολογίζει μια μήτρα αλλά δεν ειμαι ακόμα σίγουρη για το πως. Το θέμα στο προπτυχιακό ήτανε να υπολόγίσεις τη μήτρα;
Όλγα
Μου αρέσει που όλοι ρωτάμε και δεν απαντάει κανείς. Κανείς δεν το κατέχει το "σπόρ"?


- olga
- byte level
- Posts: 86
- Joined: Fri Oct 14, 2005 1:19 pm
- Academic status: 3rd year
- Gender: ♀
- Location: Where the wild roses grow...
IDF
Σε ένα αλλο βιβλίο βρήκα το εξής:
ο τύπος υπολογισμού IDF= log(N/nj)+1.
Προτείνω εάν βάλει σχετική ερώτηση να τον ρωτήσουμε ποιον τύπο θέλει να χρησιμοποιήσουμε.
ο τύπος υπολογισμού IDF= log(N/nj)+1.
Προτείνω εάν βάλει σχετική ερώτηση να τον ρωτήσουμε ποιον τύπο θέλει να χρησιμοποιήσουμε.
Η πιο όμορφη θάλασσα ειναι αυτη που δεν την ταξιδέψαμε ακόμα....
IDF & LSI
Ναι, παιδια, αν υπάρχει κανείς που να μπορεί να στείλει κάτι, η πατρίς (κι εμεις) θα το ευγνωμωνεί! 

Π.Κ.