Συστήματα Ανάκτησης Πληροφοριών

Συζητήσεις σχετικά με τα μαθήματα Κύκλων και Κατευθύνσεων του τρέχοντος ακαδημαϊκού έτους. Για συζητήσεις παλαιοτέρων ετών κοιτάξτε στην κατηγορία "Παλιές Συζητήσεις "
User avatar
ChristinaX
Buffer underflow exception
Buffer underflow exception
Posts: 4
Joined: Sun Mar 05, 2017 3:21 am
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby ChristinaX » Wed Mar 08, 2017 10:03 pm

Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;
User avatar
Georgilakis Antonios
Mbyte level
Mbyte level
Posts: 541
Joined: Mon Dec 02, 2013 11:10 pm
Academic status: Alumnus/a
Gender:
Location: Straight into your Mind

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby Georgilakis Antonios » Wed Mar 08, 2017 10:52 pm

ChristinaX wrote:Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;

Σε έμενα τουλάχιστον όχι. Ακόμα.
Spoiler: εμφάνιση/απόκρυψη
"Always keep a low profile. Cause when you get high, things can become strange."
"Never stop doing things you like. Never stop loving people you love. Never give up. Believe in yourself. Believe in your hidden powers."
"Honesty is an expensive gift, so don't expect it from cheap people."
The Scientist
User avatar
ChristinaX
Buffer underflow exception
Buffer underflow exception
Posts: 4
Joined: Sun Mar 05, 2017 3:21 am
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby ChristinaX » Wed Mar 08, 2017 10:54 pm

Georgilakis Antonios wrote:
ChristinaX wrote:Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;

Σε έμενα τουλάχιστον όχι. Ακόμα.


OK, ευχαριστώ πολύ!
SilverHero
bit level
bit level
Posts: 10
Joined: Fri Mar 10, 2017 4:26 pm

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby SilverHero » Fri Mar 17, 2017 12:35 am

Παιδιά εγώ ακόμη δεν έχω δει να έχουν περαστεί τα αποτελέσματα στην e-gramateia και έχω αρχίσει να αναρωτιέμαι αν έγινε κάνα λάθος, είμαι ο μόνος;
floydiantree
byte level
byte level
Posts: 66
Joined: Sun Dec 18, 2011 3:26 pm
Academic status: N>4
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby floydiantree » Sun Mar 19, 2017 6:33 pm

SilverHero wrote:Παιδιά εγώ ακόμη δεν έχω δει να έχουν περαστεί τα αποτελέσματα στην e-gramateia και έχω αρχίσει να αναρωτιέμαι αν έγινε κάνα λάθος, είμαι ο μόνος;


Εμένα έχουν περαστεί κανονικά.
So, once in a while you'd
Be better listening to the fools for a change
User avatar
pgetsos
Venus Former Team Member
Posts: 1184
Joined: Sun Oct 13, 2013 1:29 am
Academic status: 4th year
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby pgetsos » Wed Sep 06, 2017 4:22 am

Θυμάται κανείς θέματα να τα συμπληρώσουμε; :)
Όταν μια μαύρη γάτα περάσει από μπροστά σου, σημαίνει ότι το ζώο πάει κάπου.

Μην αφήνεις τα μικρά μυαλά να σε πείσουν ότι τα όνειρα σου είναι πολύ μεγάλα.
User avatar
Georgilakis Antonios
Mbyte level
Mbyte level
Posts: 541
Joined: Mon Dec 02, 2013 11:10 pm
Academic status: Alumnus/a
Gender:
Location: Straight into your Mind

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby Georgilakis Antonios » Wed Sep 06, 2017 5:20 pm

pgetsos wrote:Θυμάται κανείς θέματα να τα συμπληρώσουμε; :)

Θέματα 4/9/2017 (Όλες οι εκφωνήσεις στο περίπου)

Θέμα 1ο
Οι σημερινές μηχανές αναζήτησης στον ιστό καταγράφουν τις αναζητήσεις που πραγματοποιούν οι χρήστες ως εξής: για κάθε ερώτημα που υποβάλει ο χρήστης στην μηχανή αναζήτησης, καταγράφεται το ερώτημα και τα έγγραφα που ανακτήθηκαν και επιστράφηκαν στην σελίδα των αποτελεσμάτων. Το σύνολο των στοιχείων που καταγράφονται αναφέρεται και ως query log, και το οποίο οι μηχανές αναζήτησης χρησιμοποιούν για να βελτιώσουν την ακρίβεια επιστροφής των αποτελεσμάτων σε διάφορα ερωτήματα των χρηστών. Εξηγήστε με ποιον τρόπο θα μπορούσε μια μηχανή αναζήτησης να αξιοποιήσει αυτά τα query logs ώστε να αυξήσει την ακρίβειά της (precision), αλλά και πως αυτή η ιδέα/ο τρόπος θα μπορούσε να υλοποιηθεί.

Θέμα 2ο
Κατά την αξιολόγηση της ομοιότητας των κειμένων με διάφορα ερωτήματα, εκτός από πληροφορίες που έχουν υπολογιστικό κόστος για την εξαγωγή τους, μπορούμε να αξιοποιήσουμε και πληροφορίες που δεν έχουν κάποιο υπολογιστικό κόστος για να εξαχθούν. Να περιγράψετε 5 τέτοιες πληροφορίες που μπορούμε να εξάγουμε από τα κείμενα κατά την αξιολόγησή τους, χωρίς υπολογιστικό κόστος.

Θέμα 3ο
Στο μοντέλο του διανυσματικού χώρου αξιολογούμε την ομοιότητα μεταξύ κειμένων και ερωτημάτων, αλλά δεν εμφανίζονται πουθενά πληροφορίες σχετικά με την ομοιότητα των όρων στις οντότητες που αξιολογούνται. Να περιγράψετε έναν τρόπο με τον οποίο θα μπορούσαμε να "ενσωματώσουμε" (embed) τέτοιες πληροφορίες ομοιότητας των όρων κατά την διαδικασία της αξιολόγησης στο μοντέλο του διανυσματικού χώρου. (Γενικευμένο Μοντέλο του Διανυσματικού Χώρου)

Θέμα 4ο
α) Τα μέτρα ανάκλησης (recall) και ακρίβειας (precision) είναι δύο καλοί δείκτες για την μέτρηση της απόδοσης ενός συστήματος ανάκτησης πληροφοριών. Ωστόσο, κανένας από τους δύο δεν χρησιμοποιείται για την σύγκριση της απόδοσης δύο διαφορετικών συστημάτων ανάκτησης πληροφοριών. Να εξηγήσετε για ποιο λόγο συμβαίνει αυτό.
β) Έστω ότι ένα σύστημα ανάκτησης επέστρεψε (για ένα ερώτημα) 10 έγγραφα/αποτελέσματα από μια συλλογή εγγράφων, όπου στα 5 πρώτα τα συναφή με το ερώτημα έγγραφα ήταν (με την σειρά) το 2ο, το 3ο, το 4ο και το 5ο έγγραφο. Έστω επίσης ότι σε ολόκληρη την συλλογή εγγράφων υπάρχουν 5 συναφή με το ερώτημα έγγραφα. Να υπολογίσετε την ακρίβεια με παρεμβολή στις 11 τιμές του recall (0.0, 0.1, 0.2, ..., 0.9, 1.0) για το σύστημα αυτό.

Θέμα 5ο (Άσκηση 17 από έγγραφο PDF με ασκήσεις, αριθμοί 6-19)
Σε ένα σύστημα ανάκτησης, ορισμένα κείμενα για κάποιο λόγο κρίνονται περισσότερο σχετικά από άλλα (είναι πιο έγκυρα, έχουν καλύτερη εμφάνιση, δεν περιέχουν λέξεις του... πεζοδρομίου (lol) κ.λπ.). Για να πριμοδοτήσουμε κάποια κείμενα έναντι των υπολοίπων, αρκεί να υπολογίσουμε μια εκ των προτέρων πιθανότητα σχετικότητας σε όλα τα κείμενα. Απαντήστε στις επόμενες δύο ερωτήσεις. Διαβάστε και τις δύο ερωτήσεις πριν τις απαντήσετε:
α) Θέλουμε να κατασκευάσουμε μια μηχανή αναζήτησης για μια συλλογή από blog posts, και θέλουμε να πριμοδοτήσουμε εκείνα τα posts τα οποία έχουν τα περισσότερα σχόλια. Υποτίθεται ότι όσο περισσότερα σχόλια έχει ένα post, τόσο πιο σημαντικό είναι. Χρησιμοποιώντας την πληροφορία αυτή, υπολογίστε την εκ των προτέρων πιθανότητα σχετικότητας των κειμένων (posts), P(d).
β) Τι θα συμβεί κατά την ανάκτηση αν τουλάχιστον ένα κείμενο δεν περιέχει κανένα σχόλιο; Περιγράψτε τον τρόπο υπολογισμού της σχέσης Score(q,d) = P(d|q) (HINT: Η πιθανότητα μηδενίζεται - εφαρμογή smoothing).

Spoiler: εμφάνιση/απόκρυψη
ΣΗΜΕΙΩΣΗ: Μπορεί να έχω κάνει ένα ή περισσότερα λάθη. Αν αυτό ισχύει, τότε παρακαλώ κάποιος να διορθώσει ASAP.
Special thanks to @pgetsos for the corrections so far. :-D

:-D
Last edited by Georgilakis Antonios on Thu Sep 07, 2017 1:28 pm, edited 5 times in total.
Spoiler: εμφάνιση/απόκρυψη

"Always keep a low profile. Cause when you get high, things can become strange."
"Never stop doing things you like. Never stop loving people you love. Never give up. Believe in yourself. Believe in your hidden powers."
"Honesty is an expensive gift, so don't expect it from cheap people."
The Scientist

User avatar
pgetsos
Venus Former Team Member
Posts: 1184
Joined: Sun Oct 13, 2013 1:29 am
Academic status: 4th year
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby pgetsos » Thu Sep 07, 2017 9:47 am

Το 4β ειμαι σχεδον σιγουρος οτι εχει 5 συναφη και γυρισε 10 κειμενα

ΑΝ οχι, τοτε εχω κοπει xD

To 5β λεει για να μην εχουμε πιθανοτητα 0 αν δεν υπαρχει σχολιο και Hint για το Score(q,d) = P(d|q)
Όταν μια μαύρη γάτα περάσει από μπροστά σου, σημαίνει ότι το ζώο πάει κάπου.

Μην αφήνεις τα μικρά μυαλά να σε πείσουν ότι τα όνειρα σου είναι πολύ μεγάλα.
User avatar
Georgilakis Antonios
Mbyte level
Mbyte level
Posts: 541
Joined: Mon Dec 02, 2013 11:10 pm
Academic status: Alumnus/a
Gender:
Location: Straight into your Mind

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby Georgilakis Antonios » Thu Sep 07, 2017 12:29 pm

Νομίζω τώρα είναι ΟΚ μετά τις διορθώσεις. :smt023
Και relax, δεν έχεις κοπεί.
Spoiler: εμφάνιση/απόκρυψη

"Always keep a low profile. Cause when you get high, things can become strange."
"Never stop doing things you like. Never stop loving people you love. Never give up. Believe in yourself. Believe in your hidden powers."
"Honesty is an expensive gift, so don't expect it from cheap people."
The Scientist

User avatar
pgetsos
Venus Former Team Member
Posts: 1184
Joined: Sun Oct 13, 2013 1:29 am
Academic status: 4th year
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby pgetsos » Thu Sep 07, 2017 1:13 pm

Εισαι σιγουρος για τα 20 συναφη συνολικα και οχι 5 μονο;
Όταν μια μαύρη γάτα περάσει από μπροστά σου, σημαίνει ότι το ζώο πάει κάπου.

Μην αφήνεις τα μικρά μυαλά να σε πείσουν ότι τα όνειρα σου είναι πολύ μεγάλα.
User avatar
Georgilakis Antonios
Mbyte level
Mbyte level
Posts: 541
Joined: Mon Dec 02, 2013 11:10 pm
Academic status: Alumnus/a
Gender:
Location: Straight into your Mind

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby Georgilakis Antonios » Thu Sep 07, 2017 1:28 pm

Βασικά ναι, τώρα θυμήθηκα και τις πράξεις που είχα κάνει. Σωστός. :smt023
(Αν είναι σωστές βέβαια...)
Spoiler: εμφάνιση/απόκρυψη

"Always keep a low profile. Cause when you get high, things can become strange."
"Never stop doing things you like. Never stop loving people you love. Never give up. Believe in yourself. Believe in your hidden powers."
"Honesty is an expensive gift, so don't expect it from cheap people."
The Scientist

User avatar
valeia
Kilobyte level
Kilobyte level
Posts: 216
Joined: Sat Dec 21, 2013 5:10 pm
Academic status: N>4
Gender:

Re: Συστήματα Ανάκτησης Πληροφοριών

Postby valeia » Wed Dec 06, 2017 3:49 pm

Καλησπέρα παιδιά. Στα θέματα του Σεπτέμβρη (πιο πάνω), στο ερώτημα 2 ποια πεντάδα θα μπορούσε να είναι σωστή απάντηση;

Return to “Μαθήματα Κύκλων και Κατευθύνσεων”

Who is online

Users browsing this forum: No registered users and 1 guest