Page 7 of 7

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Mar 08, 2017 10:03 pm
by ChristinaX
Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Mar 08, 2017 10:52 pm
by Georgilakis Antonios
ChristinaX wrote:Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;

Σε έμενα τουλάχιστον όχι. Ακόμα.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Mar 08, 2017 10:54 pm
by ChristinaX
Georgilakis Antonios wrote:
ChristinaX wrote:Παιδιά, έχει ανεβάσει αποτελέσματα ανάκτηση στην e gramateia σε κανέναν;

Σε έμενα τουλάχιστον όχι. Ακόμα.


OK, ευχαριστώ πολύ!

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Fri Mar 17, 2017 12:35 am
by SilverHero
Παιδιά εγώ ακόμη δεν έχω δει να έχουν περαστεί τα αποτελέσματα στην e-gramateia και έχω αρχίσει να αναρωτιέμαι αν έγινε κάνα λάθος, είμαι ο μόνος;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sun Mar 19, 2017 6:33 pm
by floydiantree
SilverHero wrote:Παιδιά εγώ ακόμη δεν έχω δει να έχουν περαστεί τα αποτελέσματα στην e-gramateia και έχω αρχίσει να αναρωτιέμαι αν έγινε κάνα λάθος, είμαι ο μόνος;


Εμένα έχουν περαστεί κανονικά.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Sep 06, 2017 4:22 am
by pgetsos
Θυμάται κανείς θέματα να τα συμπληρώσουμε; :)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Sep 06, 2017 5:20 pm
by Georgilakis Antonios
pgetsos wrote:Θυμάται κανείς θέματα να τα συμπληρώσουμε; :)

Θέματα 4/9/2017 (Όλες οι εκφωνήσεις στο περίπου)

Θέμα 1ο
Οι σημερινές μηχανές αναζήτησης στον ιστό καταγράφουν τις αναζητήσεις που πραγματοποιούν οι χρήστες ως εξής: για κάθε ερώτημα που υποβάλει ο χρήστης στην μηχανή αναζήτησης, καταγράφεται το ερώτημα και τα έγγραφα που ανακτήθηκαν και επιστράφηκαν στην σελίδα των αποτελεσμάτων. Το σύνολο των στοιχείων που καταγράφονται αναφέρεται και ως query log, και το οποίο οι μηχανές αναζήτησης χρησιμοποιούν για να βελτιώσουν την ακρίβεια επιστροφής των αποτελεσμάτων σε διάφορα ερωτήματα των χρηστών. Εξηγήστε με ποιον τρόπο θα μπορούσε μια μηχανή αναζήτησης να αξιοποιήσει αυτά τα query logs ώστε να αυξήσει την ακρίβειά της (precision), αλλά και πως αυτή η ιδέα/ο τρόπος θα μπορούσε να υλοποιηθεί.

Θέμα 2ο
Κατά την αξιολόγηση της ομοιότητας των κειμένων με διάφορα ερωτήματα, εκτός από πληροφορίες που έχουν υπολογιστικό κόστος για την εξαγωγή τους, μπορούμε να αξιοποιήσουμε και πληροφορίες που δεν έχουν κάποιο υπολογιστικό κόστος για να εξαχθούν. Να περιγράψετε 5 τέτοιες πληροφορίες που μπορούμε να εξάγουμε από τα κείμενα κατά την αξιολόγησή τους, χωρίς υπολογιστικό κόστος.

Θέμα 3ο
Στο μοντέλο του διανυσματικού χώρου αξιολογούμε την ομοιότητα μεταξύ κειμένων και ερωτημάτων, αλλά δεν εμφανίζονται πουθενά πληροφορίες σχετικά με την ομοιότητα των όρων στις οντότητες που αξιολογούνται. Να περιγράψετε έναν τρόπο με τον οποίο θα μπορούσαμε να "ενσωματώσουμε" (embed) τέτοιες πληροφορίες ομοιότητας των όρων κατά την διαδικασία της αξιολόγησης στο μοντέλο του διανυσματικού χώρου. (Γενικευμένο Μοντέλο του Διανυσματικού Χώρου)

Θέμα 4ο
α) Τα μέτρα ανάκλησης (recall) και ακρίβειας (precision) είναι δύο καλοί δείκτες για την μέτρηση της απόδοσης ενός συστήματος ανάκτησης πληροφοριών. Ωστόσο, κανένας από τους δύο δεν χρησιμοποιείται για την σύγκριση της απόδοσης δύο διαφορετικών συστημάτων ανάκτησης πληροφοριών. Να εξηγήσετε για ποιο λόγο συμβαίνει αυτό.
β) Έστω ότι ένα σύστημα ανάκτησης επέστρεψε (για ένα ερώτημα) 10 έγγραφα/αποτελέσματα από μια συλλογή εγγράφων, όπου στα 5 πρώτα τα συναφή με το ερώτημα έγγραφα ήταν (με την σειρά) το 2ο, το 3ο, το 4ο και το 5ο έγγραφο. Έστω επίσης ότι σε ολόκληρη την συλλογή εγγράφων υπάρχουν 5 συναφή με το ερώτημα έγγραφα. Να υπολογίσετε την ακρίβεια με παρεμβολή στις 11 τιμές του recall (0.0, 0.1, 0.2, ..., 0.9, 1.0) για το σύστημα αυτό.

Θέμα 5ο (Άσκηση 17 από έγγραφο PDF με ασκήσεις, αριθμοί 6-19)
Σε ένα σύστημα ανάκτησης, ορισμένα κείμενα για κάποιο λόγο κρίνονται περισσότερο σχετικά από άλλα (είναι πιο έγκυρα, έχουν καλύτερη εμφάνιση, δεν περιέχουν λέξεις του... πεζοδρομίου (lol) κ.λπ.). Για να πριμοδοτήσουμε κάποια κείμενα έναντι των υπολοίπων, αρκεί να υπολογίσουμε μια εκ των προτέρων πιθανότητα σχετικότητας σε όλα τα κείμενα. Απαντήστε στις επόμενες δύο ερωτήσεις. Διαβάστε και τις δύο ερωτήσεις πριν τις απαντήσετε:
α) Θέλουμε να κατασκευάσουμε μια μηχανή αναζήτησης για μια συλλογή από blog posts, και θέλουμε να πριμοδοτήσουμε εκείνα τα posts τα οποία έχουν τα περισσότερα σχόλια. Υποτίθεται ότι όσο περισσότερα σχόλια έχει ένα post, τόσο πιο σημαντικό είναι. Χρησιμοποιώντας την πληροφορία αυτή, υπολογίστε την εκ των προτέρων πιθανότητα σχετικότητας των κειμένων (posts), P(d).
β) Τι θα συμβεί κατά την ανάκτηση αν τουλάχιστον ένα κείμενο δεν περιέχει κανένα σχόλιο; Περιγράψτε τον τρόπο υπολογισμού της σχέσης Score(q,d) = P(d|q) (HINT: Η πιθανότητα μηδενίζεται - εφαρμογή smoothing).

Spoiler: εμφάνιση/απόκρυψη
ΣΗΜΕΙΩΣΗ: Μπορεί να έχω κάνει ένα ή περισσότερα λάθη. Αν αυτό ισχύει, τότε παρακαλώ κάποιος να διορθώσει ASAP.
Special thanks to @pgetsos for the corrections so far. :-D

:-D

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Sep 07, 2017 9:47 am
by pgetsos
Το 4β ειμαι σχεδον σιγουρος οτι εχει 5 συναφη και γυρισε 10 κειμενα

ΑΝ οχι, τοτε εχω κοπει xD

To 5β λεει για να μην εχουμε πιθανοτητα 0 αν δεν υπαρχει σχολιο και Hint για το Score(q,d) = P(d|q)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Sep 07, 2017 12:29 pm
by Georgilakis Antonios
Νομίζω τώρα είναι ΟΚ μετά τις διορθώσεις. :smt023
Και relax, δεν έχεις κοπεί.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Sep 07, 2017 1:13 pm
by pgetsos
Εισαι σιγουρος για τα 20 συναφη συνολικα και οχι 5 μονο;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Sep 07, 2017 1:28 pm
by Georgilakis Antonios
Βασικά ναι, τώρα θυμήθηκα και τις πράξεις που είχα κάνει. Σωστός. :smt023
(Αν είναι σωστές βέβαια...)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Dec 06, 2017 3:49 pm
by valeia
Καλησπέρα παιδιά. Στα θέματα του Σεπτέμβρη (πιο πάνω), στο ερώτημα 2 ποια πεντάδα θα μπορούσε να είναι σωστή απάντηση;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Aug 29, 2018 11:20 am
by nikosk
Καλημέρα! Υπάρχει κάποιος που να έχει φροντιστήρια του 2018 και μπορεί να τα ανεβάσει;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Fri Aug 31, 2018 11:39 am
by timphilby88
Παιδιά καλημέρα!Γνωρίζει κανείς αν το μάθημα μεταφέρεται σε εαρινό εξάμηνο από χειμερινο; Δεν το βλέπω στο πρόγραμμα...

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Sep 12, 2018 3:28 pm
by lisabeth
Καλησπέρα,

Ίδια ερώτηση.

Γνωρίζουμε αν μεταφέρθηκε το μαθήμα στο εαρινό εξάμηνο; Δεν μπορώ να βρώ καμία σχετική ανακοίνωση και δεν έχει βγεί οδηγός σπουδών για το 2018-2019.

Ευχαριστώ εκ των προτέρων.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Fri Sep 14, 2018 6:28 pm
by MichalisF
Ναι, μεταφέρθηκε στο εαρινό. Έστειλα μέιλ.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sun Mar 24, 2019 6:12 am
by parasleivadaros
Αξίζει να πάρουμε κάποιο από τα βιβλία που προτείνει (το πρώτο υπάρχει δωρεάν στα αγγλικά στο eclass);

  • "ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΚΤΗΣΗ ΠΛΗΡΟΦΟΡΙΩΝ" | CHRISTOPHER D. MANNING, PRABHAKAR RAGHAVAN, HINRICH SCHUTZE, 2012, ΕΚΔΟΣΕΙΣ ΚΛΕΙΔΑΡΙΘΜΟΣ ΕΠΕ
  • "Ανάκτηση Πληροφορίας, 2η Έκδοση" | Baeza-Yates Ricardo, Ribeiro-Neto Berthier, 2014, ΤΖΙΟΛΑ

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Jun 20, 2019 11:04 am
by axill
Τα θέματα του Ιουνιου 2019

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Sep 16, 2019 1:30 pm
by MichalisF
Θα μπορούσε κάποιος να δώσει λύση για το θέμα 3?