Βάσεις - Τελική Εξέταση
Για TF IDF:Το boolean που λεει είναι διάνυσμα με άσσους όπου υπάρχει η λέξη και μηδεν όπου δεν υπάρχει. Γραφετε και τους τρεις τίτλους έτσι και εφαρμόζεται εσωτερικό γινόμενο ή cosine για κειμενο1-κειμενο3 και κειμενο2-κειμενο3 . τώρα για TF IDT πρέπει να υπολογίσετε για κάθε όρο σε κάθε τίτλο το TF IDF με έναν από τους τύπους του Τσατσαρώνη και θα φτιάξετε μια μορφή D1=a1T1+a2T2... etc για κάθε κείμενο (όπου α1 το TF IDF για τον όρο 1 στο κείμενο 1) . Τέλος το ερώτημα θα είναι το διάνυσμα του κειμένου 3, επομένως θα πρέπει να υπολογίσετε εσωτερικό γινόμενο και cosine για κειμενο1-κειμενο3 και κειμενο2-κειμενο3. Μη με ρωτήσετε τι βγαίνει...Καλή τύχη!!!
Παιδιά, κατ'αρχάς συγγνώμη για τη μειωμένη συμμετοχή.
εδώ και 1 ώρα κάνω δοκιμες στο MATLAB,
για να βρώ στο LSI μεταξύ ποιών 2 διανυσμάτων παίρνει στις διαφάνειες το cos(). Και η απάντηση δεν είναι αυτή που περίμενα. Παίρνει το μετασχηματισμένο qn όπως φαίνεται στη σελίδα 43, με το c1 c2 .... ktl Μετασχηματισμένα και αυτά, ως εξής: C1=c1*Uk, δηλαδή αφου βρεθεί ο πίνακας Α, και μετασχηματίσουμε την ερώτηση, μετασχηματίζουμε ΚΑΙ το C1 κτλ πολλαπλασιάζοντας το με το U!Αυτό δεν ξέρω αν είναι σωστό, αλλά μόνο έτσι βγαίνουν οι συντεταγμένες των κειμένων όπως φαίνονται στο διαγραμμα της σελίδας 44, και μόνο έτσι βγαίνει τελικά το πινακάκι της τελευταίας σελίδας (Το έλεγξα για όλα τα C).
Υ.Γ. Μιλάω για τις διαφάνειες PCA-LSI του προπτυχιακού, που έχει παράδειγμα στο τέλος
εδώ και 1 ώρα κάνω δοκιμες στο MATLAB,
για να βρώ στο LSI μεταξύ ποιών 2 διανυσμάτων παίρνει στις διαφάνειες το cos(). Και η απάντηση δεν είναι αυτή που περίμενα. Παίρνει το μετασχηματισμένο qn όπως φαίνεται στη σελίδα 43, με το c1 c2 .... ktl Μετασχηματισμένα και αυτά, ως εξής: C1=c1*Uk, δηλαδή αφου βρεθεί ο πίνακας Α, και μετασχηματίσουμε την ερώτηση, μετασχηματίζουμε ΚΑΙ το C1 κτλ πολλαπλασιάζοντας το με το U!Αυτό δεν ξέρω αν είναι σωστό, αλλά μόνο έτσι βγαίνουν οι συντεταγμένες των κειμένων όπως φαίνονται στο διαγραμμα της σελίδας 44, και μόνο έτσι βγαίνει τελικά το πινακάκι της τελευταίας σελίδας (Το έλεγξα για όλα τα C).
Υ.Γ. Μιλάω για τις διαφάνειες PCA-LSI του προπτυχιακού, που έχει παράδειγμα στο τέλος
Χρησιμοποιώ κάποια δόση υπερβολής...