Page 5 of 7

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:08 am
by Georgilakis Antonios
jennaki123 wrote:
Georgilakis Antonios wrote:Σωστό το filter για retweets, αλλά για διπλότυπα δεν νομίζω ότι έχει πει να κάνουμε αφαίρεσή τους.

By the way, εγώ έσπασα τα 2 μαζέματα (α & β μέρος) σε δύο ξεχωριστές βάσεις SQLite® 3, και έκανα το μάζεμα απευθείας εκεί.
Όταν τον είχα ρωτήσει αν η διαδικασία αυτή είναι σωστή, μου είχε πει: "ΟΚ". Τώρα τι να πω...
Αφου τα εχω σε txt, και τα περναω σε βαση τα δεδομενα, τα διπλοτυπα(εννοωντας ιδιο ID) ετσι κιαλλιως αφαιρουνται απο τη Mysql
γιατι εχω βαλει primary key το id.... Ουσιαστικα το ιδιο πραγμα κανει με το να τα αφαιρουσαμε νωριτερα νομιζω :P

EDIT: Τελικα για τα emoticons εκτος απο θετικα, αρνητικα θελει να κανουμε και πχ κατηγορια συριζα-θετικα, συριζα-αρνητικα ?
Αν εννοείς για ID, ισχύει αυτό που λες. Υπέθεσα ότι αφορούσε το text. :-D

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:12 am
by jennaki123
Georgilakis Antonios wrote:[
Αν εννοείς για ID, ισχύει αυτό που λες. Υπέθεσα ότι αφορούσε το text. :-D
Και ναι, θέλει κατηγορίες. Αναφέρεται και στην τελευταία ανακοίνωση αυτό.

Λαθος διατυπωση δικη μου ;)
Για τα emoticons και γενικα για τις κατηγοριες θελει απλα το πληθος ετσι; :P οχι xml που να τα εμφανιζουν κιολας; :P (αναφερομαι στο τελος της εργασιας)
(δεν ξερω πια τι ζητανε σε αυτη την εργασια :P )

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:14 am
by Georgilakis Antonios
jennaki123 wrote:
Georgilakis Antonios wrote: Αν εννοείς για ID, ισχύει αυτό που λες. Υπέθεσα ότι αφορούσε το text. :-D

Λαθος διατυπωση δικη μου ;)
Για τα emoticons και γενικα για τις κατηγοριες θελει απλα το πληθος ετσι; :P οχι xml που να τα εμφανιζουν κιολας; :P (αναφερομαι στο τελος της εργασιας)
(δεν ξερω πια τι ζητανε σε αυτη την εργασια :P )
Όπως τα λες. :-D

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:22 am
by jennaki123
Georgilakis Antonios wrote: Όπως τα λες. :-D
Επειδη κανω search στην sql οταν βαζω το :'( δεν μου το δεχεται... ξερεις αν υπαρχει καποιος τροπος να το προσπερασει;

Και αν πχ ενα tweet περιεχει πανω απο ενα emoticon τα μετραμε ως 1 φορα;

Source Code:
SELECT * FROM TWEETS WHERE LOWER(TweetText) LIKE LOWER('%:'(%)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:24 am
by Georgilakis Antonios
jennaki123 wrote: Επειδη κανω search στην sql οταν βαζω το :'( δεν μου το δεχεται... ξερεις αν υπαρχει καποιος τροπος να το προσπερασει;
Μήπως είναι: LOWER('%:(%') ?
jennaki123 wrote: Και αν πχ ενα tweet περιεχει πανω απο ενα emoticon τα μετραμε ως 1 φορα;
Ναι.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:25 am
by pgetsos
Θα πρέπει να το κάνεις escape το '

Επίσης σου λείπει ένα ' στο τέλος

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:27 am
by jennaki123
Georgilakis Antonios wrote: Θελω να βαλω αυτο που κλαιει :P
:΄( .

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:30 am
by Georgilakis Antonios
Βοηθάει καθόλου ? : http://apps.timwhitlock.info/emoji/tables/unicode

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:35 am
by jennaki123
Georgilakis Antonios wrote:Βοηθάει καθόλου ? : http://apps.timwhitlock.info/emoji/tables/unicode
Δεν μου βγαζει αποτελεσματα δυστυχως... δεν μπορουσα να φτιαξω τα emoji σωστα και ετσι μπορω να τσεκαρω μονο για emoticon :/
pgetsos wrote:Θα πρέπει να το κάνεις escape το '

Επίσης σου λείπει ένα ' στο τέλος
Μηπως ξερεις αν υπαρχει καποιο λινκ για escape σε select?

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:38 am
by Georgilakis Antonios

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 4:43 am
by jennaki123
Georgilakis Antonios wrote:Escape characters in MySQL®: http://stackoverflow.com/questions/8811 ... s-in-mysql
Χιλια ευχαριστωωω!!!!! :) :) :)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 12:53 pm
by Esteban
Παιδιά, τελικά XML τα θέλει η CSV; :smt017

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 3:34 pm
by Georgilakis Antonios
Esteban wrote:Παιδιά, τελικά XML τα θέλει η CSV; :smt017
Εξαρτάται από το πρόγραμμα που έχεις φτιάξει για να κάνει την καταμέτρηση.
Αν αυτό δέχεται CSV, ΟΚ. Αν πάλι αυτό δέχεται XML, πάλι OK. :-D

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 5:41 pm
by Esteban
Georgilakis Antonios wrote:
Esteban wrote:Παιδιά, τελικά XML τα θέλει η CSV; :smt017
Εξαρτάται από το πρόγραμμα που έχεις φτιάξει για να κάνει την καταμέτρηση.
Αν αυτό δέχεται CSV, ΟΚ. Αν πάλι αυτό δέχεται XML, πάλι OK. :-D
Και αν παίρνουμε το input από sqlite; Τεσπα, τους έκανα attach και xml :smt017

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Dec 01, 2016 5:44 pm
by Georgilakis Antonios
Esteban wrote:Και αν παίρνουμε το input από sqlite; Τεσπα, τους έκανα attach και xml :smt017
Σχετικά με αυτό είχα στείλει e-mail. Αν το πρόγραμμά σου παίρνει input από εκεί, ΟΚ.
Μόνο ο βοηθός θέλει να μπορεί να έχει ένα τρόπο να δει τα περιεχόμενα της βάσης.

EDIT: Το παραπάνω ισχύει για SQLite® βάσεις. Δεν ξέρω αν ο βοηθός επιτρέπει κάτι τέτοιο για άλλες τεχνολογίες.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Wed Dec 28, 2016 9:23 pm
by eleng
Καλησπέρα σε όλους και Χρόνια Πολλά! :) Θα μπορούσε κάποιος που παρακολουθούσε το μάθημα να ανεβάσει λυμένες τις ασκήσεις που έκανε φέτος; Υπάρχουν σκόρπιες σημειώσεις από διάφορα ποστ αλλά νομίζω ότι εν όψει εξεταστικής θα ήταν πολύ βοηθητικό για όλους να υπάρχουν κάπου συγκεντρωμένες όλες οι σημειώσεις του μαθήματος. Ευχαριστώ πολύ! :)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Jan 02, 2017 8:19 pm
by valeia
Καλησπέρα και Καλή χρονιά!!! Μία ερώτηση για την 2η εργασία για όποιον μπορεί να με βοηθήσει..
Τα http links και τους αριθμούς πως μπορώ να τους αφαιρέσω από το txt;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Jan 02, 2017 8:26 pm
by Georgilakis Antonios
valeia wrote:Καλησπέρα και Καλή χρονιά!!! Μία ερώτηση για την 2η εργασία για όποιον μπορεί να με βοηθήσει..
Τα http links και τους αριθμούς πως μπορώ να τους αφαιρέσω από το txt;
Regex.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Jan 02, 2017 10:06 pm
by valeia
Georgilakis Antonios wrote:
valeia wrote:Καλησπέρα και Καλή χρονιά!!! Μία ερώτηση για την 2η εργασία για όποιον μπορεί να με βοηθήσει..
Τα http links και τους αριθμούς πως μπορώ να τους αφαιρέσω από το txt;
Regex.
Thanks κάτι έκανα τελικά...κάποιο hint για τα διπλότυπα μπορείς να μου δώσεις...για το 2 ερωτημα δηλαδη;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Jan 02, 2017 10:12 pm
by Georgilakis Antonios
valeia wrote:Thanks κάτι έκανα τελικά...κάποιο hint για τα διπλότυπα μπορείς να μου δώσεις...για το 2 ερωτημα δηλαδη;
Δεν είμαι και πολύ σίγουρος, αλλά νομίζω ότι τα tweets μπορείς να τα διαχωρίσεις στην βάση με 'GROUP BY'.
Μπορεί και να μην πιάνει όμως. Αν τώρα είναι σε text file, δεν νομίζω ότι μπορείς να κάνεις και πολλά.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Jan 02, 2017 10:21 pm
by valeia
Georgilakis Antonios wrote:
valeia wrote:Thanks κάτι έκανα τελικά...κάποιο hint για τα διπλότυπα μπορείς να μου δώσεις...για το 2 ερωτημα δηλαδη;
Δεν είμαι και πολύ σίγουρος, αλλά νομίζω ότι τα tweets μπορείς να τα διαχωρίσεις στην βάση με 'GROUP BY'.
Μπορεί και να μην πιάνει όμως. Αν τώρα είναι σε text file, δεν νομίζω ότι μπορείς να κάνεις και πολλά.
ΟΚ θα το δοκιμασω! ευχαριστώ!

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Jan 03, 2017 2:07 am
by pgetsos
Μπορει καποιος να μου εξηγησει το "0";
Σε αναλυση στατιστικων αναφερεται;

Επισης, να ξανασυγκεντρωσουμε Tweets η οτι ειχαμε κανει τοτε;