Page 3 of 7

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 07, 2016 1:37 pm
by pgetsos
Loop

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 07, 2016 2:55 pm
by valeia
Μια ερώτηση ...στον πίνακα μου που θέλω να βάλω το text του τουίτ τι τύπου να βάλω την στήλη μου στη mysql;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 07, 2016 3:50 pm
by Code Monkey
Εγώ έχω βάλει varchar(250)

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 07, 2016 5:52 pm
by pgetsos
Στην αλλαγή σε utf8mb4 varchar(191), δε θυμάμαι τον λόγο

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 07, 2016 11:51 pm
by valeia
Περνάω τα δεδομένα του text στην βάση μου, αλλά μάλλον όποτε το κείμενο περιέχει τον χαρακτήρα --> ' <--- μου πετάει exception
αντιμετώπισε κανείς αυτό το θέμα;έχει κανείς καμιά ιδέα;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Nov 08, 2016 12:47 am
by Georgilakis Antonios
valeia wrote:Περνάω τα δεδομένα του text στην βάση μου, αλλά μάλλον όποτε το κείμενο περιέχει τον χαρακτήρα --> ' <--- μου πετάει exception
αντιμετώπισε κανείς αυτό το θέμα;έχει κανείς καμιά ιδέα;
Πρέπει να κάνεις escape αυτόν τον χαρακτήρα πριν περάσεις το κείμενο στην βάση.

Αυτά τα links μπορεί να φανούν χρήσιμα: (και ίσως περισσότερο το πρώτο)
http://stackoverflow.com/questions/1519 ... -from-java
http://stackoverflow.com/questions/9596 ... e-in-mysql
http://stackoverflow.com/questions/8870 ... s-in-mysql

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Nov 08, 2016 1:20 am
by valeia
Georgilakis Antonios wrote:
valeia wrote:Περνάω τα δεδομένα του text στην βάση μου, αλλά μάλλον όποτε το κείμενο περιέχει τον χαρακτήρα --> ' <--- μου πετάει exception
αντιμετώπισε κανείς αυτό το θέμα;έχει κανείς καμιά ιδέα;
Πρέπει να κάνεις escape αυτόν τον χαρακτήρα πριν περάσεις το κείμενο στην βάση.

Αυτά τα links μπορεί να φανούν χρήσιμα: (και ίσως περισσότερο το πρώτο)
http://stackoverflow.com/questions/1519 ... -from-java
http://stackoverflow.com/questions/9596 ... e-in-mysql
http://stackoverflow.com/questions/8870 ... s-in-mysql
Έγινε, σε ευχαριστώ θα τα κοιτάξω!

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Nov 08, 2016 1:23 am
by pgetsos
Γενικά να τα περνάς με prepared statement που είναι πολύ πιο γρήγορο σε εκτέλεση σε batches και με αυτόματο escaping (Δεν είδα τα λινκ αν το αναφέρουν :) )

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Nov 08, 2016 1:45 am
by Georgilakis Antonios
1ο link, πρώτη απάντηση στο StackOverflow. :-D

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Tue Nov 08, 2016 5:26 pm
by Code Monkey
Ποσα tweets περίπου σας επιστρέφει για το α ερώτημα ρε παιδια;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Thu Nov 10, 2016 7:37 am
by pgetsos
~70 ND, 400 SYRIZA

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 1:38 am
by valeia
Μια ερώτηση παιδιά, που χρησιμοποιώ mysql βάση...προσπάθησα να κάνω insert τις τιμές που ηθελα where not exists(select id from table ) αλλά δεν εκτελείται αυτό...καμιά ιδέα πως να αποφύγω τα διπλότυπα?

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 1:40 am
by Georgilakis Antonios
valeia wrote:Μια ερώτηση παιδιά, που χρησιμοποιώ mysql βάση...προσπάθησα να κάνω insert τις τιμές που ηθελα where not exists(select id from table ) αλλά δεν εκτελείται αυτό...καμιά ιδέα πως να αποφύγω τα διπλότυπα?
Κάνε primary key το ID του tweet:

Code: Select all

-- [Inside table ...]

id	BIGINT	NOT NULL		-- ID's are large numbers.

-- [...]

CONSTRAINT PK_id
	PRIMARY KEY (id)

-- [...]
Αν δεν κάνω λάθος, το JDBC API θα ρίξει exception αν εισάγεις δεύτερο tweet με το ίδιο ID.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 1:13 pm
by valeia
Georgilakis Antonios wrote:
valeia wrote:Μια ερώτηση παιδιά, που χρησιμοποιώ mysql βάση...προσπάθησα να κάνω insert τις τιμές που ηθελα where not exists(select id from table ) αλλά δεν εκτελείται αυτό...καμιά ιδέα πως να αποφύγω τα διπλότυπα?
Κάνε primary key το ID του tweet:

Code: Select all

-- [Inside table ...]

id	BIGINT	NOT NULL		-- ID's are large numbers.

-- [...]

CONSTRAINT PK_id
	PRIMARY KEY (id)

-- [...]
Αν δεν κάνω λάθος, το JDBC API θα ρίξει exception αν εισάγεις δεύτερο tweet με το ίδιο ID.
Το σκεφτηκα αυτό, αλλά αν πετάξει exception θα συνεχίζει να βάζει τα υπόλοιπα;

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 1:23 pm
by Code Monkey
Μπορείς να κάνεις INSERT IGNORE για να αγνοεί τα error και να συνεχίζει στα υπόλοιπα

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 4:29 pm
by valeia
Code Monkey wrote:Μπορείς να κάνεις INSERT IGNORE για να αγνοεί τα error και να συνεχίζει στα υπόλοιπα
Όντως δουλεύει ευχαριστώ πολύ!

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 5:59 pm
by jennaki123
Καλησπερα παιδια! :)
Για την εργασια αποφασισα να χρησιμοποιησω το rest api και ειμαι στην πρωτη φαση της συλλογης δεδομενων. Για να μαζεψουμε δεδομενα
σε διαστημα μιας εβδομαδας θα πρεπει να χρησιμοποιησουμε date απο μια ημερομηνια σε καποια αλλη?

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 6:10 pm
by Georgilakis Antonios
valeia wrote:
Code Monkey wrote:Μπορείς να κάνεις INSERT IGNORE για να αγνοεί τα error και να συνεχίζει στα υπόλοιπα
Όντως δουλεύει ευχαριστώ πολύ!
Εναλλακτικά θα μπορούσες να κάνεις πρώτα:

Code: Select all

SELECT COUNT(id) FROM table WHERE id = 247482389938	-- Π.χ.
για να δεις αν το tweet υπάρχει στην βάση και αν όχι, μπορείς να κάνεις insert.

Έτσι δεν θα χάσεις και άλλα, ενδεχομένως, errors που μπορεί να ρίξει το DBMS ως server κατά το insert, όπως αν έκανες ignore errors.
jennaki123 wrote:Καλησπερα παιδια! :)
Για την εργασια αποφασισα να χρησιμοποιησω το rest api και ειμαι στην πρωτη φαση της συλλογης δεδομενων. Για να μαζεψουμε δεδομενα
σε διαστημα μιας εβδομαδας θα πρεπει να χρησιμοποιησουμε date απο μια ημερομηνια σε καποια αλλη?
Απλά ξεκίνα μια συγκεκριμένη μέρα να μαζεύεις tweets, και διέκοψε την διαδικασία μια εβδομάδα μετά.
Αυτό έχω καταλάβει εγώ τουλάχιστον.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 7:05 pm
by pgetsos
Εγώ νομίζω έβαλα on duplicate update id η κάτι παρόμοιο

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 7:36 pm
by jennaki123
Georgilakis Antonios wrote: Απλά ξεκίνα μια συγκεκριμένη μέρα να μαζεύεις tweets, και διέκοψε την διαδικασία μια εβδομάδα μετά.
Αυτό έχω καταλάβει εγώ τουλάχιστον.
Μηπως εχεις βρει καποιο λινκ σχετικο; γιατι δεν εχω καταλαβει ακριβως πως γινεται..

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Sat Nov 12, 2016 8:34 pm
by Georgilakis Antonios
jennaki123 wrote:
Georgilakis Antonios wrote: Απλά ξεκίνα μια συγκεκριμένη μέρα να μαζεύεις tweets, και διέκοψε την διαδικασία μια εβδομάδα μετά.
Αυτό έχω καταλάβει εγώ τουλάχιστον.
Μηπως εχεις βρει καποιο λινκ σχετικο; γιατι δεν εχω καταλαβει ακριβως πως γινεται..
Δες τις παραμέτρους σε αυτή την σελίδα:
https://dev.twitter.com/rest/reference/ ... rch/tweets

Twitter API for JAVA: http://twitter4j.org/en/index.html
Twitter API for Python: https://github.com/bear/python-twitter
Twitter API for PHP: https://github.com/abraham/twitteroauth

Ξεκινάς το search απλά με τις απαραίτητες παραμέτρους, χωρίς ημερομηνία, και επαναλαμβάνεις για μια εβδομάδα το ίδιο, με το ίδιο keyword.

EDIT: Προσοχή στην χρήση του keyword, ο καθηγητής επιθυμεί αφαίρεση των retweets.

Re: Συστήματα Ανάκτησης Πληροφοριών

Posted: Mon Nov 14, 2016 9:17 pm
by valeia
Καλησπέρα παιδιά, έχω ένα θεματάκι με την εκφώνηση(πολλά αλλά anyway)...δεν καταλαβαίνω ...πρέπει να μαζέψουμε τα ποστς που αφορούν συριζα και νεα δημοκρατια; να δοκιμασουμε πολλα hashtags για καθε κομμα; και να μην υπάρχουν και τα 2 κομματα μαζι? Βοηθήστε πλιζ γιατί :smt013 :smt021