Python Tweet.filter Beispiele

Programmiersprache: Python

Namespace / Paketname: tweet

Klasse / Typ: Tweet

Methode / Funktion: filter

Beispiele auf hotexamples.com: 2

Python Tweet.filter - 2 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die tweet.Tweet.filter, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

Tweet(30)

from_html(7)

common_names(4)

filter(2)

favorite_count(2)

entities(2)

date(2)

id(2)

profileImgUrlHttp(2)

readTweet(2)

format_save(2)

toUser(2)

candidates(2)

save(2)

send_tweet(2)

attach_text(2)

userName(2)

userId(2)

replyTo(1)

fromTweetFile(1)

x(1)

from_dict(1)

fromstr(1)

getText(1)

get_replies(1)

get_favs(1)

retweeted(1)

tid(1)

get_retweets(1)

isReply(1)

loadtweet(1)

fromFile(1)

fill_from_line(1)

format_values(1)

content_lang(1)

_clear(1)

add_comment(1)

add_retweet(1)

all(1)

attach_image(1)

attachment(1)

avatar(1)

classified(1)

clean_text(1)

content(1)

coordinates(1)

findKeywords(1)

createFromUnknownSource(1)

Beispiel #1

Datei anzeigen

Datei: similarity.py Projekt: vondersam/uu-twitter-paraphrase-normaliser

def extract_jaccard_ngrams_word(tweet1, tweet2, threshold, ngram_num):
    """ Extracts all similar ngrams with jaccard distance below a threshold
        Threshold adapts to ngrams since jaccard penalises short shorter ngrams
        Extracts the longest ngrams first for more context
    """
    new_thres = threshold / (ngram_num * .1)
    result = []

    for n in reversed(range(5, ngram_num + 1)):
        tokens_a, tokens_b = tweet1.tokenize(), tweet2.tokenize()
        ngrams_a, ngrams_b = ngrams(tokens_a, n), ngrams(tokens_b, n)

        for ngram_a in ngrams_a:
            temp_list = []
            joint_a = " ".join(ngram_a)
            set_a = set(joint_a)

            for ngram_b in ngrams_b:
                joint_b = " ".join(ngram_b)
                set_b = set(joint_b)

                distance = jaccard_distance(set_a, set_b)
                temp_list.append((distance, joint_a, joint_b))

            min_score = min(temp_list, key = lambda t:t[0], default=1)

            if min_score != 1:
                if min_score[0] < new_thres and min_score[0] != 0:

                    # Sort best sentence in second
                    joint_a = Tweet(min_score[1])
                    joint_b = Tweet(min_score[2])
                    joint_a.filter("*")
                    joint_b.filter("*")

                    if joint_a.oov_words() > joint_b.oov_words():
                        bi_combination = joint_a.source_filter(), joint_b.target_filter()
                    else:
                        bi_combination = joint_b.source_filter(), joint_a.target_filter()

                    if bi_combination not in result:
                        result.append(bi_combination)

                    tweet1.strip_out(joint_a.clean_text)
                    tweet2.strip_out(joint_b.clean_text)
    return result

Beispiel #2

Datei anzeigen

Datei: test_regex.py Projekt: vondersam/uu-twitter-paraphrase-normaliser

from tweet import Tweet

s = "Aurah : “ Ves a Miriam bipolar ? ” Verdeliss : “ Las enfermedades mentales las tiene que diagnosticar un profesional , no yo , así que no ” Aurah hija , te cubres de gloria"
z = "Aurah : “ Ves a Miriam bipolar ? ” Verdeliss : “ Las enfermedades mentales las tiene que diagnosticar un profesional , no yo , …"

a = Tweet(s)
a.filter("*")

b = Tweet(z)
b.filter("*")

print(a.tweet_len())
print(b.tweet_len())
result = a.tweet_len() - b.tweet_len() < 4
print(result)