Esempi in Python per Filter.check_duplicates

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: Filter

Classe/tipologia: Filter

Metodo/funzione: check_duplicates

Esempi su hotexamples.com: 2

Filter.check_duplicates in Python: 2 esempi trovati. Questi sono i migliori esempi reali in Python per Filter.Filter.check_duplicates, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

Filter(30)

filter(7)

getFilterValue(4)

genFilter(3)

write(3)

apply(3)

recvMeasurement(2)

estimate(2)

process(2)

exec(2)

close(2)

check_duplicates(2)

dataProcess(2)

update(2)

__init__(2)

initialize(2)

Predict(2)

strip(2)

poles(1)

AverageFilter(1)

plot(1)

parsePacket(1)

params(1)

overViewCleanedData(1)

om_old(1)

movingAvg(1)

maxMin(1)

preprocess_params(1)

reset(1)

preprocessing(1)

propagate_covariance(1)

propagate_states(1)

is_valid_condition(1)

run(1)

runFIR(1)

set_covariance(1)

set_states(1)

sobelFilter(1)

sobel_filter(1)

sql(1)

stdDev(1)

work(1)

laPlaceFilter(1)

get_categories(1)

interpolation(1)

dt(1)

Processing(1)

Retrodict(1)

acc_old(1)

check(1)

Esempio n. 1

Mostra file

File: createSample.py Progetto: kearnsw/Twitt.IR

for document in cursor:
    text = ' '.join(document["text"].encode("utf-8").split())
    corpus.append(text)
    ids.append(document["_id"])

# filter repeated tweets
t0 = time()
i = 0
status = -1
unique_tweets = ["Dummy Tweet"]
length = len(corpus)

print("Filtering tweets may take a few minutes...")
for document in corpus:
    for tweet in unique_tweets:
        status = tweet_filter.check_duplicates(document, tweet)
        if status:
            break
    if not status:
        unique_tweets.append(document)
    i += 1
    if i > 3000:
        break

print("done in %0.3fs." % (time() - t0))
unique_tweets.pop(0)
corpus = unique_tweets
# create sample by bootstrap sampling
random_indices = random.sample(range(0, len(corpus)), q.num_of_docs)

# Open file I/O streams

Esempio n. 2

Mostra file

File: dump.py Progetto: kearnsw/Twitt.IR

# Open file I/O streams
directory = os.path.dirname(os.getcwd())
fn = "sample_" + str(months[month]) + "_" + str(day) + ".json"
f = open(directory + "/data/" + fn, "w+")

# load tweet with id
corpus = [{"text": "dummy"}]
tweetFilter = Filter(45)
i = 0
print("Filtering Results...")
for document in cursor:
    document["_id"] = str(document["_id"])
    document["text"] = document["text"].replace('"', "'")
    for tweet in corpus:
        # If return a match then append to unique tweets
        status = tweetFilter.check_duplicates(document["text"], tweet["text"])
        if status:
            break
    if not status:
        corpus.append(document["text"])
        i += 1
    if i >= 100:
        break
    print(i)


# Remove header
corpus.pop(0)
json.dump(corpus, f, indent=1)