Python TextBlob.count Exemples

Langage de programmation: Python

Espace de nommage/Pack: textblob

Class/Type: TextBlob

Méthode/Fonction: count

Exemples au hotexamples.com: 2

Python TextBlob.count - 2 exemples trouvés. Ce sont les exemples réels les mieux notés de textblob.TextBlob.count extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

TextBlob(30)

correct(30)

ngrams(30)

translate(30)

detect_language(30)

lower(30)

classify(30)

split(27)

parse(20)

replace(18)

tokenize(16)

upper(11)

find(10)

strip(5)

lemmatize(5)

append(4)

startswith(4)

singularize(3)

pluralize(3)

draw(3)

__str__(3)

word_counts(2)

remove(2)

sentiment(2)

count(2)

noun_phrases(1)

tags(1)

update(1)

correction(1)

to_json(1)

title(1)

strftime(1)

subjectivity(1)

decode(1)

keys(1)

encode(1)

spellcheck(1)

get(1)

index(1)

pos_tags(1)

__init__(1)

words(1)

Méthodes fréquemment utilisées

TextBlob (30)

correct (30)

ngrams (30)

translate (30)

detect_language (30)

lower (30)

classify (30)

split (27)

parse (20)

replace (18)

Méthodes fréquemment utilisées

tokenize (16)

upper (11)

find (10)

strip (5)

lemmatize (5)

append (4)

startswith (4)

singularize (3)

pluralize (3)

draw (3)

__str__ (3)

word_counts (2)

remove (2)

sentiment (2)

count (2)

noun_phrases (1)

tags (1)

update (1)

correction (1)

to_json (1)

Méthodes fréquemment utilisées

__str__ (3)

word_counts (2)

remove (2)

sentiment (2)

count (2)

noun_phrases (1)

tags (1)

update (1)

correction (1)

to_json (1)

title (1)

strftime (1)

subjectivity (1)

decode (1)

keys (1)

encode (1)

spellcheck (1)

get (1)

index (1)

pos_tags (1)

__init__ (1)

words (1)

Méthodes fréquemment utilisées

title (1)

strftime (1)

subjectivity (1)

decode (1)

keys (1)

encode (1)

spellcheck (1)

get (1)

index (1)

pos_tags (1)

__init__ (1)

words (1)

Exemple #1

0

Afficher le fichier

Fichier : ThirdProblem.py Projet : sokratisathancsd/csdauth_InformationRetrieval

def createQueriesDictionary(Data): InvertedIndex, Queries = dm.readInvertedIndex(), {} N = 537933 # Total Number of Queries for data in Data: for i in range(1, 3): qid, query = data[i], [data[i+2]] if qid not in Queries: Queries.update({qid:query}) for qid in Queries: Words = TextBlob(Queries[qid][0]).lower().words # Dictionary word -> frequency Hashes, Weights = [], [] try: maxf = max(Words.count(w) for w in Words) # Max Frequency of a term in the query except: continue # Corrupted Data for w in Words: Hashes.append(hashFunction(w, 64)) f, n = Words.count(w)/maxf, len(InvertedIndex[w]) # f(t), n(t) idf = math.log(N/n)/math.log(N) # IDF(t) Weights.append(f*idf) queryHash = HashQuery(Hashes, Weights) Queries[qid].append(queryHash) with open('Queries.txt', 'wb') as file: pickle.dump(Queries, file)

Exemple #2

0

Afficher le fichier

def tweet_processor(path, part, freq=1): myFile = pd.read_csv(path, sep=',') tweets = myFile["text"] if "May" in path: part = 1 # if "May" not in path: tweets = tweets[int(len(tweets)*(part-1)*0.5):int(len(tweets)*part*0.5)] blob = " ".join(myFile["text"]).split(" ") processed_tweets = [] compound_sent = [] print("n tweets: ",len(tweets)) sid = SentimentIntensityAnalyzer() for tweet in tweets: cleaned_tweet = p.clean(tweet.lower()) filtered_tweet= clean_tweets(cleaned_tweet) ss = sid.polarity_scores(filtered_tweet) cur_sent = [ss['neg'],ss['pos'], ss['neu'], ss['compound']] blob = TextBlob(filtered_tweet) Sentiment = blob.sentiment polarity = Sentiment.polarity subjectivity = Sentiment.subjectivity if filtered_tweet != "" and len(filtered_tweet) >2: processed_tweets.append(filtered_tweet) compound_sent.append(cur_sent) # np.savetxt("processed_tweets.csv", processed_tweets, delimiter=",", fmt='%s') compound_sent = np.asarray(compound_sent) freqs = [] print("number of words: ",len((" ".join(processed_tweets).split(" ")))) print("unique words: ",len(set(" ".join(processed_tweets).split(" ")))) if freq ==0: #Use blob counting words = set(blob.split(" ")) for word in set(blob.split(" ")): if word != "" and len(word)>2: freqs.append([word,blob.count(word)]) freqs = np.asarray(freqs) freqs = freqs[np.argsort(freqs[:, 1])][::-1] if freq ==1: #Use NLTK freqdist freqs = pfreq_dist(" ".join(processed_tweets).split(" ")) freqs = np.asarray(freqs) return processed_tweets, freqs, compound_sent