Esempi in Python per TfidfVectorizer.count

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: sklearn.feature_extraction.text

Classe/tipologia: TfidfVectorizer

Metodo/funzione: count

Esempi su hotexamples.com: 1

TfidfVectorizer.count in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per sklearn.feature_extraction.text.TfidfVectorizer.count, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

fit(30)

get_stop_words(30)

TfidfVectorizer(30)

fit_transform(30)

get_feature_names(30)

inverse_transform(30)

build_analyzer(30)

build_tokenizer(29)

get_params(29)

get_feature_names_out(14)

__init__(12)

idf_(11)

build_preprocessor(8)

max_features(8)

_validate_vocabulary(3)

max_df(3)

fir(2)

N_(2)

fit_on_texts(2)

build_vocab(2)

decode(2)

_tfidf(2)

decode_error(1)

append(1)

_document_frequency(1)

_get_param_names(1)

kneighbors(1)

join(1)

_stop_words_id(1)

inv_vocabulary_(1)

input(1)

infer_vector(1)

idx_target_cache(1)

get_word_net_feature_vecs(1)

bert(1)

get_shape(1)

encode(1)

get_feautre_names(1)

cate_set(1)

get_feature_name(1)

fit_transfrorm(1)

fit_transfrom(1)

count(1)

fit_trainsform(1)

count_args(1)

count_chunks(1)

encoding(1)

mean(1)

Esempio n. 1

Mostra file

File: kaggle.py Progetto: SebastianElvis/ElvisProjs

data = pd.read_csv('../dataset/combined/Combined_News_DJIA.csv')

train = data[data['Date'] < '2015-01-01']
test = data[data['Date'] > '2014-12-31']

example = train.iloc[3, 10]
print 'EXAMPLE 1 -- ', example

example2 = example.lower()
print'EXAMPLE 2 -- ', example2

example3 = TfidfVectorizer().build_tokenizer()(example2)
print 'EXAMPLE 3 -- ', example3

pd.DataFrame([[x,example3.count(x)] for x in set(example3)], columns = ['Word', 'Count'])

trainheadlines = []
for row in range(0,len(train.index)):
    trainheadlines.append(' '.join(str(x) for x in train.iloc[row,2:27]))
    
basicvectorizer = TfidfVectorizer()
# 将trainheadlines转换为稀疏矩阵，表示每日的新闻里每个词出现的次数
basictrain = basicvectorizer.fit_transform(trainheadlines)
# basictrain is a sparse matrix
# (x,y),x组数据，y组特征
print 'The shape of the sparce matrix -- ',basictrain.shape

basicmodel = LogisticRegression() # 逻辑回归分类器
basicmodel = basicmodel.fit(basictrain, train["Label"])  # 输入数据，分类目标，开始训练