Ejemplos de Statskeywords_cor en Python

Lenguaje de programación: Python

Namespace/Package Name: toolkits.nlp.myclass_cor

Método / Función: Statskeywords_cor

Ejemplos en hotexamples.com: 2

Python Statskeywords_cor - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de toolkits.nlp.myclass_cor.Statskeywords_cor extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

def get_feature_cor_clic(title_content, label):
    '''
	中国人寿：相关模型特征

	title_content： [title1 + content1, title2 + content2, ......]
		shape: (n_samples, 1)
	'''
    pipeline = Pipeline([
        ('features',
         FeatureUnion([
             ('tf_idf',
              Pipeline([('counts', CountVectorizer(max_df=0.95, min_df=2)),
                        ('tf_idf', TfidfTransformer()),
                        ('chi', SelectKBest(chi2, k=20000))])),
             ('len_stats', myclass_cor.StatsFeatures_cor_circ()),
             ('tf', myclass_cor.Statskeywords_cor(topk=5000, types='clic')),
             ('clic_tf', myclass_cor.StatsFeatures_tf_clic()),
         ])), ('standard', StandardScaler(with_mean=False))
    ])

    feature_pipeline = pipeline.fit(title_content, label)
    X_features = feature_pipeline.transform(title_content)
    print('X_features: ', X_features.shape)

    return feature_pipeline, X_features, label

Ejemplo n.º 2

Mostrar archivo

def get_feature_cor_title_circ(title_or_content, label):
    '''
	保监会：相关模型特征，标题和正文分开作为特征

	title_or_content [[title1, content1], [title2, content2], ......]
		shape: (n_samples, 2)
	'''
    step1_1 = Pipeline([('title_sel', DataFrameSelector([0])),
                        ('title_features',
                         myclass_cor.StatsFeatures_cor_circ())])
    step1_2 = Pipeline([
        ('content_sel', DataFrameSelector([1])),
        ('content_features',
         FeatureUnion([
             ('tf_idf',
              Pipeline([('counts', CountVectorizer(max_df=0.95, min_df=2)),
                        ('tf_idf', TfidfTransformer()),
                        ('chi', SelectKBest(chi2, k=20000))])),
             ('len_stats', myclass_cor.StatsFeatures_cor_circ()),
             ('tf', myclass_cor.Statskeywords_cor(topk=5000, types='circ'))
         ]))
    ])

    pipeline = Pipeline([('cal_features',
                          FeatureUnion(transformer_list=[
                              ("title_fea", step1_1),
                              ("content_fea", step1_2),
                          ])), ('standard', StandardScaler(with_mean=False))])

    feature_pipeline = pipeline.fit(title_or_content, label)
    X_features = feature_pipeline.transform(title_or_content)
    print('X_features: ', X_features.shape)

    return feature_pipeline, X_features, label