Python DataManager.select_tweets 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: db

클래스/타입: DataManager

메소드/함수: select_tweets

hotexamples.com에서의 예제들: 2

Python DataManager.select_tweets - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 db.DataManager.select_tweets에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

select_wikipedia_train(3)

select_tweets(2)

DataManager(1)

get_ciid_projects(1)

get_project_source(1)

redis(1)

예제 #1

파일 보기

파일: wiki-train.py 프로젝트: willpots/thesis

from classifiers import Classifier

from db import DataManager

N_TIMES = 1

for i in range(0,N_TIMES):
  print i+1, "times"
  DATABASE = "us_twitter.db"

  split = 0.8

  db_mgr = DataManager(DATABASE)

  train_tweets, train_labels = db_mgr.select_wikipedia_train()
  test_tweets, test_labels, dummy1, dummy2 = db_mgr.select_tweets(limit=10, state_fips=True, table="us_tweets", label=state_fips)

  results = get("results.json")

  vectorizer = get_vectorizer("tfidf", min_df=1)

  classifiers = {
    "BernoulliNB": Classifier(classifier="bnb"),
    "MultinomialNB": Classifier(classifier="nb"),
    "KNN-1000": Classifier(classifier="knn", k=1000),
    "KNN-2000": Classifier(classifier="knn", k=2000),
    # "SVC": Classifier(classifier="svm", params={"C" : 1.0,"kernel" : 'linear','verbose':True})
    "SVC": Classifier(load="classifier-SVC")
  }

  # Vectorizing Training Data

예제 #2

파일 보기

파일: run_examples.py 프로젝트: willpots/thesis

          # ["tweets", "preprocess", "grid_5_label",grid_5_degree,True],
          # ["tweets", "preprocess", "grid_10_label",grid_10_degree,True]
         ]
for p in range(0,len(params)):
  print params[p]
  TRAINING, PREPROCESSING, LABEL_FUNC, label_func, preprocess = params[p]
  for i in range(0,N_TIMES):
    print i+1, "times"
    DATABASE = "us_twitter.db"

    split = 0.8

    db_mgr = DataManager(DATABASE)

    if TRAINING == "tweets":
      train_tweets, train_labels, test_tweets, test_labels = db_mgr.select_tweets(limit=SIZE, preprocess=preprocess, table="us_tweets", split=0.8, label=label_func)
    else:
      train_tweets, train_labels = db_mgr.select_wikipedia_train()
      test_tweets, test_labels, dummy1, dummy2 = db_mgr.select_tweets(limit=(SIZE * 0.2), state_fips=True, table="us_tweets", label=label_func)
    # print "Train Size:", len(train_tweets)
    # print "Test Size:", len(test_tweets)


    vectorizer = get_vectorizer(VECTORIZER, min_df=1)

    classifiers = {
      "BernoulliNB": Classifier(classifier="bnb"),
      "MultinomialNB": Classifier(classifier="nb"),
      # "KNN-50": Classifier(classifier="knn", k=50),
      # "KNN-100": Classifier(classifier="knn", k=100),
      # "KNN-1000": Classifier(classifier="knn", k=1000),