Python RFTextModel Examples

Programming Language: Python

Namespace/Package Name: wikiclass.models

Class/Type: RFTextModel

Examples at hotexamples.com: 4

Python RFTextModel - 4 examples found. These are the top rated real world Python examples of wikiclass.models.RFTextModel extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

from_file(1)

train(1)

Example #1

Show file

File: train_model.py Project: ghosthamlet/wikiclass

import pickle
import sys; sys.path.insert(0, ".")
import csv; csv.field_size_limit(sys.maxsize)

from wikiclass import assessments, languages
from wikiclass.models import RFTextModel
from wikiclass.features import WikitextAndInfonoise

# Train and test set ("<assessment class>", "text content")
input_file = open("datasets/assessed_revisions.with_text.tsv")
train_set = []
test_set = []
for row in csv.DictReader(input_file, delimiter="\t"):
    if row['class'] == "A": continue
    if row['is_test'] == "FALSE":
        train_set.append((row['text'], row['class']))
    else:
        test_set.append((row['text'], row['class']))

model = RFTextModel.train(
    train_set,
    assessments=assessments.WP10,
    feature_extractor=WikitextAndInfonoise(languages.get('English'))
)

model.to_file(open("enwiki.rf_text.model", "wb"))

Example #2

Show file

File: test_model.py Project: refeed/wikiclass

import pickle
import sys
sys.path.insert(0, ".")
import csv
csv.field_size_limit(sys.maxsize)

from wikiclass import assessments, languages
from wikiclass.models import RFTextModel
from wikiclass.features import WikitextAndInfonoise

# Train and test set ("<assessment class>", "text content")
input_file = open("datasets/assessed_revisions.with_text.tsv")
train_set = []
test_set = []
for row in csv.DictReader(input_file, delimiter="\t"):
    if row['class'] == "A": continue
    if row['is_test'] == "TRUE":
        test_set.append((row['text'], row['class']))

model = RFTextModel.from_file(open("enwiki.rf_text.model", "rb"))

results = model.test(test_set)

print(results)

Example #3

Show file

File: classify_text.py Project: ghosthamlet/wikiclass

import pickle
import sys;sys.path.insert(0, ".")
from pprint import pprint

from wikiclass.models import RFTextModel

model = RFTextModel.from_file(open("enwiki.rf_text.model", "rb"))

# Classifies a revision of an article based on wikitext alone
text = "An '''anachronism''' {{cite }}(from the [[Ancient Greek|Greek]] <ref ..."
assessment, probs = model.classify(text)

# Print predicted assessment class and probabilities for all classes.
pprint(("assessment", assessment))
pprint(("probs", probs))

Example #4

Show file

File: train_model.py Project: refeed/wikiclass

import pickle
import sys
sys.path.insert(0, ".")
import csv
csv.field_size_limit(sys.maxsize)

from wikiclass import assessments, languages
from wikiclass.models import RFTextModel
from wikiclass.features import WikitextAndInfonoise

# Train and test set ("<assessment class>", "text content")
input_file = open("datasets/assessed_revisions.with_text.tsv")
train_set = []
test_set = []
for row in csv.DictReader(input_file, delimiter="\t"):
    if row['class'] == "A": continue
    if row['is_test'] == "FALSE":
        train_set.append((row['text'], row['class']))
    else:
        test_set.append((row['text'], row['class']))

model = RFTextModel.train(train_set,
                          assessments=assessments.WP10,
                          feature_extractor=WikitextAndInfonoise(
                              languages.get('English')))

model.to_file(open("enwiki.rf_text.model", "wb"))