Python CategoryAverage Examples

Programming Language: Python

Namespace/Package Name: category_average

Class/Type: CategoryAverage

Examples at hotexamples.com: 2

Python CategoryAverage - 2 examples found. These are the top rated real world Python examples of category_average.CategoryAverage extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

CategoryAverage(1)

fit(1)

transform(1)

Example #1

Show file

class Pipeline:
    def __init__(self, max_features, use_scale):
        self.max_features = max_features
        self.use_scale = use_scale

    def fit(self, table):

        stemmed_text = stem(table.text)

        self.tfidf = TfidfVectorizer(stop_words='english', max_features=self.max_features)
        text_features = self.tfidf.fit_transform(stemmed_text)
        text_features = text_features.toarray()

        self.pca = PCA(150).fit(text_features)

        self.avg_user = CategoryAverage()
        self.avg_user = self.avg_user.fit(table.user_id, log(table.votes_useful + 1))

        # scale for votes
        votes = log(table.votes_useful + 1)
        if self.use_scale:
            self.scale = 1 / max(votes)
        else:
            self.scale = 1

        return self
        

    def transform(self, features):
        #stemmed_text = stem(features.text)

        #text_features = self.tfidf.transform(stemmed_text)
        #text_features = text_features.toarray()

        #text_features_pca = self.pca.transform(text_features)

        avg_user = self.avg_user.transform(features.user_id)

        #return hstack((text_features_pca, avg_user))
        return avg_user


    def transform_targets(self, table):
        votes = log(table.votes_useful + 1)
        return votes


    def transform_predictions(self, predictions):
        return exp(predictions) - 1

Example #2

Show file

    def fit(self, table):

        stemmed_text = stem(table.text)

        self.tfidf = TfidfVectorizer(stop_words='english', max_features=self.max_features)
        text_features = self.tfidf.fit_transform(stemmed_text)
        text_features = text_features.toarray()

        self.pca = PCA(150).fit(text_features)

        self.avg_user = CategoryAverage()
        self.avg_user = self.avg_user.fit(table.user_id, log(table.votes_useful + 1))

        # scale for votes
        votes = log(table.votes_useful + 1)
        if self.use_scale:
            self.scale = 1 / max(votes)
        else:
            self.scale = 1

        return self