Ejemplos de DataSet.FromAny en Python

Lenguaje de programación: Python

Namespace/Package Name: data.DataSet

Clase / Tipo: DataSet

Método / Función: FromAny

Ejemplos en hotexamples.com: 2

Python DataSet.FromAny - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de data.DataSet.DataSet.FromAny extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

DataSet(7)

apply(5)

addItem(3)

FromAny(2)

expand_many(2)

onehot_encode_labels(2)

FromJSON(1)

copy(1)

expand(1)

get_recorded_operations(1)

load(1)

Ejemplo n.º 1

Mostrar archivo

Archivo: PGMNaiveBayes.py Proyecto: ddomen/FAINaiveBayesOpinionClassifier

    def fit(self,
            text: Union[str, Iterable[str], Iterable[Data], pd.DataFrame],
            category: Union[str, Iterable[str]] = None) -> TextClassifier:
        '''learn probabilities for tokens extracted by the given text'''
        data = DataSet.FromAny(text, category)

        categories = []
        tokens = {}
        values = []

        for d in data:
            categories.append((d.category, d.score))
            for token in d.tokens:
                tokens[token] = 1
            values.append((d.table, d.score))
            self.total_documents += 1

        tokens = list(tokens)
        self.__add_category(categories)
        self.__add_token(tokens)

        data_values = [[1 if t in v[0] else 0 for t in tokens] + [v[1]]
                       for v in values]

        tokens.append(Data.CATEGORY_NAME)

        data_values = pd.DataFrame(data_values, columns=tokens)

        self.model.fit(data_values, Data.CATEGORY_NAME)

        return self

Ejemplo n.º 2

Mostrar archivo

Archivo: NaiveBayes.py Proyecto: ddomen/FAINaiveBayesOpinionClassifier

    def fit(self, text: Union[str, Iterable[str], Iterable[Data], pd.DataFrame], category: Union[str, Iterable[str]]=None) -> NaiveBayes:
        '''learn probabilities for tokens extracted by the given text'''
        data = DataSet.FromAny(text, category)
        for d in data:
            # ensure we have defined the c category
            self.__add_category(d.category)
            # update our count of how many documents mapped to this category
            self.documents[d.category] += 1
            # update the total number of documents we have learned from
            self.total_documents += 1

            # Update our vocabulary and our word frequency count for this category
            for token, frequency in d.table.items():
                # add this word to our vocabulary if not already existing
                self.__add_token(token)

                # update the frequency information for this word in this category
                if token not in self.word_frequency[d.category]: self.word_frequency[d.category][token] = frequency
                else: self.word_frequency[d.category][token] += frequency
            
                # update the count of all words we have seen mapped to this category
                self.word_count[d.category] += frequency

        return self