Ejemplos de gen_inverted_idx en Python

Lenguaje de programación: Python

Namespace/Package Name: inverted_idx

Método / Función: gen_inverted_idx

Ejemplos en hotexamples.com: 5

Python gen_inverted_idx - 5 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de inverted_idx.gen_inverted_idx extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Ejemplo n.º 1

Mostrar archivo

import tokenizer
import inverted_idx


#Smooth scaling
def calculate(inverted_idx, documents):
    idf = {}
    doc_no = len(documents)
    for term in inverted_idx:
        idf[term] = 1 + math.log(doc_no /
                                 (1 + len(inverted_idx[term].postings)))
    return idf


if __name__ == "__main__":
    docs = {
        "0":
        "abc alo ola 456 zzz ola",
        "1":
        "alo ola 321 123",
        "2":
        "hello 123 456 123",
        "3":
        "hello alo ola abc 123 456 zzz",
        "4":
        "123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123"
    }
    inv_idx = inverted_idx.gen_inverted_idx(docs)

    res = calculate(inv_idx, docs)
    print(res)

Ejemplo n.º 2

Mostrar archivo

Archivo: vector_model.py Proyecto: axblueblader/model-evaluation

 def __init__(self, docs, class_map):
     self.inverted_idx, self.terms_in_doc = inverted_idx.gen_inverted_idx(
         docs, class_map)
     self.docs = docs
     self.idx_map = []
     self._convert_to_vectors()

Ejemplo n.º 3

Mostrar archivo

 def __init__(self, docs):
     self.inverted_idx = inverted_idx.gen_inverted_idx(docs)
     self.docs = docs
     self._convert_to_vectors()

Ejemplo n.º 4

Mostrar archivo

 def __init__(self, docs):
     self.inverted_idx = inverted_idx.gen_inverted_idx(docs)

Ejemplo n.º 5

Mostrar archivo

Archivo: idf.py Proyecto: axblueblader/model-evaluation

# Smooth scaling


def calculate(inverted_idx, documents):
    idf = {}
    doc_no = len(documents)
    for term in inverted_idx:
        idf[term] = 1 + math.log(doc_no /
                                 (1 + len(inverted_idx[term].postings)))
    return idf


if __name__ == "__main__":
    docs = {
        "0":
        "abc alo ola 456 zzz ola",
        "1":
        "alo ola 321 123",
        "2":
        "hello 123 456 123",
        "3":
        "hello alo ola abc 123 456 zzz",
        "4":
        "123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123"
    }
    inv_idx, terms_in_doc = inverted_idx.gen_inverted_idx(docs)

    res = calculate(inv_idx, docs)
    print(res)