Ejemplos de Similarity.jaccard_similarity en Python

Lenguaje de programación: Python

Namespace/Package Name: similarity

Clase / Tipo: Similarity

Método / Función: jaccard_similarity

Ejemplos en hotexamples.com: 2

Python Similarity.jaccard_similarity - 2 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de similarity.Similarity.jaccard_similarity extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

Similarity(30)

read_graph_kernels(3)

similarity(3)

find_top_k_similar_graphs(3)

get_features(2)

cosine_similarity(2)

pearson(2)

predict(2)

generate(2)

calculateBias(2)

calcSimiMatrix(2)

bha_distance(2)

save(2)

jaccard_similarity(2)

k_means_cluster(1)

is_changed_page(1)

jaccard(1)

jaccard_distance(1)

intersection(1)

Rank(1)

kendall_tau(1)

kl_divergence(1)

manhattan_distance(1)

graph(1)

minkowski_distance(1)

read_data(1)

return_conversation_by_cossine(1)

return_conversation_by_page_rank(1)

to_csv(1)

mcl_perform(1)

getIndex(1)

get_the_next_conversation(1)

cosine(1)

_add_rank_column(1)

_convert_to_long_format(1)

apply_threshold(1)

augment(1)

calculate_ontology_similarity(1)

calculate_similarity_score(1)

calculate_textual_similarity(1)

calculate_word2vec_similarity(1)

change_parameters(1)

cosine_distance(1)

get_files_similarity(1)

cosine_scores(1)

dcg_difference(1)

dice_similarity(1)

euclidean_distance(1)

exec_(1)

execute(1)

Ejemplo n.º 1

Mostrar archivo

def get_best_indices(list, sin_val):
    ''' The function takes on single row and finds out the best indexes according to similarity distance. The similarity values used are
        Euclidean distance, Manhattan distance, Minkowski distance, Cosine distance and Jaccard distance.
        It returns a dictionary of list'''

    ### local optima saves a dictionary where dictionary is like { distance_type: [best_distance_value, best_lowest_index, best_upper_index] }
    local_optima = {
        "Euclidean": [9999999999, 9999999, 99999999],
        "Manhattan": [9999999999, 9999999, 99999999],
        "Minkowski": [9999999999, 9999999, 99999999],
        "Cosine": [9999999999, 9999999, 99999999],
        "Jaccard": [9999999999, 9999999, 99999999]
    }

    measures = Similarity()  ### Calling Similarity class
    size = len(sin_val)  ### size of sine value list which is 40

    for i in range(len(list) - size):

        ### Euclidean Portion
        val = measures.euclidean_distance(list[i:i + size], sin_val)
        if val <= local_optima["Euclidean"][0]:
            local_optima["Euclidean"] = [val, i, i + size]

        ### Manhattan Portion
        val = measures.manhattan_distance(list[i:i + size], sin_val)
        if val <= local_optima["Manhattan"][0]:
            local_optima["Manhattan"] = [val, i, i + size]

        ### Minkowski Portion
        val = measures.minkowski_distance(list[i:i + size], sin_val, 3)
        if val <= local_optima["Minkowski"][0]:
            local_optima["Minkowski"] = [val, i, i + size]

        ### Cosine Portion
        val = measures.cosine_similarity(list[i:i + size], sin_val)
        if val <= local_optima["Cosine"][0]:
            local_optima["Cosine"] = [val, i, i + size]

        ### Jaccard Portion
        val = measures.jaccard_similarity(list[i:i + size], sin_val)
        if val <= local_optima["Jaccard"][0]:
            local_optima["Jaccard"] = [val, i, i + size]

    return local_optima

Ejemplo n.º 2

Mostrar archivo

Archivo: test.py Proyecto: rbouadjenek/YouTaQA

    values = predictions[:, 1]
    answer = x[np.where(values == max(values)), 1]
    text = str(answer)
    encoding = tokenizer.encode_plus(qst, text, max_length=256)
    input_ids, token_type_ids = encoding["input_ids"], encoding[
        "token_type_ids"]
    start_scores, end_scores = modelExtractor(torch.tensor([input_ids]),
                                              token_type_ids=torch.tensor(
                                                  [token_type_ids]))
    all_tokens = tokenizer.convert_ids_to_tokens(input_ids)
    a = ' '.join(
        all_tokens[torch.argmax(start_scores):torch.argmax(end_scores) + 1])
    cleaned_answer = a.replace(" ##", "")
    txt_file.write("#################################### \n")
    txt_file.write("#################################### \n")
    txt_file.write("Question ====> \t" + row[0] + "\n")
    txt_file.write("Réponse prédite ====> \t" + cleaned_answer + "\n")
    txt_file.write("La vraie réponse ====> \t" + row[1] + "\n")
    txt_file.write("Dice Similarity ====> \t" +
                   str(Similarity.dice_similarity(cleaned_answer, row[1])) +
                   "\n")
    txt_file.write("Jaccard Similarity ====> \t" +
                   str(Similarity.jaccard_similarity(cleaned_answer, row[1])) +
                   "\n")
    txt_file.write("#################################### \n")
searchObject.reader.close()
searchObject.directory.close()

tsv_file.close()
txt_file.close()