Python DataGenerator.char_to_intの例

プログラミング言語: Python

名前空間/パッケージ名: data_generator

クラス/型: DataGenerator

メソッド/関数: char_to_int

hotexamples.comのコード掲載数: 1

Python DataGenerator.char_to_int - 1件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのdata_generator.DataGenerator.char_to_intの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

DataGenerator(30)

apply_transformations(30)

add_constant_column(30)

add_formula_column(30)

add_map_column(18)

filter(15)

add_copy_column(12)

duplicate_rows(11)

_transform_instance_to_matrix(7)

column_values_to_row(6)

create_data(5)

__getitem__(5)

blobs_2d(5)

data_size(3)

add_dataset(3)

configure(3)

add_tile_to_state(2)

featurize(2)

filter_disrupted_routes(1)

extract(1)

generate_client_list(1)

epoch(1)

generate_random_commerce_list(1)

generate_random_transaction_list(1)

devide(1)

demo_user(1)

convert_item(1)

data_gen(1)

curriculum_schedule(1)

curriculum(1)

csv(1)

count_train(1)

convert_sentence_to_tokens(1)

convert_image_to_tensor(1)

collect_data(1)

char_to_int(1)

blobs_with_noise_2d(1)

_transform_instance_visual_to_np_array(1)

_split_bin(1)

__iter__(1)

initialize_file_system(1)

コード例 #1

ファイルを表示

ファイル: ocr.py プロジェクト: skaugvoll/TDT4173-MachineLearning

def ocr(trainingset="../chars74k-lite", testingset="../detection-images"):
    #########
    #
    # INITIALIZATION
    #
    #########
    window_character_threshold = 1.0
    patches_containing_charater = []
    characters = set()

    # TRAINING CASES
    dg = DataGenerator(dataset=trainingset, normalized=True)
    dg.shuffle_data()

    # extract the training  data from our data-generator
    training_cases, training_labels = dg.get_training_partition(percentage=1)

    # convert training  data from float64 to float32
    training_cases = training_cases.astype(np.float32)

    # print(training_cases[0].shape) # (400,)

    # TESTING CASES
    dg = DataGenerator(dataset=testingset, normalized=True)

    # extract the testing  data from our data-generator
    testing_cases, _ = dg.get_data()
    testing_labels = training_labels

    # print(np.array(testing_cases[0]).shape) # (40000,)

    cases_reshaped = []
    for idx, case in enumerate(testing_cases):
        h, w = dg.get_dimensions(idx)
        case = np.array(case)
        case = case.reshape(h, w)
        cases_reshaped.append(case)

    # print(cases_reshaped[0].shape) # (200,200) # (600,300)

    # windows = window_stack(cases_reshaped[0], 1, 20)

    # print(windows.shape) # (181,4000)

    # print(windows[0].shape) # (4000,)

    #########
    #
    # OCR
    #
    #########

    # create the classifier to run over the windows
    # Create the Conv model
    print("Creating model")
    window_width = 20
    window_height = 20
    test_img = testing_cases[0]
    image_width = 200
    image_height = 200

    model = init_model(window_height, window_width)

    # Train the model
    print("Training model")
    model = train_conv_net(model, training_cases, training_labels)

    print("Creating windows")
    columns = image_width - window_width
    rows = image_height - window_height
    windows = []
    xy = []
    for i in range(columns):
        for j in range(rows):
            index = i + j * image_width
            xy.append((i, j))
            windows.append(
                get_window(test_img, index, window_width, window_height,
                           image_width).reshape(1, 400))

    windows = np.array(windows)
    print("Predicting windows")
    template = ('Prediction is "{}" ({:.1f}%)')
    predictions = prediction_conv_net(model, windows)
    fix, ax = plt.subplots(1)
    ax.imshow(np.reshape(test_img, (-1, image_width)))
    cmap = cm.autumn
    norm = Normalize(vmin=0, vmax=27)
    possible = []
    for pred_dict, window, pos in zip(predictions, windows, xy):
        class_id = pred_dict['class_ids'][0]
        probability = pred_dict['probabilities'][class_id]
        if probability >= window_character_threshold:
            # window_2d = np.reshape(window, (-1, window_width))
            # plt.imshow(window_2d, interpolation='nearest')
            # plt.title(dg.int_to_char(class_id))
            # plt.show()
            # print(template.format(dg.int_to_char(class_id), 100 * probability))
            possible.append([pos, class_id])
            characters.add(dg.int_to_char(class_id))

            # WHEN NO FILTERING!!!
            # rect = patches.Rectangle(pos, window_width, window_height, linewidth=1, edgecolor=cmap(norm(class_id)),
            #                          facecolor='none')
            # ax.add_patch(rect)
    #  WHEN FILTERING
    used = []
    filtered = set()
    for i in range(len(possible)):
        if i in used:
            continue

        pos = possible[i]
        # avg_x = pos[0][0]
        # avg_y = pos[0][1]
        same = 1
        diff = 0

        for j in range(len(possible)):
            if i != j:
                pos2 = possible[j]
                pos2_x = pos2[0][0]
                pos2_y = pos2[0][1]
                if abs(pos[0][0] - pos2_x) <= 10 and abs(pos[0][1] -
                                                         pos2_y) <= 10:
                    if pos[1] == pos2[1]:
                        same += 1
                    else:
                        diff += 1

        if diff / same > 1.0:
            continue
        filtered.add(dg.int_to_char(pos[1]))

    handles = []
    for letter in filtered:  # FILTERING
        # for letter in characters: # NO FILTERING
        handles.append(
            patches.Patch(color=cmap(norm(dg.char_to_int(letter))),
                          label=letter))

    # red_patch = patches.Patch(color='red', label='The red data')
    plt.legend(handles=handles)

    plt.show()

    print("Characters found with threshold " +
          str(window_character_threshold) + ":" + str(characters))