Python Filter.filter示例

def split_lines(binary,
                contour,
                min_size,
                thresh=0.5,
                roi=False,
                offset=(0, 0)):
    if not roi:
        roi_slice = utils.get_roi_slice(contour, offset)
        binary = binary[roi_slice]
    # cv2.imshow("bin", binary)
    # ACHTUNG: may not work correct if `roi` is not correct contour's roi
    binary = binary & np.array(utils.contour_mask(contour), dtype=bool)

    means = binary.mean(axis=1)

    # THRESH_INV
    means[means < thresh] = -1
    means[means >= thresh] = 0
    means[means == -1] = 1

    # Find where gaps starts and ends
    means = np.pad(means, 1, 'constant')
    means = means - np.roll(means, 1)
    begins = (means == 1).nonzero()[0] - 1  # -1 caused by pad
    ends = (means == -1).nonzero()[0] - 1

    # Getting ars to cut
    args = (begins + ends) / 2
    args = args[args >= min_size]
    args = args[args <= means.shape[0] - min_size]
    if args.shape[0] == 0:
        return [contour]

    lines = []
    prev = 0
    args = np.append(args, means.shape[0] - 2)
    for arg in args:  # TODO: make this code reusable for fragmentation
        line_roi = binary[prev:arg, :]
        curr_off = (contour.rect.left, contour.rect.top + prev)
        conts = [
            Contour(c) for c in cv2.findContours(line_roi,
                                                 cv2.RETR_LIST,
                                                 cv2.CHAIN_APPROX_SIMPLE,
                                                 offset=curr_off)[0]
        ]
        lines.extend(conts)
        prev = arg

    flt = Filter()
    flt.add_filter("min_area", min_size * min_size)
    lines = flt.filter(lines)
    if len(lines) <= 1:
        return [contour]

    return lines

示例#2

显示文件

文件： text_detection.py 项目： 2113vm/experiments_detect_text

def find_text_lines(original,
                    thresh=0.02,
                    min_size=4,
                    max_size=12,
                    spacing=1.8,
                    min_length=1,
                    otsu=False,
                    x_only=False):
    def _threshold_normal(_image, _thresh):
        return np.uint8(
            cv2.threshold(_image,
                          _thresh * utils.dtype_limits(_image)[1], 255,
                          cv2.THRESH_BINARY)[1])

    def _threshold_otsu(_image, *args):  # Careful with that axe, Eugene
        return cv2.threshold(
            np.uint8(_image / utils.dtype_limits(_image)[1] * 255.), 0, 255,
            cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

    if otsu:
        get_thresh = _threshold_otsu
    else:
        get_thresh = _threshold_normal

    def _find_text_preprocess(_image):
        # _image = cv2.bilateralFilter(_image, -1, 64, 3)
        # if gauss:
        #     _image = cv2.medianBlur(_image, 3)
        # cv2.imshow('prep', _image)
        if len(_image.shape) > 2:
            _image = cv2.cvtColor(_image, cv2.COLOR_BGR2GRAY)
        # image = cv2.equalizeHist(image)
        return _image

    def _get_diff(_image):
        # _image = cv2.medianBlur(_image, 5)
        # _image = cv2.GaussianBlur(_image, (3, 3), 5)
        _image = utils.differentiate(_image, metric=utils.METRIC_MAX)
        return utils.differentiate(_image, metric=utils.METRIC_MIN)

    if spacing != 0:
        ksize = int(min_size * spacing)
    else:
        ksize = 1

    filters = Filter()
    # filters.add_filter("outer")
    filters.add_filter("min_area", min_size * min_size * min_length * 12)
    # filters.add_filter("min_fill", 0.3)
    filters.add_filter("min_aspect_ratio", 0.1)
    # filters.add_filter("smoothness", 5)

    # if diffs is None:
    #     diffs = utils.differentiate(np.float32(_find_text_preprocess(original)) / 255.,
    #                                 xkernel=5, ykernel=5, metric=utils.METRIC_SPLIT)
    # if x_only:
    #     diff = utils.differentiate(np.float32(_find_text_preprocess(original)) / 255.,
    #  xkernel=5, ykernel=5, metric=utils.METRIC_SPLIT)[0]
    # else:
    #     diff = utils.differentiate(np.float32(_find_text_preprocess(original)) / 255.,
    # xkernel=5, ykernel=5)
    # diff = utils.differentiate(np.float32(_find_text_preprocess(original) / 255.),
    # metric=utils.METRIC_MIN)

    diff = _get_diff(_find_text_preprocess(original))
    ndiff = diff / diff.max()
    binary = get_thresh(ndiff, thresh)
    # cv2.imshow('diff', binary * 255)
    # Connecting
    connected = cv2.morphologyEx(binary,
                                 cv2.MORPH_CLOSE,
                                 cv2.getStructuringElement(
                                     cv2.MORPH_RECT,
                                     utils.fix_kernel_size(ksize, ksize)),
                                 borderType=cv2.BORDER_CONSTANT,
                                 borderValue=0)
    # cv2.imshow('connected', connected)
    # Filtering
    binary = cv2.morphologyEx(
        connected, cv2.MORPH_OPEN,
        cv2.getStructuringElement(
            cv2.MORPH_RECT,
            utils.fix_kernel_size(int(min_size) - 1,
                                  int(min_size) - 1)))
    # cv2.imshow('bin', binary)
    return filters.filter([
        Contour(c, thresh) for c in cv2.findContours(
            binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[0]
    ])

示例#3

显示文件

文件： text_detection.py 项目： 2113vm/experiments_detect_text

def find_text(original=None,
              diffs=None,
              first_thresh=0.02,
              second_thresh=0.04,
              min_size=4,
              max_size=12,
              hspacing=1.8,
              vspacing=0,
              min_length=1,
              offset=(0, 0),
              otsu=False,
              split=True,
              max_box_rad=(32, 32),
              default_box_rad=(2, 2),
              ret=TEXT_CONTOURS_BOXES):
    """
    Detects text areas on image regardless to its contents

    :param hspacing: Maximal horizontal spacing for symbols connection (relative to min_size)
    :param min_length: Minimal text length (relative to min_size)

    """
    _debug = False

    def _threshold_normal(_image, _thresh):
        return np.uint8(
            cv2.threshold(_image,
                          _thresh * utils.dtype_limits(_image)[1], 255,
                          cv2.THRESH_BINARY)[1])

    def _threshold_otsu(_image, *args):  # Careful with that axe, Eugene
        return cv2.threshold(
            np.uint8(_image / utils.dtype_limits(_image)[1] * 255.), 0, 255,
            cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

    if otsu:
        get_thresh = _threshold_otsu
    else:
        get_thresh = _threshold_normal

    def _find_text_preprocess(_image):
        # image = cv2.bilateralFilter(image, -1, 64, 3)
        _image = cv2.cvtColor(_image, cv2.COLOR_BGR2GRAY)
        # image = cv2.equalizeHist(image)
        return _image

    assert (original is not None or diffs is not None)

    if hspacing != 0:
        ksize_h = int(min_size * hspacing)
    else:
        ksize_h = 1

    if vspacing != 0:
        ksize_v = int(min_size * vspacing)
    else:
        ksize_v = 1

    filters = Filter()
    filters.add_filter("outer")
    filters.add_filter("min_area", min_size * min_size * min_length)
    # filters.add_filter("min_fill", 0.5)
    # filters.add_filter("min_aspect_ratio", min_length)

    # if diffs is None:
    #     diffs = utils.differentiate(np.float32(_find_text_preprocess(original)) / 255.,
    #                                 xkernel=5, ykernel=5, metric=utils.METRIC_SPLIT)
    if diffs is None:
        diffs = utils.differentiate(
            np.float32(_find_text_preprocess(original)) / 255.,
            xkernel=5,
            ykernel=5)
        diffs = (diffs, diffs)

    ndiffs = (diffs[0] / diffs[0].max(), diffs[1] / diffs[1].max())

    if _debug:
        cv2.imshow("raw bin", ndiffs[0] / ndiffs[0].max())

    binary = get_thresh(ndiffs[0], first_thresh)

    if _debug:
        cv2.imshow("bin", binary)

    # Remove too long vertical lines
    sub = cv2.morphologyEx(
        binary, cv2.MORPH_OPEN,
        cv2.getStructuringElement(cv2.MORPH_RECT,
                                  utils.fix_kernel_size(1, max_size)))
    sub = cv2.morphologyEx(sub, cv2.MORPH_CLOSE,
                           cv2.getStructuringElement(cv2.MORPH_RECT, (1, 3)))
    if _debug:
        cv2.imshow("sub", sub)
    binary = cv2.bitwise_xor(binary, sub)

    # Connecting
    connected = cv2.morphologyEx(binary,
                                 cv2.MORPH_CLOSE,
                                 cv2.getStructuringElement(
                                     cv2.MORPH_RECT,
                                     utils.fix_kernel_size(ksize_h, ksize_v)),
                                 borderType=cv2.BORDER_CONSTANT,
                                 borderValue=0)
    if _debug:
        cv2.imshow("connected", connected)

    # Filtering
    binary = cv2.morphologyEx(
        connected, cv2.MORPH_OPEN,
        cv2.getStructuringElement(
            cv2.MORPH_RECT,
            utils.fix_kernel_size(min_length * int(min_size) - 1,
                                  int(min_size) - 1)))
    if _debug:
        cv2.imshow("connected and filtered", binary)

    # 1st detect_angle, not accurate, with max_thresh, not using offset yet
    conts = [
        Contour(c, first_thresh) for c in cv2.findContours(
            binary, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)[0]
    ]
    filtered = filters.filter(conts)

    # Preparing data for floodFill
    if ret == TEXT_BOXES or ret == TEXT_CONTOURS_BOXES:
        second_bin = (get_thresh(ndiffs[0], second_thresh),
                      get_thresh(ndiffs[1], second_thresh))
    else:
        second_bin = (get_thresh(ndiffs[0], second_thresh), None)

    bin_for_ff = cv2.bitwise_or(second_bin[0] * 1., (connected / 255) * 2)
    mask = cv2.bitwise_not(cv2.bitwise_or(binary, connected))
    mask = np.pad(mask, 1, 'constant', constant_values=255)  # add 1px. border

    for c in filtered:
        cv2.floodFill(bin_for_ff,
                      mask, (c.raw[0][0][0], c.raw[0][0][1]),
                      255,
                      flags=4)
    bin_for_ff = np.uint8(
        cv2.threshold(bin_for_ff, 1, 255, cv2.THRESH_BINARY)[1])
    # bin_for_ff = cv2.morphologyEx(bin_for_ff, cv2.MORPH_OPEN,
    # cv2.getStructuringElement(cv2.MORPH_RECT,
    # utils.fix_kernel_size(min_length * int(min_size) - 1,
    # int(min_size) - 1)))

    if split:
        bin_for_split = bin_for_ff.copy()
    if _debug:
        cv2.imshow("bin_for_ff", bin_for_ff)
    # (offset[0] - 1) is a workaround for some kind of bug
    # 2nd detect_angle, more accurate, with min_thresh and offset
    conts = [
        Contour(c, first_thresh)
        for c in cv2.findContours(bin_for_ff,
                                  cv2.RETR_LIST,
                                  cv2.CHAIN_APPROX_SIMPLE,
                                  offset=(offset[0] - 1, offset[1]))[0]
    ]
    filtered = filters.filter(conts)

    if not split:
        splitted = filtered
    else:
        splitted = []
        for c in filtered:
            if c.rect.height >= 2 * min_size:
                splitted.extend(
                    split_lines(bin_for_split,
                                c,
                                min_size,
                                offset=(-offset[0], -offset[1])))
            else:
                splitted.append(c)

    if ret == TEXT_CONTOURS:
        return splitted
    else:
        boxes = [
            find_text_box(contour=c,
                          bdiff=second_bin,
                          max_rad=max_box_rad,
                          default_rad=default_box_rad,
                          offset=offset) for c in splitted
        ]
        if ret == TEXT_BOXES:
            return boxes
        elif ret == TEXT_CONTOURS_BOXES:
            return zip(splitted, boxes)