Python mk_is_interesting 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: educe.util

메소드/함수: mk_is_interesting

hotexamples.com에서의 예제들: 6

Python mk_is_interesting - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 educe.util.mk_is_interesting에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

def read_augmented_corpus(args, verbose=True):
    """
    Read the unannotated stage of the augmented corpus
    """
    aug_args = copy.copy(args)
    aug_args.annotator = None
    preselection = {'stage': ['unannotated']}
    is_interesting = mk_is_interesting(aug_args, preselected=preselection)
    reader = educe.stac.Reader(args.augmented)
    anno_files = reader.filter(reader.files(), is_interesting)
    return reader.slurp(anno_files, verbose)

예제 #2

파일 보기

파일: weave.py 프로젝트: irit-melodi/educe

def read_augmented_corpus(args, verbose=True):
    """
    Read the unannotated stage of the augmented corpus
    """
    aug_args = copy.copy(args)
    aug_args.annotator = None
    preselection = {'stage': ['unannotated']}
    is_interesting = mk_is_interesting(aug_args,
                                       preselected=preselection)
    reader = educe.stac.Reader(args.augmented)
    anno_files = reader.filter(reader.files(), is_interesting)
    return reader.slurp(anno_files, verbose)

예제 #3

파일 보기

파일: res_nps.py 프로젝트: Sablayrolles/debates

def _read_corpus_inputs(args):
    """
    Read and filter the part of the corpus we want features for
    """
    is_interesting = mk_is_interesting(args, preselected={"stage": ["units"]})
    reader = educe.stac.Reader(args.corpus)
    anno_files = reader.filter(reader.files(), is_interesting)
    corpus = reader.slurp(anno_files, verbose=True)

    postags = postag.read_tags(corpus, args.corpus)
    parses = corenlp.read_results(corpus, args.corpus)
    LEXICON.read(args.resources)
    return FeatureInput(corpus=corpus,
                        postags=postags,
                        parses=parses,
                        lexicons=[LEXICON],
                        pdtb_lex=None,
                        verbnet_entries=None,
                        inquirer_lex=None)

예제 #4

파일 보기

파일: res_nps.py 프로젝트: eipiplusun/educe

def _read_corpus_inputs(args):
    """
    Read and filter the part of the corpus we want features for
    """
    is_interesting = mk_is_interesting(args,
                                       preselected={"stage": ["units"]})
    reader = educe.stac.Reader(args.corpus)
    anno_files = reader.filter(reader.files(), is_interesting)
    corpus = reader.slurp(anno_files, verbose=True)

    postags = postag.read_tags(corpus, args.corpus)
    parses = corenlp.read_results(corpus, args.corpus)
    LEXICON.read(args.resources)
    return FeatureInput(corpus=corpus,
                        postags=postags,
                        parses=parses,
                        lexicons=[LEXICON],
                        pdtb_lex=None,
                        verbnet_entries=None,
                        inquirer_lex=None)

예제 #5

파일 보기

파일: populate-trello.py 프로젝트: eipiplusun/irit-stac

# ---------------------------------------------------------------------
# args
# ---------------------------------------------------------------------

arg_parser = argparse.ArgumentParser(description='Dump EDU text' )
arg_parser.add_argument('idir', metavar='DIR',
                        help='Input directory'
                        )
educe_group = arg_parser.add_argument_group('corpus filtering arguments')
util.add_corpus_filters(educe_group, fields=[ 'doc' ])
args=arg_parser.parse_args()
args.subdoc    = None
args.stage     = 'unannotated'
args.annotator = None
is_interesting=util.mk_is_interesting(args)

# ---------------------------------------------------------------------
# main
# ---------------------------------------------------------------------

reader = educe.stac.Reader(args.idir)
anno_files = reader.filter(reader.files(), is_interesting)

trello  = tr.TrelloApi(secrets.apikey, secrets.token)
board   = trello.boards.get(board_id)
columns = trello.boards.get_list(board_id)
cards   = trello.boards.get_card(board_id)
subdocs = collections.defaultdict(list)
for k in anno_files:
    subdocs[k.doc].append(k.subdoc)

예제 #6

파일 보기

#            # then visit in your web browser to approve
#            # and paste in the resulting token

# ---------------------------------------------------------------------
# args
# ---------------------------------------------------------------------

arg_parser = argparse.ArgumentParser(description='Dump EDU text')
arg_parser.add_argument('idir', metavar='DIR', help='Input directory')
educe_group = arg_parser.add_argument_group('corpus filtering arguments')
util.add_corpus_filters(educe_group, fields=['doc'])
args = arg_parser.parse_args()
args.subdoc = None
args.stage = 'unannotated'
args.annotator = None
is_interesting = util.mk_is_interesting(args)

# ---------------------------------------------------------------------
# main
# ---------------------------------------------------------------------

reader = educe.stac.Reader(args.idir)
anno_files = reader.filter(reader.files(), is_interesting)

trello = tr.TrelloApi(secrets.apikey, secrets.token)
board = trello.boards.get(board_id)
columns = trello.boards.get_list(board_id)
cards = trello.boards.get_card(board_id)
subdocs = collections.defaultdict(list)
for k in anno_files:
    subdocs[k.doc].append(k.subdoc)