Python StanfordPreprocess 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: iepy.preprocess.stanford_preprocess

클래스/타입: StanfordPreprocess

hotexamples.com에서의 예제들: 6

Python StanfordPreprocess - 6개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 iepy.preprocess.stanford_preprocess.StanfordPreprocess에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

StanfordPreprocess(6)

자주 사용되는 메소드들

StanfordPreprocess (6)

예제 #1

파일 보기

    def test_override(self):
        self.override_preprocess = StanfordPreprocess()
        self.override_preprocess.override = True

        with mock.patch("iepy.preprocess.corenlp.get_analizer") as mock_analizer:
            class MockAnalizer:
                def analize(self, *args, **kwargs):
                    return {}

            mock_analizer.side_effect = lambda: MockAnalizer
            self.override_preprocess(self.document_all_done)
            self.assertTrue(mock_analizer.called)

예제 #2

파일 보기

    def setUp(self):
        pps = PreProcessSteps
        self._all_steps = [
            pps.tokenization, pps.sentencer, pps.tagging, pps.ner,
            pps.lemmatization, pps.syntactic_parsing
        ]

        patcher = mock.patch("iepy.preprocess.corenlp.get_analizer")
        self.mock_get_analizer = patcher.start()
        self.mock_analizer = self.mock_get_analizer.return_value
        self.addCleanup(patcher.stop)
        self.stanfordpp = StanfordPreprocess()

예제 #3

파일 보기

    def setUp(self):
        self.preprocess = StanfordPreprocess()

        self.document_nothing_done = IEDocFactory()
        self.document_all_done = IEDocFactory(
            tokenization_done_at=datetime.now(),
            lemmatization_done_at=datetime.now(),
            sentencer_done_at=datetime.now(),
            tagging_done_at=datetime.now(),
            ner_done_at=datetime.now(),
            segmentation_done_at=datetime.now(),
        )
        self.document_missing_lemmatization = IEDocFactory(
            tokenization_done_at=datetime.now(),
            sentencer_done_at=datetime.now(),
            tagging_done_at=datetime.now(),
            ner_done_at=datetime.now(),
            segmentation_done_at=datetime.now(),
        )

예제 #4

파일 보기

파일: preprocess.py 프로젝트: theblueskies/iepy

    preprocess.py -h | --help | --version

Options:
  -h --help             Show this screen
  --version             Version number
"""
import logging

from docopt import docopt

import iepy

iepy.setup(__file__)
from iepy.data.db import DocumentManager
from iepy.preprocess.stanford_preprocess import StanfordPreprocess
from iepy.preprocess.pipeline import PreProcessPipeline
from iepy.preprocess.segmenter import SyntacticSegmenterRunner

if __name__ == '__main__':
    logger = logging.getLogger(u'preprocess')
    logger.setLevel(logging.INFO)
    logging.basicConfig(
        level=logging.INFO,
        format=u"%(asctime)s - %(name)s - %(levelname)s - %(message)s")
    opts = docopt(__doc__, version=0.1)
    docs = DocumentManager()
    pipeline = PreProcessPipeline(
        [StanfordPreprocess(),
         SyntacticSegmenterRunner(increment=True)], docs)
    pipeline.process_everything()

예제 #5

파일 보기

def start_preprocess(docs, increment_ner):
    pipeline = PreProcessPipeline([
        StanfordPreprocess(increment_ner),
        SyntacticSegmenterRunner(increment=True)
    ], docs)
    pipeline.process_everything()

예제 #6

파일 보기

파일: preprocess.py 프로젝트: chagge/iepy

Options:
  -h --help             Show this screen
  --increment-ner       Re run NER and Gazetter for every document. If a document lacked any of the previous steps, will be preprocessed entirely.
  --version             Version number
"""
import logging

from docopt import docopt

import iepy
iepy.setup(__file__)
from iepy.data.db import DocumentManager
from iepy.preprocess.stanford_preprocess import StanfordPreprocess
from iepy.preprocess.pipeline import PreProcessPipeline
from iepy.preprocess.segmenter import SyntacticSegmenterRunner


if __name__ == '__main__':
    logger = logging.getLogger(u'preprocess')
    logger.setLevel(logging.INFO)
    logging.basicConfig(level=logging.INFO, format='%(message)s')
    opts = docopt(__doc__, version=iepy.__version__)
    docs = DocumentManager()
    increment_ner = opts['--increment-ner']

    pipeline = PreProcessPipeline([
        StanfordPreprocess(increment_ner),
        SyntacticSegmenterRunner(increment=True)
    ], docs)
    pipeline.process_everything()