Python Field.build_vocab 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: torchtext.data.field

클래스/타입: Field

메소드/함수: build_vocab

hotexamples.com에서의 예제들: 2

Python Field.build_vocab - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 torchtext.data.field.Field.build_vocab에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Field(7)

build_vocab(2)

자주 사용되는 메소드들

Field (7)

build_vocab (2)

예제 #1

파일 보기

    def iters(cls, batch_size: int =32, device: int = 0, root: str ='.data',
              vectors: Tensor = None, **kwargs) -> Tuple[Iterator, Iterator, Iterator]:

        text = Field()
        label = Field(sequential=False)

        train, valid, test = cls.splits(text, label, root=root, **kwargs)

        text.build_vocab(train, vectors=vectors)
        label.build_vocab(train)

        return BucketIterator.splits(
            (train, test), batch_size=batch_size, device=device)

예제 #2

파일 보기

params = parser.parse_args()

kvs = [(k, v) for k, v in vars(params).items()]
kvs.append(('Device', device))

print_kv_box('Current Configuration', kvs)

if params.mode == 'debug':
    tokenizer = WordToCharTokenizer()
    text_field = Field(tokenize=tokenizer, batch_first=True)
    ds = RandomizedTextWindowDataset(params.dataset,
                                     text_field,
                                     params.window_size,
                                     topk=params.topk,
                                     newline_eos=False)
    text_field.build_vocab(ds)
    train_ds, test_ds = ds.split(0.8)
    iterator = NoisedPreWindowedIterator(train_ds, params.batch_size,
                                         params.window_size, 0.0)
    iterator = PredictMiddleNoisedWindowIterator(iterator, 1)
    for b in iterator:
        print(b)
    i = 1
    # model = MLP(51, 27, 1024, 3)
    # text_field = Field(tokenize=tokenize, batch_first=True)
    # ds = SplittableLanguageModelingDataset(params.dataset, text_field, newline_eos=False)
    # text_field.build_vocab(ds)
    # train, test = ds.split()
    # model = MLP(51, len(text_field.vocab), 1024, 3)
    # iterator = PredictMiddleNoisedWindowIterator(ds, 64, 51, 0.1, 1)
    # for b in iterator: