Ejemplos de LanguageModelingDataset en Python

Lenguaje de programación: Python

Namespace/Package Name: catalyst.contrib.data.nlp.dataset

Ejemplos en hotexamples.com: 4

Python LanguageModelingDataset - 4 ejemplos encontrados. Estos son los ejemplos en Python del mundo real mejor valorados de catalyst.contrib.data.nlp.dataset.LanguageModelingDataset extraídos de proyectos de código abierto. Puedes valorar ejemplos para ayudarnos a mejorar la calidad de los ejemplos.

Métodos usados con frecuencia

Mostrar Ocultar

LanguageModelingDataset(4)

Métodos usados con frecuencia

LanguageModelingDataset (4)

Ejemplo n.º 1

Mostrar archivo

def test_tokenizer_type_error():
    """Test if tokenizer neither hf nor string"""
    tok = lambda x: x
    dataset = LanguageModelingDataset(texts, tok)  # noqa: F841

Ejemplo n.º 2

Mostrar archivo

def test_tokenizer_tokenizer():
    """Test initialization with tokenizer"""
    tok = AutoTokenizer.from_pretrained("bert-base-uncased")
    dataset = LanguageModelingDataset(texts, tok)
    assert dataset[0] is not None
    assert len(dataset) == 2

Ejemplo n.º 3

Mostrar archivo

def test_exception_with_sort():
    """Test lazy=True sort=True case"""
    tok = AutoTokenizer.from_pretrained("bert-base-uncased")
    dataset = LanguageModelingDataset(  # noqa: F841
        texts, tok, lazy=True, sort=True)

Ejemplo n.º 4

Mostrar archivo

def test_tokenizer_str():
    """Test initialization with string"""
    dataset = LanguageModelingDataset(texts, "bert-base-uncased")
    assert dataset[0] is not None
    assert len(dataset) == 2