Esempi in Python per Dataset.from_pandas

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: biome.text

Classe/tipologia: Dataset

Metodo/funzione: from_pandas

Esempi su hotexamples.com: 4

Dataset.from_pandas in Python: 4 esempi trovati. Questi sono i migliori esempi reali in Python per biome.text.Dataset.from_pandas, estratti da progetti open source. Li puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

from_dict(16)

from_csv(9)

from_json(4)

from_pandas(4)

from_elasticsearch(2)

from_datasets(1)

load_dataset(1)

load_from_disk(1)

Esempio n. 1

Mostra file

def test_from_pandas():
    df = pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
    ds = Dataset.from_pandas(df)

    assert ds.dataset.column_names == ["a", "b"]
    assert ds["a"] == [1, 2, 3]
    assert len(ds) == 3

Esempio n. 2

Mostra file

def test_from_parquet_file(resources_data_path):
    """This only shows an example of how one could read in a parquet file"""
    file_path = resources_data_path / "test.parquet"
    df = pd.read_parquet(file_path)
    dataset = Dataset.from_pandas(df)

    assert "reviewerID" in dataset.column_names

Esempio n. 3

Mostra file

def test_from_excel_file(resources_data_path):
    """This only shows an example of how one could read in an excel file"""
    str_value = Value("string")
    int_value = Value("int64")
    features = Features(Notification=int_value,
                        Type=str_value,
                        Plant=int_value,
                        Serial=str_value)

    file_path = resources_data_path / "test.xlsx"
    df = pd.read_excel(file_path)

    dataset = Dataset.from_pandas(df, features=features)

    assert len(dataset) > 0

Esempio n. 4

Mostra file

def training_dataset() -> Dataset:
    df = pd.DataFrame(
        {
            "text": [
                "This is a simple NER test",
                "This is a simple NER test with misaligned spans",
                "No NER here",
            ],
            "entities": [
                [{"start": 17, "end": 20, "label": "NER"}],
                [{"start": 17, "end": 22, "label": "NER"}],
                [],
            ],
        }
    )

    return Dataset.from_pandas(df)