Python Td 예제들, materialize.feature_benchmark.measurement_source.Td Python 예제들

예제 #1

0

파일 보기

class Update(DML):
    """Measure the time it takes for an UPDATE statement to return to client"""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);

> CREATE TABLE t1 (f1 BIGINT);
> INSERT INTO t1 SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000)
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1
1

> /* B */ UPDATE t1 SET f1 = f1 + 10000000
"""
    )

예제 #2

0

파일 보기

class FastPathFilterNoIndex(FastPath):
    """Measure the time it takes for the fast path to filter our all rows from a materialized view and return"""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);

> CREATE MATERIALIZED VIEW v1 (f1, f2) AS
  SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) +
  (a7.f1 * 1000000) AS f1,
  1 AS f2
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6, ten AS a7;

> SELECT COUNT(*) = 10000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1;
1

> /* B */ SELECT * FROM v1 WHERE f2 < 0;

"""
    )

예제 #3

0

파일 보기

class InsertAndSelect(DML):
    """Measure the time it takes for an INSERT statement to return
    AND for a follow-up SELECT to return data, that is, for the
    dataflow to be completely caught up.
    """

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);
"""
    )

    BENCHMARK = Td(
        """
> DROP TABLE IF EXISTS t1;

> /* A */ CREATE TABLE t1 (f1 INTEGER);

> INSERT INTO t1 SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000)
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> /* B */ SELECT 1 FROM t1 WHERE f1 = 1;
1
"""
    )

예제 #4

0

파일 보기

class CountDistinct(Dataflow):
    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));
> CREATE MATERIALIZED VIEW v1 AS
  SELECT
  a1.f1 +
  (a2.f1 * 10) AS f1,
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) +
  (a7.f1 * 1000000) /* +
  (a8.f1 * 10000000) */ AS unique
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6, ten AS a7;


> SELECT COUNT(*) = 10000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1
1

> /* B */ SELECT COUNT(DISTINCT f1) AS f1 FROM v1;
100
"""
    )

예제 #5

0

파일 보기

class GroupBy(Dataflow):
    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));
> CREATE MATERIALIZED VIEW v1 AS SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1,
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f2
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> SELECT COUNT(*) = 1000000 FROM v1
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1
1

> /* B */ SELECT COUNT(*), MIN(f1_min), MAX(f1_max) FROM (SELECT f2, MIN(f1) AS f1_min, MAX(f1) AS f1_max FROM v1 GROUP BY f2);
1000000 0 999999
"""
    )

예제 #6

0

파일 보기

class MinMax(Dataflow):
    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));
> CREATE MATERIALIZED VIEW v1 AS SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> SELECT COUNT(*) = 1000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1
1

> /* B */ SELECT MIN(f1), MAX(f1) AS f1 FROM v1;
0 999999
"""
    )

예제 #7

0

파일 보기

class DifferentialJoin(Dataflow):
    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));

> CREATE MATERIALIZED VIEW v1 AS
  SELECT a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1,
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f2
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1;
1


> /* B */ SELECT COUNT(*) FROM v1 AS a1 JOIN v1 AS a2 USING (f1);
1000000
"""
    )

예제 #8

0

파일 보기

class CrossJoin(Dataflow):

    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));
"""
    )

    BENCHMARK = Td(
        """
> DROP VIEW IF EXISTS v1;

> /* A */ CREATE MATERIALIZED VIEW v1 AS
  SELECT a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000)
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6

> /* B */ SELECT COUNT(*) = 1000000 AS f1 FROM v1;
true
"""
    )

예제 #9

0

파일 보기

class FinishOrderByLimit(Finish):
    """Benchmark ORDER BY + LIMIT without the benefit of an index"""

    INIT = Td(
        """
> CREATE VIEW ten (f1) AS (VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9));
> CREATE MATERIALIZED VIEW v1 AS SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1,
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f2
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> SELECT COUNT(*) = 1000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1
1

> /* B */ SELECT f2 FROM v1 ORDER BY 1 DESC LIMIT 1;
999999
"""
    )

예제 #10

0

파일 보기

class KafkaUpsertUnique(KafkaScenario):
    SHARED = Td(
        """
$ set keyschema={"type": "record", "name": "Key", "fields": [ {"name": "f1", "type": "long"} ] }

$ set schema={"type" : "record", "name" : "test", "fields": [ {"name": "f2", "type": "long"} ] }

$ kafka-create-topic topic=upsert-unique partitions=16

$ kafka-ingest format=avro topic=upsert-unique key-format=avro key-schema=${keyschema} schema=${schema} publish=true repeat=1000000
{"f1": ${kafka-ingest.iteration}} {"f2": ${kafka-ingest.iteration}}
"""
    )
    BENCHMARK = Td(
        """
> DROP SOURCE IF EXISTS s1;

> /* A */ CREATE MATERIALIZED SOURCE s1
  FROM KAFKA BROKER '${testdrive.kafka-addr}' TOPIC 'testdrive-upsert-unique-${testdrive.seed}'
  FORMAT AVRO USING CONFLUENT SCHEMA REGISTRY '${testdrive.schema-registry-url}'
  ENVELOPE UPSERT;

> /* B */ SELECT COUNT(*) FROM s1;
1000000
"""
    )

예제 #11

0

파일 보기

class FastPathOrderByLimit(FastPath):
    """Benchmark the case SELECT * FROM materialized_view ORDER BY <key> LIMIT <i>"""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);

> CREATE MATERIALIZED VIEW v1 AS
  SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> SELECT COUNT(*) = 1000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> /* A */ SELECT 1;
1

> /* B */ SELECT f1 FROM v1 ORDER BY f1 DESC LIMIT 1000;
"""
        + "\n".join([str(x) for x in range(999000, 1000000)])
    )

예제 #12

0

파일 보기

class Insert(DML):
    """Measure the time it takes for an INSERT statement to return."""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);
"""
    )

    BENCHMARK = Td(
        """
> DROP TABLE IF EXISTS t1;

> /* A */ CREATE TABLE t1 (f1 INTEGER);
> /* B */ INSERT INTO t1 SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000)
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;
"""
    )

예제 #13

0

파일 보기

class OrderBy(Dataflow):
    """Benchmark ORDER BY as executed by the dataflow layer,
    in contrast with an ORDER BY executed using a Finish step in the coordinator"""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);

> CREATE MATERIALIZED VIEW v1 AS
  SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000) AS f1
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

# Just to spice things up a bit, we perform individual
# inserts here so that the rows are assigned separate timestamps

> INSERT INTO ten VALUES (0);

> INSERT INTO ten VALUES (1);

> INSERT INTO ten VALUES (2);

> INSERT INTO ten VALUES (3);

> INSERT INTO ten VALUES (4);

> INSERT INTO ten VALUES (5);

> INSERT INTO ten VALUES (6);

> INSERT INTO ten VALUES (7);

> INSERT INTO ten VALUES (8);

> INSERT INTO ten VALUES (9);

> SELECT COUNT(*) = 1000000 FROM v1;
true
"""
    )

    BENCHMARK = Td(
        """
> DROP VIEW IF EXISTS v2
  /* A */

# explicit LIMIT is needed for the ORDER BY to not be optimized away
> CREATE MATERIALIZED VIEW v2 AS SELECT * FROM v1 ORDER BY f1 LIMIT 999999999999

> SELECT COUNT(*) FROM v2
  /* B */
1000000
"""
    )

예제 #14

0

파일 보기

class FastPathFilterIndex(FastPath):
    """Measure the time it takes for the fast path to filter our all rows from a materialized view using an index and return"""

    INIT = Td(
        """
> CREATE TABLE ten (f1 INTEGER);
> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);

> CREATE MATERIALIZED VIEW v1 AS
  SELECT
  a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) AS f1
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6;

> SELECT COUNT(*) = 1000000 FROM v1;
true
"""
    )

    # Since an individual query of this particular type being benchmarked takes 1ms to execute, the results are susceptible
    # to a lot of random noise. As we can not make the query any slower by using e.g. a large dataset,
    # we run the query 100 times in a row and measure the total execution time.

    BENCHMARK = Td(
        """
> BEGIN

> /* A */ SELECT 1;
1
"""
        + "\n".join(
            [
                """
> SELECT * FROM v1 WHERE f1 = 1;
1
1
1
1
1
1
1
1
1
1
"""
                for i in range(0, 100)
            ]
        )
        + """
> /* B */ SELECT 1;
1

"""
    )

예제 #15

0

파일 보기

class KafkaRecovery(KafkaScenario):
    SHARED = Td(
        """
$ set keyschema={
    "type": "record",
    "name": "Key",
    "fields": [
        {"name": "f1", "type": "long"}
    ]
  }

$ set schema={
        "type" : "record",
        "name" : "test",
        "fields" : [
            {"name":"f2", "type":"long"}
        ]
    }

$ kafka-create-topic topic=kafka-recovery partitions=8

$ kafka-ingest format=avro topic=kafka-recovery key-format=avro key-schema=${keyschema} schema=${schema} publish=true repeat=10000000
{"f1": ${kafka-ingest.iteration}} {"f2": ${kafka-ingest.iteration}}
"""
    )

    INIT = Td(
        """
> CREATE MATERIALIZED SOURCE s1
  FROM KAFKA BROKER '${testdrive.kafka-addr}' TOPIC 'testdrive-kafka-recovery-${testdrive.seed}'
  FORMAT AVRO USING CONFLUENT SCHEMA REGISTRY '${testdrive.schema-registry-url}'
  ENVELOPE UPSERT;

# Make sure we are fully caught up before continuing
> SELECT COUNT(*) = 10000000 FROM s1;
true
"""
    )

    BEFORE = Lambda(lambda e: e.RestartMz())

    BENCHMARK = Td(
        """
> /* A */ SELECT 1;
1

> /* B */ SELECT COUNT(*) = 10000000 FROM s1;
true
"""
    )

예제 #16

0

파일 보기

class Retraction(Dataflow):
    """Benchmark the time it takes to process a very large retraction"""

    BENCHMARK = Td(
        """
> DROP VIEW IF EXISTS v1;

> DROP TABLE IF EXISTS ten;

> CREATE TABLE ten (f1 INTEGER);

> INSERT INTO ten VALUES (0),(1),(2),(3),(4),(5),(6),(7),(8),(9);

> CREATE MATERIALIZED VIEW v1 AS
  SELECT a1.f1 +
  (a2.f1 * 10) +
  (a3.f1 * 100) +
  (a4.f1 * 1000) +
  (a5.f1 * 10000) +
  (a6.f1 * 100000)
  FROM ten AS a1, ten AS a2, ten AS a3, ten AS a4, ten AS a5, ten AS a6

> SELECT COUNT(*) = 1000000 AS f1 FROM v1;
true

> /* A */ SELECT 1;
1

> DELETE FROM ten;

> /* B */ SELECT COUNT(*) FROM v1;
0
"""
    )

예제 #17

0

파일 보기

파일: scenarios.py 프로젝트: benesch/materialize

    def benchmark(self) -> MeasurementSource:
        return Td("""
> DROP SINK IF EXISTS sink1;

> DROP SOURCE IF EXISTS sink1_check CASCADE;
  /* A */

> CREATE SINK sink1 FROM source1
  INTO KAFKA BROKER '${testdrive.kafka-addr}' TOPIC 'testdrive-sink-output-${testdrive.seed}'
  KEY (f1)
  WITH (reuse_topic=true)
  FORMAT AVRO USING CONFLUENT SCHEMA REGISTRY '${testdrive.schema-registry-url}'

# Wait until all the records have been emited from the sink, as observed by the sink1_check source

> CREATE SOURCE sink1_check
  FROM KAFKA BROKER '${testdrive.kafka-addr}' TOPIC 'testdrive-sink-output-${testdrive.seed}'
  KEY FORMAT AVRO USING CONFLUENT SCHEMA REGISTRY '${testdrive.schema-registry-url}'
  VALUE FORMAT AVRO USING CONFLUENT SCHEMA REGISTRY '${testdrive.schema-registry-url}'
  ENVELOPE UPSERT;

> CREATE MATERIALIZED VIEW sink1_check_v AS SELECT COUNT(*) FROM sink1_check;

> SELECT * FROM sink1_check_v
  /* B */
""" + str(self.n()))

예제 #18

0

파일 보기