Python DataAccess.get_rides_segments Beispiele

Programmiersprache: Python

Namespace / Paketname: data_access

Klasse / Typ: DataAccess

Methode / Funktion: get_rides_segments

Beispiele auf hotexamples.com: 4

Python DataAccess.get_rides_segments - 4 Beispiele gefunden. Dies sind die am besten bewerteten Python Beispiele für die data_access.DataAccess.get_rides_segments, die aus Open Source-Projekten extrahiert wurden. Sie können Beispiele bewerten, um die Qualität der Beispiele zu verbessern.

Häufig verwendete Methoden

Anzeigen Verbergen

DataAccess(30)

close(9)

get_rides_split(9)

get_random_rides(5)

sum_expenses(5)

insert(5)

get_rides(4)

skip_segment(2)

get_var_list(2)

get_rides_segments(2)

write_ride_segments(2)

create(2)

get_all_videos(2)

change_targa(1)

get_patients_with_arrhythmiacs(1)

get_patients(1)

get_instance(1)

get_admit_time(1)

have_comments_for_video(1)

have_video(1)

gen_all_videos_in_order(1)

delete_user_from_uuid(1)

get_pitems_dict(1)

Beispiel #1

Datei anzeigen

Datei: model_run.py Projekt: Keesiu/meta-kaggle

def get_data_segment_angles(model_id,
                            driver_id,
                            repeat,
                            test=False,
                            segment_version=1,
                            extra=((1, 1), 2)):
    seed = random.Random(x=driver_id + model_id)
    da = DataAccess()
    ngram_range, min_df = extra

    if test:
        set1 = list(da.get_rides_segments(driver_id, version=segment_version))
        set2 = list(
            da.get_random_rides(settings.BIG_CHUNK_TEST * repeat,
                                driver_id,
                                segments=True,
                                version=segment_version,
                                seed=seed))
    else:
        driver_train, driver_test = da.get_rides_split(driver_id,
                                                       settings.BIG_CHUNK,
                                                       segments=True,
                                                       version=segment_version)
        other_train = list(
            da.get_random_rides(settings.BIG_CHUNK * repeat,
                                driver_id,
                                segments=True,
                                version=segment_version,
                                seed=seed))
        other_test = list(
            da.get_random_rides(settings.SMALL_CHUNK,
                                driver_id,
                                segments=True,
                                version=segment_version))

        set1 = driver_train + other_train
        set2 = driver_test + other_test

    # create features for each (segment, angle, segment) tuple
    set1 = [[
        '%s_%s_%s' % (d[0][i - 1], d[1][i - 1], d[0][i])
        for i in xrange(1, len(d[0]))
    ] for d in set1]
    set2 = [[
        '%s_%s_%s' % (d[0][i - 1], d[1][i - 1], d[0][i])
        for i in xrange(1, len(d[0]))
    ] for d in set2]

    set1 = [util.get_list_string(d) for d in set1]
    set2 = [util.get_list_string(d) for d in set2]

    vectorizer = CountVectorizer(min_df=min_df, ngram_range=ngram_range)
    set1 = vectorizer.fit_transform(set1)
    set2 = vectorizer.transform(set2)
    return set1, set2

Beispiel #2

Datei anzeigen

Datei: model_run.py Projekt: BorisLenz/kaggle-driver-telematics

def get_data_segment_lengths(model_id, driver_id, repeat, test=False, segment_version=1, extra=((1,8),1)):
  seed = random.Random(x=driver_id+model_id)
  da = DataAccess()
  ngram_range, min_df = extra

  if test:
    set1 = list(da.get_rides_segments(driver_id, version=segment_version))
    set2 = list(da.get_random_rides(
        settings.BIG_CHUNK_TEST * repeat,
        driver_id,
        segments=True,
        version=segment_version,
        seed=seed
    ))
  else:
    driver_train, driver_test = da.get_rides_split(
        driver_id,
        settings.BIG_CHUNK,
        segments=True,
        version=segment_version
    )
    other_train = list(da.get_random_rides(
        settings.BIG_CHUNK * repeat,
        driver_id,
        segments=True,
        version=segment_version,
        seed=seed
    ))
    other_test = list(da.get_random_rides(
        settings.SMALL_CHUNK,
        driver_id,
        segments=True,
        version=segment_version
    ))

    set1 = driver_train + other_train
    set2 = driver_test + other_test

  # keep only lengths
  set1 = [d[0] for d in set1]
  set2 = [d[0] for d in set2]

  # convert to text
  set1 = [util.get_list_string(d) for d in set1]
  set2 = [util.get_list_string(d) for d in set2]

  vectorizer = CountVectorizer(min_df=min_df, ngram_range=ngram_range)
  set1 = vectorizer.fit_transform(set1)
  set2 = vectorizer.transform(set2)
  return set1, set2

Beispiel #3

Datei anzeigen

Datei: model_run.py Projekt: Keesiu/meta-kaggle

def get_data_segment_lengths(model_id,
                             driver_id,
                             repeat,
                             test=False,
                             segment_version=1,
                             extra=((1, 8), 1)):
    seed = random.Random(x=driver_id + model_id)
    da = DataAccess()
    ngram_range, min_df = extra

    if test:
        set1 = list(da.get_rides_segments(driver_id, version=segment_version))
        set2 = list(
            da.get_random_rides(settings.BIG_CHUNK_TEST * repeat,
                                driver_id,
                                segments=True,
                                version=segment_version,
                                seed=seed))
    else:
        driver_train, driver_test = da.get_rides_split(driver_id,
                                                       settings.BIG_CHUNK,
                                                       segments=True,
                                                       version=segment_version)
        other_train = list(
            da.get_random_rides(settings.BIG_CHUNK * repeat,
                                driver_id,
                                segments=True,
                                version=segment_version,
                                seed=seed))
        other_test = list(
            da.get_random_rides(settings.SMALL_CHUNK,
                                driver_id,
                                segments=True,
                                version=segment_version))

        set1 = driver_train + other_train
        set2 = driver_test + other_test

    # keep only lengths
    set1 = [d[0] for d in set1]
    set2 = [d[0] for d in set2]

    # convert to text
    set1 = [util.get_list_string(d) for d in set1]
    set2 = [util.get_list_string(d) for d in set2]

    vectorizer = CountVectorizer(min_df=min_df, ngram_range=ngram_range)
    set1 = vectorizer.fit_transform(set1)
    set2 = vectorizer.transform(set2)
    return set1, set2

Beispiel #4

Datei anzeigen

Datei: model_run.py Projekt: BorisLenz/kaggle-driver-telematics

def get_data_segment_angles_v2(model_id, driver_id, repeat, test=False, segment_version=1, extra=((1,3),1)):
  seed = random.Random(x=driver_id+model_id)
  da = DataAccess()
  ngram_range, min_df = extra

  if test:
    set1 = list(da.get_rides_segments(driver_id, version=segment_version))
    set2 = list(da.get_random_rides(
        settings.BIG_CHUNK_TEST * repeat,
        driver_id,
        segments=True,
        version=segment_version,
        seed=seed
    ))
  else:
    driver_train, driver_test = da.get_rides_split(
        driver_id,
        settings.BIG_CHUNK,
        segments=True,
        version=segment_version
    )
    other_train = list(da.get_random_rides(
        settings.BIG_CHUNK * repeat,
        driver_id,
        segments=True,
        version=segment_version,
        seed=seed
    ))
    other_test = list(da.get_random_rides(
        settings.SMALL_CHUNK,
        driver_id,
        segments=True,
        version=segment_version
    ))

    set1 = driver_train + other_train
    set2 = driver_test + other_test

  # create features for each (segment, angle, segment) tuple
  set1 = [['%s_%s' % (d[0][i-1], d[1][i-1]) for i in xrange(1, len(d[0]))] for d in set1]
  set2 = [['%s_%s' % (d[0][i-1], d[1][i-1]) for i in xrange(1, len(d[0]))] for d in set2]

  set1 = [util.get_list_string(d) for d in set1]
  set2 = [util.get_list_string(d) for d in set2]

  vectorizer = CountVectorizer(min_df=min_df, ngram_range=ngram_range)
  set1 = vectorizer.fit_transform(set1)
  set2 = vectorizer.transform(set2)
  return set1, set2