Python DbManager.rebuild_structure Exemples

Langage de programmation: Python

Espace de nommage/Pack: db_manager

Class/Type: DbManager

Méthode/Fonction: rebuild_structure

Exemples au hotexamples.com: 1

Python DbManager.rebuild_structure - 1 exemples trouvés. Ce sont les exemples réels les mieux notés de db_manager.DbManager.rebuild_structure extraits de projets open source. Vous pouvez noter les exemples pour nous aider à en améliorer la qualité.

Méthodes fréquemment utilisées

Afficher Cacher

DbManager(30)

commit(3)

insert_dataframe(3)

get_document(2)

get_max_freq_doc(2)

version(2)

add_new_property(2)

resource_exists(1)

get_sensors_by_station_id(1)

get_user_fitness_ratings_array(1)

insert_and_get_min_user_id(1)

insert_document(1)

insert_max_freq_doc(1)

insert_rating(1)

query_all_data_from_table(1)

rebuild_structure(1)

remove_ratings(1)

run_sql(1)

get_one_engine(1)

save_full_index(1)

save_resource(1)

save_user_workout(1)

select_workout_by_id(1)

select_workout_by_intensity_and_bodypart(1)

select_workout_by_name(1)

select_workouts_by_user_parameters(1)

set_version(1)

setup_db(1)

update_visitor(1)

get_selected_nwif_index(1)

close(1)

append_new_org(1)

fetch_one(1)

commit_changes(1)

connect(1)

connect_db(1)

convert_date_string_to_datetime(1)

delete_resource(1)

delete_rows_with_reg_id(1)

delete_user_check(1)

engine(1)

exec(1)

executeScript(1)

fetch_resource(1)

get_movies(1)

find_org_by_ip(1)

find_post(1)

get_all_stations_by_param(1)

get_data_by_sensors_ids(1)

get_data_by_stations_ids(1)

Méthodes fréquemment utilisées

DbManager (30)

commit (3)

insert_dataframe (3)

get_document (2)

get_max_freq_doc (2)

version (2)

add_new_property (2)

resource_exists (1)

get_sensors_by_station_id (1)

get_user_fitness_ratings_array (1)

Méthodes fréquemment utilisées

insert_and_get_min_user_id (1)

insert_document (1)

insert_max_freq_doc (1)

insert_rating (1)

query_all_data_from_table (1)

rebuild_structure (1)

remove_ratings (1)

run_sql (1)

get_one_engine (1)

save_full_index (1)

save_resource (1)

save_user_workout (1)

select_workout_by_id (1)

select_workout_by_intensity_and_bodypart (1)

select_workout_by_name (1)

select_workouts_by_user_parameters (1)

set_version (1)

setup_db (1)

update_visitor (1)

get_selected_nwif_index (1)

Méthodes fréquemment utilisées

save_resource (1)

save_user_workout (1)

select_workout_by_id (1)

select_workout_by_intensity_and_bodypart (1)

select_workout_by_name (1)

select_workouts_by_user_parameters (1)

set_version (1)

setup_db (1)

update_visitor (1)

get_selected_nwif_index (1)

close (1)

append_new_org (1)

fetch_one (1)

commit_changes (1)

connect (1)

connect_db (1)

convert_date_string_to_datetime (1)

delete_resource (1)

delete_rows_with_reg_id (1)

delete_user_check (1)

engine (1)

exec (1)

executeScript (1)

fetch_resource (1)

get_movies (1)

find_org_by_ip (1)

find_post (1)

get_all_stations_by_param (1)

get_data_by_sensors_ids (1)

get_data_by_stations_ids (1)

Méthodes fréquemment utilisées

close (1)

append_new_org (1)

fetch_one (1)

commit_changes (1)

connect (1)

connect_db (1)

convert_date_string_to_datetime (1)

delete_resource (1)

delete_rows_with_reg_id (1)

delete_user_check (1)

engine (1)

exec (1)

executeScript (1)

fetch_resource (1)

get_movies (1)

find_org_by_ip (1)

find_post (1)

get_all_stations_by_param (1)

get_data_by_sensors_ids (1)

get_data_by_stations_ids (1)

add_question (1)

get_index_term (1)

get_last_user_workout (1)

get_last_user_workouts (1)

add_new_post (1)

get_movie (1)

get_one_coon (1)

Exemple #1

0

Afficher le fichier

Fichier : structure_manager.py Projet : carlos10seg/SearchEngine

def build_index_and_doc_collection_from_csv(self, fileName): count = -1 docsCount = 1662756 #1662756 => 1662757 - 1 (header) batchSize = 10000 #10000 loops = (int)(docsCount / batchSize) + 1 # 1662.757 + 1 builder = StructureBuilder() dbManager = DbManager() pickleManager = PickleManager() sub_list = [] from_list = 1 #1 to_list = 1662756 #1662756 #1650000 #100000 # drop and create the collections in mongo dbManager.rebuild_structure() # delete all pickle files pickleManager.remove_all_files() with open(fileName) as csvfile: csv_content = csv.reader(csvfile, delimiter=',') for row in csv_content: count += 1 if (count == 0 or count < from_list ): #skip the headers or the previous processed documents continue doc_id = int(row[2]) doc_content = row[0] dbManager.insert_document({ 'id': doc_id, 'content': doc_content }) # add to the sublist waiting to save the list in a batch operation sub_list.append({'id': doc_id, 'content': doc_content}) if count % batchSize == 0: # every batchSize documents send the work to process pool with multiprocessing.Pool( processes=max(multiprocessing.cpu_count() - 1, 1)) as pool: # create the index structure index_structures = pool.map( builder.get_stemmed_terms_frequencies_from_doc, sub_list) pickleManager.save_index_and_max_freq( index_structures, str(count)) print("%d : %d : %s" % (loops, count, datetime.datetime.now())) sub_list = [] # empty the list for the next ones. loops -= 1 if loops <= 1 and count == to_list and len(sub_list) > 0: with multiprocessing.Pool() as pool: # create the index structure index_structures = pool.map( builder.get_stemmed_terms_frequencies_from_doc, sub_list) pickleManager.save_index_and_max_freq( index_structures, str(count)) print("%d : %d : reminder: %s" % (loops, count, datetime.datetime.now())) if count == to_list: break print( "Saved docs and max_freq in mongo. Saved index structures in pickles: %s" % (datetime.datetime.now()))