Python Cleaner.clean_df Examples

Programming Language: Python

Namespace/Package Name: Cleaner

Class/Type: Cleaner

Method/Function: clean_df

Examples at hotexamples.com: 1

Python Cleaner.clean_df - 1 examples found. These are the top rated real world Python examples of Cleaner.Cleaner.clean_df extracted from open source projects. You can rate examples to help us improve the quality of examples.

Frequently Used Methods

Show Hide

Cleaner(30)

clean_bmi(6)

Clean_Birthday(5)

Clean_Age(4)

clean_text(4)

clean_gender(3)

clean(3)

preprocess_text(2)

n_gram(2)

text_header_remover(2)

clean_file(2)

clean_empid(2)

__init__(2)

stop(1)

run(1)

replace(1)

remove_punct(1)

remove_non_marked(1)

remove_nan(1)

remove_multiple_method_comments(1)

preprocess_danmu(1)

case_fold(1)

get_df(1)

get_data_category_count(1)

get_clean(1)

getDF(1)

cleanSubtitles(1)

extractDate(1)

edit_bulk_comments(1)

delete_tags(1)

clean_df(1)

getContent(1)

Example #1

Show file

File: MyCleaner.py Project: masies/CRA

files = [f for f in os.listdir("./processed")]

for x in range(0,len(files)):
	if x > 1:
		print("completed: ", round((x * 100) / len(files),1), "%           ", end='\r')
	file_name =  os.path.join("./processed", files[x])
	try:
		df = pd.read_csv(filepath_or_buffer = file_name, index_col=0, dtype = str, na_filter=False)
		# df = df.drop(["id_df"], axis=1)

		n_starting_triplets += len(df)
		cleaner = Cleaner(df, t5_tokenizer, stopwords, english_cache)

		cleaner.remove_non_marked()
		cleaner.clean_df()

		# final cleaning : remove methods which has more than one review
		cleaner.remove_multiple_method_comments()

		n_irrelevant_comments += cleaner.irrelevant_comments
		n_not_marked += cleaner.not_marked
		n_non_latin += cleaner.non_latin
		n_before_equals_after += cleaner.before_equals_after
		n_non_english += cleaner.non_english
		n_too_long += cleaner.too_long
		n_too_long_after += cleaner.too_long_after
		n_multiple_rev += cleaner.multiple_reviews

		n_comment_empty += cleaner.comment_empty
		n_code_before_empty += cleaner.code_before_empty