Python get_files 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: svm_util

메소드/함수: get_files

hotexamples.com에서의 예제들: 2

Python get_files - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 svm_util.get_files에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

 def generate_all_features(self):
   all_tokens = set()
   for directory in self.tokenized_input_dirs:
     print "Generating for dir", directory
     for f in get_files(directory):
       tokens = set([token for token in re.split(' |\r\n', open(f).read())])
       all_tokens = all_tokens | tokens
   pickle.dump(list(all_tokens), open('token_list.pkl', 'w'))
   print 'Dumped features'

예제 #2

파일 보기

 def generate_popular_features(self):
   all_tokens = set()
   for directory in self.tokenized_input_dirs:
     print "Generating for directory", directory
     intermediate_tokens = set()
     for f in get_files(directory):
       dir_pop = defaultdict(lambda: 0)
       tokens = [token for token in re.split(' |\r\n', open(f).read())]
       for token in tokens:
         dir_pop[token] += 1
       ordered = sorted(dir_pop.items(), key=lambda x: x[1], reverse=True)
       if len(ordered) > 50:
         ordered = ordered[:50]
       ordered = set([x[0] for x in ordered])
       intermediate_tokens = intermediate_tokens | ordered
     intermediate_tokens = sorted(list(intermediate_tokens), key=lambda x: dir_pop[x], reverse=True)
     if len(intermediate_tokens) > 10000:
       intermediate_tokens = intermediate_tokens[:10000]
     intermediate_tokens = set(intermediate_tokens)
     all_tokens = (all_tokens - intermediate_tokens) | (intermediate_tokens - all_tokens) 
   pickle.dump(list(all_tokens), open('token_list.pkl', 'w'))