Python Utility.uniquify 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: utils

클래스/타입: Utility

메소드/함수: uniquify

hotexamples.com에서의 예제들: 2

Python Utility.uniquify - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 utils.Utility.uniquify에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Utility(6)

flatten_list(3)

generate_secret_value(2)

Truncate(2)

generate_sensing_matrix(2)

init_sizes(2)

find_domain_name(2)

load_data(2)

UpdateGist(2)

uniquify(2)

MD5(2)

init_preprocess_func(2)

readDataFromMemoy(1)

saveUser(1)

get_save_directory(1)

sentence_splitter(1)

normalize_invalid_url(1)

no_of_classes(1)

make_directory(1)

load_imagenet_model(1)

set_stem(1)

stats(1)

lemmatize(1)

summANDsave(1)

summary_board(1)

Base64(1)

get_models(1)

GitLogin(1)

CountRange(1)

CreateGist(1)

FormatJSON(1)

GET(1)

GetGist(1)

GetGistRaw(1)

POST(1)

get_date_time(1)

clean_html(1)

convert_to_xml(1)

currentTimeMillis(1)

currentTimeSeconds(1)

filter_by_question_sentence_words_intersect(1)

find_email_domain(1)

Base64Size(1)

write_file(1)

예제 #1

파일 보기

 def _on_link(self, page, domain):
     self.logger.info("Search email address on link to another page")
     _email_founds = []
     # Find all possible link element
     links = page.findAll('a')
     # Find all candidate link with keyword on html page
     keyword_html_link = self._find_keyword_in_html_text(links)
     # Find all candidate link with keyword on url
     keyword_url_link = self._find_keyword_in_url(links, domain)
     # Merge the url result, remove duplicate url
     candidate_links = Utility.uniquify(keyword_html_link +
                                        keyword_url_link)
     # Check for invalid url and try to fix it
     invalid_url = [
         uri for uri in candidate_links if not cfg.url_regex.match(uri)
     ]
     try_fix_invalid_url = map(
         lambda _uri: Utility.normalize_invalid_url(_uri, domain),
         invalid_url)
     # Filter invalid url
     candidate_links = candidate_links + try_fix_invalid_url
     candidate_links = Utility.uniquify(
         [_uri for _uri in candidate_links if cfg.url_regex.match(_uri)])
     try:
         for link in candidate_links:
             self.logger.info("Go to next link: " + link)
             try:
                 self._go_to_page(link)
             except Exception, err:
                 print str(err)
                 continue
             soup = BS(self.driver.page_source, "lxml")
             email = self._on_page(soup, domain)
             _email_founds.append(email)
         return _email_founds if not _email_founds else Utility.flatten_list(
             _email_founds)

예제 #2

파일 보기

 def _filter_email_candidates(candidates):
     # Remove duplicate element
     candidates = Utility.uniquify(
         map(lambda email: str(email).strip().lower(),
             [] if not candidates else candidates))
     # Filter email that contain blacklist word
     candidates = filter(
         lambda email: not re.match(cfg.get_blacklist_regex(), email),
         candidates)
     # Filter short email
     candidates = [
         candidate for candidate in candidates if len(candidate) > 5
     ]
     # Filter email that contain newline and space
     candidates = [
         candidate for candidate in candidates if '\n' not in candidate
         and ' ' not in candidate and '\t' not in candidate
     ]
     return candidates