def test_set_text_from_html_body(self): html = """ <tr> <td><font face="MS ゴシック">ですので、掃除をしている私が言うのもなんですが、ホテルに泊まった時の注意事項を!<br> (私はホテルに泊まる時は、まず必ずこうしてます)<br> <br> <br> </font></td> </tr> <tr> <td><font face="MS ゴシック"><strong>1.浴室は使用前に一度、熱湯消毒をしましょう!<br> <br> 1.トイレの便座も一度拭きましょう!<br> """ item = WebItem() item.html_body = html item.set_text_from_html_body()
def normalize_query(query): web_item = WebItem() keywords = web_item.pick_nouns_and_verbs(query) normalized_query = ' '.join(keywords) return normalized_query