Python LSA.start 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: lsa

클래스/타입: LSA

메소드/함수: start

hotexamples.com에서의 예제들: 1

Python LSA.start - 1개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 lsa.LSA.start에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

LSA(11)

document_topics(1)

filter_singular_values(1)

fit(1)

folding_in(1)

get_salience_scores(1)

get_top_sent_indices(1)

plot(1)

start(1)

topic_labels(1)

train(1)

transform_plot(1)

unigram_smoothing(1)

word_topics(1)

예제 #1

파일 보기

파일: fakenewsdetection.py 프로젝트: aniketbharti/FAKE-NEWS-DETECTION

    def initialize(self, article):

        similarity_array = []
        # similarity_array.append(article)
        test = self.articleSummerization(article, 1)  # in one line

        # for i in summerizedSentence:
        # 	test=str(i)
        print('-------Summerized Title-------')
        print(test)

        sitesContainingArticle, scrapId = self.googleSearch(article)

        print('sites_length_after_google search', len(sitesContainingArticle))

        for index, url in enumerate(sitesContainingArticle):
            print('URL ', url, scrapId[index], '\n')

            raw_html = self.simple_get(url)  #full page site content
            try:
                soup = BeautifulSoup(
                    raw_html, 'html.parser')  #proper formattinh raw_html
                # print('hua idhar')
                # print(soup)

            except Exception as e:
                print(e)
                return 0, []

            _ = [s.extract() for s in soup('script')]

            soup_article = soup.find_all('div', {"class": scrapId[index]})

            # print(soup_article)

            article_string = ''
            for data in soup_article:
                # print(data)
                article_string += data.text
                # article_string += data.text
            # print(article_string)
            if not article_string == '':
                # print('aaya\n')
                similarity_array.append(
                    self.articleSummerization(article_string, 5))

            else:
                print('nahi aaya\n')
                pass

        # for c in similarity_array:
        # 	print('\n\n\n',c)

        mylsa = LSA()
        wmdinit = WordMoverDistance()

        length = len(similarity_array)
        # print(length)

        if length == 0:
            return 0, sitesContainingArticle
        else:
            count = 0
            score_array = []

            while (count < length):
                print('\n\n', similarity_array[count])
                lsa_similarity = mylsa.start([article + ' ' + article] +
                                             similarity_array, count + 1)
                wmdinit.data_accept(similarity_array[count], article)
                wmddistance = wmdinit.model()

                print('wordmover distance is', wmddistance)

                fuzzy = Fuzzy(lsa_similarity, wmddistance)
                score = fuzzy.get_score_data()
                # score = score/10
                print('final score ', score)

                score_array.append(score)
                count = count + 1

            score_array = sorted(score_array, key=lambda x: x, reverse=True)

            return min(100,
                       np.around(sum(score_array[:2]), decimals=2) *
                       100), sitesContainingArticle


# wmdinit=wordmover.WordMoverDistance(titles[count],titles[0])
# wmddistance=wmdinit.model()