Python Readability.FleschReadingEase 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: readability.readability

클래스/타입: Readability

메소드/함수: FleschReadingEase

hotexamples.com에서의 예제들: 4

Python Readability.FleschReadingEase - 4개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 readability.readability.Readability.FleschReadingEase에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Readability(7)

FleschKincaidGradeLevel(4)

FleschReadingEase(4)

GunningFogIndex(3)

SMOGIndex(3)

ARI(2)

ColemanLiauIndex(2)

LIX(2)

RIX(2)

ari(1)

flesch(1)

예제 #1

파일 보기

def get_scores(text):
    analysis = Readability(text)
    results = {}
    results['ari'] = analysis.ARI()
    results['fkgl'] = analysis.FleschKincaidGradeLevel()
    results['cli'] = analysis.ColemanLiauIndex()
    results['fre'] = analysis.FleschReadingEase()
    results['gfi'] = analysis.GunningFogIndex()
    results['lix'] = analysis.LIX()
    results['rix'] = analysis.RIX()
    results['smog'] = analysis.SMOGIndex()
    return results

예제 #2

파일 보기

파일: models.py 프로젝트: nickdotreid/vizhealthlit

    def setup(self):
        self.words = []
        self.nouns = {}
        self.verbs = {}
        self.similarity = -1

        self.active_words = []
        self.passive_words = []
        
        self.direct_words = []
        self.indirect_words = []

        self.positive_words = []
        self.negative_words = []

        self.line_break = False

        rd = Readability(self.text)
        self.FleschReadingEase = rd.FleschReadingEase()
        self.FleschKincaidGradeLevel = rd.FleschKincaidGradeLevel()
        self.GunningFogIndex = rd.GunningFogIndex()
        self.SMOGIndex = rd.SMOGIndex()

예제 #3

파일 보기

def getReadabilities(string):
    read = Readability(string)
    return read.FleschReadingEase(), read.FleschKincaidGradeLevel()

예제 #4

파일 보기

class Article(ArticleText):
    def __init__(self, url, raw=None):
        if not raw:
            raw = requests.get(url).content
        soup = BeautifulSoup(raw, 'lxml')
        self.url = url
        self.metadata = self.getMeta(soup)
        if self.metadata['content']:
            content = self.metadata['content'].find("section")
            if not content:
                content = self.metadata['content']
            content = " ".join(list(content.stripped_strings))
        else:
            raise Exception(
                "No content found for", url,
                "\nPlease add custom constraints [if any] in attributes_list.py"
            )
        self.rd = Readability(content)
        super().__init__(self.metadata['title'], content)

    def iterTillHit(self, soup, arglist, target=None):
        for arg in arglist:
            cont = soup.find(*arg)
            if cont:
                if not target:
                    return cont
                elif cont.text:
                    return cont.text
                else:
                    return cont[target]
        else:
            return None

    def getMeta(self, soup):
        # Title, Keywords, Description, Author, Published
        attr_d = {}
        attr_d['title'] = self.iterTillHit(soup, TITLE_L, 'content')
        attr_d['keyword'] = self.iterTillHit(soup, KEYWORD_L, 'content')
        attr_d['desc'] = self.iterTillHit(soup, DESC_L, 'content')
        attr_d['author'] = self.iterTillHit(soup, AUTHOR_L, 'content')
        attr_d['published'] = self.iterTillHit(soup, PUBLISHED_L, 'content')
        attr_d['content'] = self.iterTillHit(soup, CONTENT_L)

        return attr_d

    def num_hrefs(self):
        return len(self.metadata['content'].findAll("a", href=True))

    def num_self_hrefs(self):
        site = urlparse(self.url)[1]
        return sum([
            1 for href in self.metadata['content'].findAll("a", href=True)
            if site in href['href']
        ])

    def num_imgs(self):
        return len(self.metadata['content'].findAll("img"))

    def num_videos(self):
        return len(self.metadata['content'].findAll("iframe"))

    def num_keywords(self):
        return len(self.metadata['keyword'].split(
            ",")) if self.metadata['keyword'] else 0

    def daystuff(self):
        weekday_dict = [["weekday_is_monday", 0], ["weekday_is_tuesday", 0],
                        ["weekday_is_wednesday", 0],
                        ["weekday_is_thursday", 0], ["weekday_is_friday", 0],
                        ["weekday_is_saturday", 0], ["weekday_is_sunday", 0],
                        ["is_weekend", 0]]

        try:
            weekday = dateparser.parse(self.metadata['published']).weekday()
            weekday_dict[weekday][1] = 1
            weekday_dict[-1][1] = 1 if weekday > 4 else 0
        except TypeError:
            pass
        finally:
            return dict(weekday_dict)

    def lda(self):
        lda_dict = getLDA(self.metadata['title'])[0]
        lda_dict = {"LDA_%.2d" % index: val for index, val in lda_dict}
        return lda_dict

    def readability(self):
        readability_dict = {
            'ARI': self.rd.ARI(),
            'FleschReadingEase': self.rd.FleschReadingEase(),
            'FleschKincaidGradeLevel': self.rd.FleschKincaidGradeLevel(),
            'GunningFogIndex': self.rd.GunningFogIndex(),
            'SMOGIndex': self.rd.SMOGIndex(),
            'ColemanLiauIndex': self.rd.ColemanLiauIndex(),
            'LIX': self.rd.LIX(),
            'RIX': self.rd.RIX()
        }
        return readability_dict

    def stats(self):
        attributes = [
            'num_hrefs', 'num_self_hrefs', 'num_imgs', 'num_videos',
            'num_keywords'
        ]
        meta_dict = super().stats()
        meta_dict.update({func: getattr(self, func)() for func in attributes})
        meta_dict.update(self.daystuff())
        meta_dict.update(self.lda())
        meta_dict.update(self.readability())
        return meta_dict