Esempi in Python per PageClassifier

Linguaggio di programmazione: Python

Spazio dei nomi/nome del pacchetto: mlscrape

Classe/tipologia: PageClassifier

Esempi su hotexamples.com: 1

PageClassifier in Python: 1 esempio trovato. Questo è il miglior esempio reale in Python per mlscrape.PageClassifier, estratto da progetti open source. Lo puoi valutare, per aiutarci a migliorare la qualità dei nostri esempi.

Metodi utilizzati di frequente

Mostra Nascondi

load(1)

predict(1)

Esempio n. 1

Mostra file

File: extract.py Progetto: apendleton/hanuman

    def identify_bio_pages(self, firm):
        fts = FirmTrainingSet.get_for_firm(firm)
        spider = Spider(firm.domain, os.path.join(self.scrape_dir, str(fts.id) + ".db"), workers=4, retry_attempts=2)

        self.stdout.write("Identifying bio pages...\n")

        model = PageClassifier(os.path.join(self.model_dir, str(fts.id) + "_page.tgm"))
        model.load()

        self.stdout.write('Retrieving page features...\n')

        bio_pages = []
        for url in spider.urls:
            page = spider.get(url)
            cat = str(model.predict(page))
            if cat == 'bio':
                self.stdout.write(' * ' + url)
                bio_pages.append(url)

        self.stdout.write('Done.')

        return bio_pages