Python FileIO.setToFileの例

プログラミング言語: Python

名前空間/パッケージ名: fileIO

クラス/型: FileIO

メソッド/関数: setToFile

hotexamples.comのコード掲載数: 2

Python FileIO.setToFile - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのfileIO.FileIO.setToFileの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

よく使われるメソッド

表示非表示

FileIO(4)

deleteFileContents(4)

writeJsonFile(3)

fileToSet(3)

__init__(3)

readJsonFile(3)

createSiteIndexFile(2)

get_filename(2)

setToFile(2)

readAsString(1)

writeFile(1)

update_file(1)

read_csv(1)

read_as_vector(1)

overwrite(1)

readAsPosInt(1)

print_to_file(1)

pathJoin(1)

mkdir(1)

loadFile(1)

get_text_from(1)

fileRead(1)

create_file(1)

createSiteFileSetup(1)

writeToFile(1)

コード例 #1

ファイルを表示

ファイル: crawler.py プロジェクト: amahesh98/Chefmate

    def runSitemapCrawler(self):
        startTime = time.time()
        headers = {
            'User-Agent':
            "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Mobile Safari/537.36"
        }
        xmlQueue = set()
        xmlQueue.add(self.sitemapURL)
        htmlQueue = set()
        log('sitemap', 'Crawling XML Sitemap for ' + self.siteName)

        while (len(xmlQueue) != 0):
            nextParse = requests.get(xmlQueue.pop(), headers=headers)
            newXMLLinks = self.findNewLinksXML(nextParse)
            for link in newXMLLinks:
                if '.xml' in link:
                    if 'archive' not in link:
                        xmlQueue.add(link)
                else:
                    htmlQueue.add(link)

        FileIO.deleteFileContents(self.crawledFile)
        FileIO.setToFile(htmlQueue, self.crawledFile)
        log(
            'time', 'Finished crawling XML sitemap for ' + self.siteName +
            ' in ' + str(time.time() - startTime) + ' seconds')

コード例 #2

ファイルを表示

ファイル: crawler.py プロジェクト: amahesh98/Chefmate

    def runSpider(self, iterations):
        startTime = time.time()
        for i in range(0, iterations):
            self.queue = FileIO.fileToSet(self.queueFile)
            self.crawled = FileIO.fileToSet(self.crawledFile)

            newLinks = set()
            newCrawledLinks = set()

            while (len(self.queue) != 0):
                nextLink = self.queue.pop()
                res = self.crawlPage(nextLink)
                newCrawledLinks.add(nextLink)
                newLinks = newLinks.union(res)

            FileIO.deleteFileContents(self.queueFile)
            FileIO.setToFile(newLinks, self.queueFile)
            FileIO.setToFile(newCrawledLinks, self.crawledFile)

        FileIO.writeJsonFile(self.outlinkGraph.nodes, self.outlinkGraphFile)
        FileIO.writeJsonFile(self.inlinkGraph.nodes, self.inlinkGraphFile)

        log(
            'time', "Crawler for " + self.siteName +
            " execution Finished. Runtime: " + str(time.time() - startTime) +
            "seconds. Total links crawled: " + str(self.numCrawled))