Python Document примеры использования

Язык программирования: Python

Пространство имен/Пакет: Models.document

Класс/Тип: Document

Примеров на hotexamples.com: 4

Python Document - 4 примера найдено. Это лучшие примеры Python кода для Models.document.Document, полученные из open source проектов. Вы можете ставить оценку каждому примеру, чтобы помочь нам улучшить качество примеров.

Основные методы

Показать Скрыть

Document(2)

all_terms(1)

insertIL(1)

insertOL(1)

unique_terms_freq(1)

url(1)

Пример #1

Показать файл

Файл: linkanalyser.py Проект: satyasashi/Web-Crawler

 def extractLinksfromResponse(self, url, links):
     """analyses the incoming links from the response
   """
     for link in links:
         key = md5(link).hexdigest()
         if key in self.db.iterkeys():
             doc = self.db[key]
             doc.insertIL(url)
         else:
             newDo = Document(link)
             newDo.insertIL(url)
             #print type(newDo)
             #print type(key)
             self.db[key] = newDo

Пример #2

Показать файл

Файл: linkanalyser.py Проект: praveen97uma/Web-Crawler

 def extractLinksfromResponse(self, url, links):
     """analyses the incoming links from the response
   """
     for link in links:
         key = md5(link).hexdigest()
         if key in self.db.iterkeys():
             doc = self.db[key]
             doc.insertIL(url)
         else:
             newDo = Document(link)
             newDo.insertIL(url)
             # print type(newDo)
             # print type(key)
             self.db[key] = newDo

Пример #3

Показать файл

Файл: linkanalyser.py Проект: satyasashi/Web-Crawler

    def analyze(self, url, links):
        """creates a document and sets its outgoing links
      """
        self.db = shelve('database1', 'w')
        key = md5(url).hexdigest()
        #if the document is already in the database, just add its outgoing links

        if key in self.db.iterkeys():
            doc = self.db[key]
            doc.insertOL(links)
            doc.url = url
            document = open(self.retriever.filename(url)).read()
            doc.all_terms = self.term_extractor.get_terms(document)
            unique_terms = self.term_extractor.get_unique_terms(document)
            doc.unique_terms_freq = self.term_extractor.count_term_frequencies(
                unique_terms, document)
            #print self.db[key].outgoingLinks
        #if there is no document for the url, create a document and add its outgoing links
        if key not in self.db.iterkeys():
            newDoc = Document(url)
            newDoc.insertOL(links)
            newDoc.url = url
            document = open(self.retriever.filename(url)).read()
            newDoc.all_terms = self.term_extractor.get_terms(document)
            unique_terms = self.term_extractor.get_unique_terms(document)
            newDoc.unique_terms_freq = self.term_extractor.count_term_frequencies(
                unique_terms, document)
            self.db[key] = newDoc
            #print self.db[key].outgoingLinks
        #self.extractLinksfromResponse(url,links)
        self.db.close()

Пример #4

Показать файл

Файл: linkanalyser.py Проект: praveen97uma/Web-Crawler

    def analyze(self, url, links):
        """creates a document and sets its outgoing links
      """
        self.db = shelve("database1", "w")
        key = md5(url).hexdigest()
        # if the document is already in the database, just add its outgoing links

        if key in self.db.iterkeys():
            doc = self.db[key]
            doc.insertOL(links)
            doc.url = url
            document = open(self.retriever.filename(url)).read()
            doc.all_terms = self.term_extractor.get_terms(document)
            unique_terms = self.term_extractor.get_unique_terms(document)
            doc.unique_terms_freq = self.term_extractor.count_term_frequencies(unique_terms, document)
            # print self.db[key].outgoingLinks
        # if there is no document for the url, create a document and add its outgoing links
        if key not in self.db.iterkeys():
            newDoc = Document(url)
            newDoc.insertOL(links)
            newDoc.url = url
            document = open(self.retriever.filename(url)).read()
            newDoc.all_terms = self.term_extractor.get_terms(document)
            unique_terms = self.term_extractor.get_unique_terms(document)
            newDoc.unique_terms_freq = self.term_extractor.count_term_frequencies(unique_terms, document)
            self.db[key] = newDoc
            # print self.db[key].outgoingLinks
        # self.extractLinksfromResponse(url,links)
        self.db.close()