Python linkの例

プログラミング言語: Python

名前空間/パッケージ名: crawlerclass

メソッド/関数: link

hotexamples.comのコード掲載数: 2

Python link - 2件のコード例が見つかりました。すべてオープンソースプロジェクトから抽出されたPythonのcrawlerclass.linkの実例で、最も評価が高いものを厳選しています。コード例の評価を行っていただくことで、より質の高いコード例が表示されるようになります。

コード例 #1

ファイルを表示

ファイル: mycrawler.py プロジェクト: somit/crawlers

def browse(browseUrlObject):
    browseUrl = browseUrlObject.url
    try:
        url = URL(browseUrl)
        dom = DOM(url.download())
        visited[browseUrl] = 1
        try:
            for anchor in dom.by_tag("a"):
                url = generateUrl(baseUrl, browseUrl, anchor.href)
                if url != "":
                    try:
                        dict[url].count = dict[url].count + 1
                    except:
                        dict[url] = link(browseUrl, 0, url)
        except:
            pass
    except:
        del dict[browseUrl]
        print browseUrlObject
        brokenUrls[browseUrl] = browseUrlObject
        pass

コード例 #2

ファイルを表示

ファイル: mycrawler.py プロジェクト: somit/crawlers

    if re.search(r"^/", href):
        return root + href
    if href.startswith("http://") or href.startswith("www."):
        return ""
    s = baseurl.split("/")
    s = baseurl.replace("/" + s.pop(), "/")
    return s + "href"


dict = {}
brokenUrls = {}
visited = {}

rootUrl = "http://winzip.com/win/en/index.htm"
baseUrl = "http://winzip.com"
dict[rootUrl] = link(baseUrl, 0, rootUrl)


def browse(browseUrlObject):
    browseUrl = browseUrlObject.url
    try:
        url = URL(browseUrl)
        dom = DOM(url.download())
        visited[browseUrl] = 1
        try:
            for anchor in dom.by_tag("a"):
                url = generateUrl(baseUrl, browseUrl, anchor.href)
                if url != "":
                    try:
                        dict[url].count = dict[url].count + 1
                    except: