Python WebSearcher示例

编程语言: Python

类/类型: WebSearcher

hotexamples.com的示例: 6

Python WebSearcher - 已找到6个示例。这些是从开源项目中提取的最受好评的WebSearcher现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

SearchEngine(2)

parse_serp(2)

download_locations(1)

extract_components(1)

load_soup(1)

make_soup(1)

webSearchCall(1)

webSearcher(1)

示例#1

显示文件

文件： WebAndFileSearcher.py 项目： Abdul016/Python

def webAndFile():
    data_load.get_traversal_data()
    file_data = indexer.read_data()
    web_data = WebParser.webData()
    print("File data search:")
    print("====================================================")
    FileSearcher.fileSearch(file_data)
    print("Web data search:")
    print("====================================================")
    WebSearcher.webSearcher(web_data)

示例#2

显示文件

文件： Neil_Research.py 项目： NeilVakharia1712/Research2020

def search(query, file, num):
    parent_dir = 'RawHTML/' + file
    dir = str(num)
    path = os.path.join(parent_dir, dir)
    os.mkdir(path)
    se = ws.SearchEngine()
    se.search(query)
    soup = ws.make_soup(se.html)
    results = ws.parse_serp(soup)
    se.save_serp(save_dir=path)
    results = [dict(item, question_number=num) for item in results]
    return results

示例#3

显示文件

文件： WebSearcher_Combine.py 项目： Abdul016/Python

import WebSearcher

WebSearcher.webSearchCall()

示例#4

显示文件

import argparse
import pandas as pd
import WebSearcher as ws

parser = argparse.ArgumentParser()
parser.add_argument("-q", "--query", type=str, help="A search query")
args = parser.parse_args()

if not args.query:
    print('Must include -q arg')
else:
    print(f'Test search | query: {args.query}')

    # Initialize crawler
    se = ws.SearchEngine()

    # Conduct Search
    se.search(args.query)

    # Parse Results
    se.parse_results()

    # Shape as dataframe
    results = pd.DataFrame(se.results)
    print(results.head())

    try:
        se.save_serp(append_to='test_serp_save.json')
        se.save_results(append_to='test_results_save.json')
    except Exception as e:

示例#5

显示文件

文件： test_locations.py 项目： emmalurie/WebSearcher

""" Download and use locations
"""
import os
import pandas as pd
import WebSearcher as ws

# Retrieve and save latest location data
data_dir = './location_data'
ws.download_locations(data_dir)

# Read it back in
f = os.listdir(data_dir)[-1]  # Last file
fp = os.path.join(data_dir, f)  # File path
locs = pd.read_csv(fp)  # Read

# locs.info()
#
# <class 'pandas.core.frame.DataFrame'>
# RangeIndex: 102029 entries, 0 to 102028
# Data columns (total 7 columns):
# Criteria ID       102029 non-null int64
# Name              102029 non-null object
# Canonical Name    102029 non-null object
# Parent ID         101788 non-null float64
# Country Code      102013 non-null object
# Target Type       102029 non-null object
# Status            102029 non-null object
# dtypes: float64(1), int64(1), object(5)
# memory usage: 5.4+ MB

# locs.iloc[0]

示例#6

显示文件

文件： test_parse.py 项目： gitronald/WebSearcher

""" Test parse
"""

import argparse
import pandas as pd
import WebSearcher as ws

parser = argparse.ArgumentParser()
parser.add_argument("-f", "--filepath", help="The SERP html file")
args = parser.parse_args()

if not args.filepath:
    print('Must include -f arg')
else:
    soup = ws.load_soup(args.filepath)
    parsed = ws.parse_serp(soup)
    results = pd.DataFrame(parsed)

    cmpts = ws.extract_components(soup)