Python MyLog.debugの例、Log.Logger.MyLog.debug Pythonの例

コード例 #1

0

ファイルを表示

ファイル: GetFrequentQuestion.py プロジェクト: zhangyuankai2018/Knowledge-Map-and-Question-Answer

def pretreat_crawl_questions():
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    data_dir = "Information/大学/常问问题集/Data"
    pickle_dir = "Information/大学/常问问题集/Pickle"
    file_list = os.listdir(data_dir)
    function_logger.debug("大学数量：%d" % len(file_list))
    for file in file_list:
        university_name = file[:-9]
        function_logger.debug(university_name)
        function_logger.info("开始读取%s的常问问题集..." % university_name)
        with open(data_dir + "/" + file, "r", encoding="utf-8") as csvfile:
            csv_reader = csv.reader(csvfile)
            fqa_lines = []
            for row in csv_reader:
                if len(row) == 5:
                    line = {}
                    line["title"] = row[0]
                    line["from"] = row[1]
                    line["time"] = row[2]
                    line["question"] = row[3]
                    line["answer"] = row[4]
                    fqa_lines.append(line)
            fqa_lines.pop(0)
        function_logger.info("读取%s的常用问题集完成！" % university_name)
        function_logger.info("开始写入%s的常用问题集..." % university_name)
        with open(pickle_dir + "/" + university_name, "wb") as p_file:
            pickle.dump(fqa_lines, p_file)
        function_logger.info("写入%s的常用问题集完成！" % university_name)
    function_logger.info("数据处理完成！")

コード例 #2

0

ファイルを表示

ファイル: DataNormalize.py プロジェクト: zhangyuankai2018/Knowledge-Map-and-Question-Answer

def frequent_question_normalize(dir_path: str):
    """
    处理常用问题集(csv),问题和答案部分
    :param dir_path: 文件夹路径
    :return:
    """
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    function_logger.info("开始进行数据处理...")
    file_list = read_all_file_list(dir_path + "/source")
    for file in file_list:
        function_logger.debug(file)
        school_name = file.split("\\")[-1][:-9]
        function_logger.info("开始读取%s的常问问题集..." % school_name)
        with open(file, "r", encoding="utf-8") as csvfile:
            csv_reader = csv.reader(csvfile)
            fqa_lines = []
            for row in csv_reader:
                if len(row) == 5:
                    line = {}
                    line["title"] = row[0].replace(" ", "")
                    line["from"] = row[1]
                    line["time"] = row[2]
                    line["question"] = row[3].replace("\u3000", "").replace(
                        "\n", "，").replace(" ", "")
                    line["answer"] = row[4].replace("\ue63c", "").replace("\u3000", "").replace("\n", "，")\
                        .replace(" ", "").lstrip("，")
                    fqa_lines.append(line)
            fqa_lines.pop(0)
        function_logger.info("读取%s的常用问题集完成！" % school_name)
        function_logger.info("开始写入%s的常用问题集..." % school_name)
        with open(dir_path + "/预处理/pickle/" + school_name, "wb") as p_file:
            pickle.dump(fqa_lines, p_file)
        function_logger.info("写入%s的常用问题集完成！" % school_name)
    function_logger.info("数据处理完成！")

コード例 #3

0

ファイルを表示

def load_table_content(file_path: str):
    """
    通过excel表格加载表格内容
    :param file_path:
    :return:
    """
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    # 加载excel表格
    function_logger.info("加载表格:%s" % file_path.split("\\")[-1])
    wb = load_workbook(file_path)
    sheet_names = wb.sheetnames
    sheet_first = wb.get_sheet_by_name(sheet_names[0])
    table_head = []
    for item in range(1, sheet_first.max_column + 1):
        table_head.append(sheet_first.cell(row=1, column=item).value)
    function_logger.debug("表头:%s" % str(table_head))
    table_attr = {}
    for i_column in range(1, sheet_first.max_column + 1):
        column_name = sheet_first.cell(row=1, column=i_column).value
        column_value = set()
        for i_row in range(2, sheet_first.max_row + 1):
            column_value.add(
                sheet_first.cell(row=i_row, column=i_column).value)
        table_attr[column_name] = str(list(column_value))
    for key in table_attr:
        function_logger.debug(key)
        value_list = [
            value.replace("'", "").strip()
            for value in table_attr[key][1:-1].split(",")
        ]
        value_list.sort()
        function_logger.debug("列表长度:%d" % len(value_list))
        function_logger.debug(str(value_list))
    function_logger.info("加载表格:%s完成!" % file_path.split("\\")[-1])

コード例 #4

0

ファイルを表示

ファイル: MysqlOperation.py プロジェクト: zhangyuankai2018/Knowledge-Map-and-Question-Answer

def search_table_in_db(db_name: str) -> list:
    """
    查询数据库中表名
    :param db_name: 数据库名
    :return: 数据库中表名列表
    """
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    mydb = connect_mysql_with_db(db_name)
    mycursor = mydb.cursor()
    mycursor.execute("SHOW TABLES")
    tables = []
    function_logger.debug(db_name + "数据库中有以下表：")
    for table in mycursor:
        tables.append(table[0])
        function_logger.debug(table[0])
    return tables

コード例 #5

0

ファイルを表示

ファイル: MysqlOperation.py プロジェクト: zhangyuankai2018/Knowledge-Map-and-Question-Answer

def create_database(db_name: str):
    """
    创建数据库university_admission
    :param db_name: 数据库名
    :return:
    """
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    mydb = connect_mysql_without_db()
    mycursor = mydb.cursor()
    mycursor.execute("SHOW DATABASES")
    dbs = []
    function_logger.debug("数据库如下：")
    for db in mycursor:
        dbs.append(db[0])
        function_logger.debug(db[0])
    if db_name in dbs:
        function_logger.info("数据库" + db_name + "已存在!")
    else:
        mycursor.execute("CREATE DATABASE " + db_name)
        function_logger.info(db_name + "已创建!")

コード例 #6

0

ファイルを表示

ファイル: GetFrequentQuestion.py プロジェクト: zhangyuankai2018/Knowledge-Map-and-Question-Answer

def label_data():
    function_logger = MyLog(logger=sys._getframe().f_code.co_name).getlog()
    data_dir = "Information/大学/常问问题集/Data"
    pickle_dir = "Information/大学/常问问题集/Pickle"
    label_dir = "Information/大学/常问问题集/label"
    file_list = os.listdir(pickle_dir)
    function_logger.debug("大学数量：%d" % len(file_list))
    line_1 = []
    line_2 = []
    line_3 = []
    line_4 = []
    line_5 = []
    line_6 = []
    line_7 = []
    all_count = 0
    for file in file_list:
        print(file)
        university_name = file
        with open(pickle_dir + "/" + university_name, "rb") as p_file:
            lines = pickle.load(p_file)
        lines_count = len(lines)
        all_count += lines_count
    print(all_count)

コード例 #7

0

ファイルを表示