Python CASTLE.cycle示例

编程语言: Python

命名空间/包名称: castle

类/类型: CASTLE

方法/功能: cycle

hotexamples.com的示例: 2

Python CASTLE.cycle - 已找到2个示例。这些是从开源项目中提取的最受好评的castle.CASTLE.cycle现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

CASTLE(10)

insert(10)

cycle(2)

示例#1

显示文件

文件： diabetes_nn.py 项目： hallnath1/CASTLEGUARD

def main():
    args = app.parse_args()

    frame = pd.read_csv("diabetes.csv")
    headers = [
        "pregnancies", "glucose", "bloodPressure", "skinThickness", "insulin",
        "bmi", "diabetesPedigree", "age"
    ]
    sensitive_attr = "outcome"
    X_train, X_test, Y_train, Y_test = train_test_split(frame[headers],
                                                        frame[sensitive_attr],
                                                        test_size=0.3)
    print("Normal Data")
    NN(X_train, X_test, Y_train, Y_test)
    args.k = 7
    args.l = 1
    args.delta = 100
    args.mu = 100
    args.beta = 25
    Phi = [1, 10, 100, 1000]
    Big_Beta = [0.25, 0.5, 0.75, 1]
    acc_list = []
    for args.phi in Phi:
        print("Phi: {}".format(args.phi))
        avg_acc_list = []
        for args.big_beta in Big_Beta:
            print("Big Beta: {}".format(args.big_beta))
            train = X_train
            train[sensitive_attr] = Y_train
            train['pid'] = train.index
            global sarray
            sarray = []
            params = Parameters(args)
            stream = CASTLE(handler, headers, sensitive_attr, params)
            print("CASTLE START")
            counter = 0
            for (_, row) in train.iterrows():
                counter += 1
                stream.insert(row)
            while (counter <= args.delta):
                counter += 1
                stream.cycle()
            print("CASTLE END")
            grped = mlu.average_group(sarray)
            acc = NN(grped[headers], X_test, grped[sensitive_attr], Y_test)
            avg_acc_list.append(acc)
        acc_list.append(np.array(avg_acc_list))
    print(acc_list)
    X, Y = np.meshgrid(Big_Beta, np.log(Phi))
    fig = plt.figure()
    ax = plt.axes(projection='3d')
    ax.plot_surface(X,
                    Y,
                    np.array(acc_list),
                    rstride=1,
                    cstride=1,
                    cmap='winter',
                    edgecolor='none')
    ax.set_xlabel("Big Beta")
    ax.set_ylabel("Log(Phi)")
    ax.set_zlabel('AUC-ROC')
    plt.show()

示例#2

显示文件

def main():
    args = app.parse_args()
    print("Loading in data")
    frame = pd.read_csv("adult.csv")
    cat = {
        "workclass": [
            "Private", "Self-emp-not-inc", "Self-emp-inc", "Federal-gov",
            "Local-gov", "State-gov", "Without-pay", "Never-worked", "?"
        ],
        "maritalstatus": [
            'Married-civ-spouse', "Divorced", "Never-married", "Separated",
            "Widowed", "Married-spouse-absent", "Married-AF-spouse", "?"
        ],
        "occupation": [
            "Tech-support", "Craft-repair", "Other-service", "Sales",
            "Exec-managerial", "Prof-specialty", "Handlers-cleaners",
            "Machine-op-inspct", "Adm-clerical", "Farming-fishing",
            "Transport-moving", "Priv-house-serv", "Protective-serv",
            "Armed-Forces", "?"
        ],
        "relationship": [
            "Wife", "Own-child", "Husband", "Not-in-family", "Other-relative",
            "Unmarried", "?"
        ],
        "race": [
            "White", "Asian-Pac-Islander", "Amer-Indian-Eskimo", "Other",
            "Black", "?"
        ],
        "sex": ["Male", "Female", "?"],
        "nativecountry": [
            "United-States", "Cambodia", "England", "Puerto-Rico", "Canada",
            "Germany", "Outlying-US(Guam-USVI-etc)", "India", "Japan",
            "Greece", "South", "China", "Cuba", "Iran", "Honduras",
            "Philippines", "Italy", "Poland", "Jamaica", "Vietnam", "Mexico",
            "Portugal", "Ireland", "France", "Dominican-Republic", "Laos",
            "Ecuador", "Taiwan", "Haiti", "Columbia", "Hungary", "Guatemala",
            "Nicaragua", "Scotland", "Thailand", "Yugoslavia", "El-Salvador",
            "Trinadad&Tobago", "Peru", "Hong", "Holand-Netherlands", "?"
        ],
        "salary": [">50K", "<=50K"]
    }
    frame["pid"] = frame.index
    headers = [
        "age", "workclass", "fnlwgt", "maritalstatus", "educationnum",
        "occupation", "relationship", "race", "sex", "nativecountry",
        "capitalgain", "capitalloss", "hoursperweek"
    ]
    extended_headers = [
        "spcage", "minage", "maxage", "spcworkclass", "minworkclass",
        "maxworkclass", "spcfnlwgt", "minfnlwgt", "maxfnlwgt",
        "spcmaritalstatus", "minmaritalstatus", "maxmaritalstatus",
        "spceducationnum", "mineducationnum", "maxeducationnum",
        "spcoccupation", "minoccupation", "maxoccupation", "spcrelationship",
        "minrelationship", "maxrelationship", "spcrace", "minrace", "maxrace",
        "spcsex", "minsex", "maxsex", "spcnativecountry", "minnativecountry",
        "maxnativecountry", "spccapitalgain", "mincapitalgain",
        "maxcapitalgain", "spccapitalloss", "mincapitalloss", "maxcapitalloss",
        "spchoursperweek", "minhoursperweek", "maxhoursperweek"
    ]
    sensitive_attr = "salary"
    total = 0
    data = frame
    print("Processing Data")
    processed = mlu.process(data, cat)
    print("Processed Data")
    processed[sensitive_attr] = processed[sensitive_attr].astype('int')
    for i in ks:
        valid = validation(processed[headers], processed[sensitive_attr], i)
        print("K={} Accuracy: {}%".format(i, round(valid * 100), 5))
        total += valid
    print("Average Accuracy for Pre-CASTLE: {}%".format(
        round((total / len(ks)) * 100, 5)))

    frame["pid"] = frame.index
    args.k = 1000
    args.l = 1
    args.delta = 10000
    args.mu = 100
    args.beta = 50
    Phi = [1, 10, 100, 1000]
    Big_Beta = [0.35, 0.5, 0.75, 1]
    acc_list = []
    print("Size: {}".format(frame.shape))
    print("Starting Loop")
    for args.phi in Phi:
        print("Phi: {}".format(args.phi))
        avg_acc_list = []
        for args.big_beta in Big_Beta:
            print("Big Beta: {}".format(args.big_beta))
            average = 0
            for loop in range(0, 10):
                frame = pd.read_csv("adult.csv")
                print("Processing Data")
                processed = mlu.process(frame, cat)
                print("Processed Data")
                processed[sensitive_attr] = processed[sensitive_attr].astype(
                    'int')
                processed["pid"] = processed.index
                global sarray
                sarray = []
                params = Parameters(args)
                stream = CASTLE(handler, headers, sensitive_attr, params)
                print("Starting CASTLE")
                counter = 0
                for (_, row) in processed.iterrows():
                    counter += 1
                    stream.insert(row)
                while (counter <= args.delta):
                    print("Cycling")
                    counter += 1
                    stream.cycle()
                print("Finished CASTLE")
                print(len(sarray))
                dataframes = []
                for s in sarray:
                    df = s.to_frame().transpose()
                    dataframes.append(df)
                avg = pd.concat(dataframes, ignore_index=True, sort=True)
                avg_features = avg[extended_headers]
                total = 0
                avg[sensitive_attr] = avg[sensitive_attr].astype('int')
                for i in ks:
                    valid = validation(avg_features, avg[sensitive_attr], i)
                    # print("K={} Accuracy: {}%".format(i, round(valid*100), 5))
                    total += valid
                average += (total / 9)
                print("Phi: {}, BBeta: {}, Average Accuracy: {}%".format(
                    args.phi, args.big_beta, round((total / 9) * 100), 5))
            avg_acc_list.append(average / 10)
            print("Overall Average: {}%".format((average / 10) * 100))
        acc_list.append(np.array(avg_acc_list))

    X, Y = np.meshgrid(Big_Beta, np.log(Phi))
    fig = plt.figure()
    ax = plt.axes(projection='3d')
    ax.plot_surface(X,
                    Y,
                    np.array(acc_list),
                    rstride=1,
                    cstride=1,
                    cmap='winter',
                    edgecolor='none')
    ax.set_xlabel("Big Beta")
    ax.set_ylabel("Log(Phi)")
    ax.set_zlabel('Average Accuracy of KNN for Predicting Salary')
    plt.savefig("OrigData.png")