Python getrepinfo 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: dbconnect

메소드/함수: getrepinfo

hotexamples.com에서의 예제들: 3

Python getrepinfo - 3개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 dbconnect.getrepinfo에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

예제 #1

파일 보기

파일: mypreprocessing.py 프로젝트: ting20000119/Political-Leaning-Prediction-using-Machine-Learning

def getfeaturesuser():
    dbconnect.connect()
    mylist = dbconnect.getdeminfo()
    demdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    demdf["leaning"] = 1

    mylist = dbconnect.getrepinfo()
    repdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    repdf["leaning"] = 0

    frames = [demdf, repdf]
    df = pd.concat(frames)
    df = df.drop_duplicates()

    authorlist = df.author.unique()
    subredditlist = df.subreddit.unique()

    subredditlist = ['leaning'] + list(subredditlist)

    finallist = pd.DataFrame(index=list(authorlist), columns=subredditlist)
    finallist = finallist.fillna(0)

    subscriberlist = dbconnect.getsubscribercount()
    #    print(subscriberlist)
    for row in tqdm(df.iterrows()):  #each row is a tuple (index num, series)
        currentauthor = str(row[1]['author'])
        currentsubreddit = str(row[1]['subreddit'])
        currentleaning = str(row[1]['leaning'])
        currentscore = row[1]['score']
        currentsubscriber = subscriberlist[currentsubreddit]
        #        print(currentsubscriber)
        if currentsubscriber != 0:
            try:
                finallist.loc[currentauthor,
                              currentsubreddit] += (float(currentscore) /
                                                    currentsubscriber) * 1000
            except:
                print(currentsubreddit, currentsubscriber)
        #finallist.loc[currentauthor, 'author'] = currentauthor
        finallist.loc[currentauthor, 'leaning'] = currentleaning

#    print(finallist)
    finallist.reset_index(drop=True, inplace=True)
    finallist = finallist.sample(frac=1)
    finallist.reset_index(drop=True, inplace=True)
    #    print(finallist['politics'])
    #    print(finallist)
    finallist = finallist.drop(columns=['democrats', 'Republican'])
    deletedlist = dbconnect.getdeletedsubreddits()
    for delsub in deletedlist:
        try:
            finallist = finallist.drop(columns=delsub)
        except:
            continue

    dbconnect.disconnect()
    return finallist

예제 #2

파일 보기

def getfinallist():
    dbconnect.connect()
    mylist = dbconnect.getdeminfo()
    demdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    demdf["leaning"] = "dem"

    mylist = dbconnect.getrepinfo()
    repdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    repdf["leaning"] = "rep"

    frames = [demdf, repdf]
    df = pd.concat(frames)
    df = df.drop_duplicates()

    authorlist = df.author.unique()
    subredditlist = df.subreddit.unique()

    subredditlist = ['leaning'] + list(subredditlist)

    finallist = pd.DataFrame(index=list(authorlist), columns=subredditlist)
    finallist = finallist.fillna(0)

    for row in tqdm(df.iterrows()):  #each row is a tuple (index num, series)
        currentauthor = str(row[1]['author'])
        currentsubreddit = str(row[1]['subreddit'])
        currentleaning = str(row[1]['leaning'])
        currentscore = row[1]['score']
        #print(currentauthor)
        #print(currentsubreddit)
        finallist.loc[currentauthor, currentsubreddit] += float(currentscore)
        #finallist.loc[currentauthor, 'author'] = currentauthor
        finallist.loc[currentauthor, 'leaning'] = currentleaning

    for column in finallist:
        if column == 'leaning':
            continue
        max = finallist[column].max()
        if max == 0:
            continue
        max = float(max)
        mylist = finallist[column].astype('float')
        finallist[column] = mylist.divide(other=max).round(3)

    finallist.reset_index(drop=True, inplace=True)
    finallist = finallist.sample(frac=1)
    finallist.reset_index(drop=True, inplace=True)
    #    print(finallist['politics'])
    #    print(finallist)
    finallist = finallist.drop(columns=['democrats', 'Republican'])
    print(finallist)
    finallist.to_pickle("../activitydata2020.pkl")
    dbconnect.disconnect()

예제 #3

파일 보기

파일: mypreprocessing.py 프로젝트: ting20000119/Political-Leaning-Prediction-using-Machine-Learning

def getfeaturesmax():
    dbconnect.connect()
    mylist = dbconnect.getdeminfo()
    demdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    demdf["leaning"] = 0

    mylist = dbconnect.getrepinfo()
    repdf = pd.DataFrame(mylist, columns=['author', 'subreddit', 'score'])
    repdf["leaning"] = 1

    frames = [demdf, repdf]
    df = pd.concat(frames)
    df = df.drop_duplicates()

    authorlist = df.author.unique()
    subredditlist = df.subreddit.unique()

    subredditlist = ['leaning'] + list(subredditlist)

    finallist = pd.DataFrame(index=list(authorlist), columns=subredditlist)
    finallist = finallist.fillna(0)

    for row in tqdm(df.iterrows()):  #each row is a tuple (index num, series)
        currentauthor = str(row[1]['author'])
        currentsubreddit = str(row[1]['subreddit'])
        currentleaning = str(row[1]['leaning'])
        currentscore = row[1]['score']
        #print(currentauthor)
        #print(currentsubreddit)
        finallist.loc[currentauthor, currentsubreddit] += float(currentscore)
        #finallist.loc[currentauthor, 'author'] = currentauthor
        finallist.loc[currentauthor, 'leaning'] = currentleaning

    demlist = finallist[(finallist.leaning == '0')]
    #print("dem author count: ",len(demlist.index))
    replist = finallist[(finallist.leaning == '1')]
    #print("rep author count: ",len(replist.index))
    #print("attempting to balance so that dem/rep have same amount of author...")
    finallist = pd.concat([
        replist.head(min(len(replist.index), len(demlist.index))),
        demlist.head(min(len(replist.index), len(demlist.index)))
    ])
    demlist = finallist[(finallist.leaning == '0')]
    #print("dem author count: ",len(demlist.index))
    replist = finallist[(finallist.leaning == '1')]
    #print("rep author count: ",len(replist.index))

    #print(finallist)

    for column in finallist:
        if column == 'leaning':
            continue
        max = finallist[column].max()
        if max == 0:
            continue
        max = float(max)
        mylist = finallist[column].astype('float')
        finallist[column] = mylist.divide(other=max).round(3)

    finallist.reset_index(drop=True, inplace=True)
    finallist = finallist.sample(frac=1)
    finallist.reset_index(drop=True, inplace=True)
    #    print(finallist['politics'])
    #    print(finallist)
    finallist = finallist.drop(columns=['democrats', 'Republican'])
    dbconnect.disconnect()
    return finallist