Python MultiLabelBinarizer.columns示例

编程语言: Python

命名空间/包名称: sklearn.preprocessing

方法/功能: columns

hotexamples.com的示例: 1

Python MultiLabelBinarizer.columns - 已找到1个示例。这些是从开源项目中提取的最受好评的sklearn.preprocessing.MultiLabelBinarizer.columns现实Python示例。您可以评价示例，以帮助我们提高示例质量。

常用方法

显示隐藏

MultiLabelBinarizer(30)

transform(30)

fit(30)

fit_transform(30)

inverse_transform(30)

tocsr(18)

classes_(10)

reshape(8)

set_params(4)

dump(3)

load(3)

argmax(2)

partial_fit(1)

sum(1)

get_params(1)

mean(1)

append(1)

flatten(1)

convert_tokens_to_ids(1)

columns(1)

astype(1)

transpose(1)

示例#1

显示文件

文件： Untitled-1.py 项目： liulingzhi604/ctr_practice

ratings.columns = ['UserID', 'MovieID', 'Rating', 'Timestamp']

# data = ratings.merge(users, on=['UserID'])
# data = data.merge(movies, on=['MovieID'])

# %%
# movies数据处理
movies['publish_date'] = movies.Title.str[-5:-1].astype(int)
movies['Title'] = LabelEncoder().fit_transform(movies.Title.str[:-7])

from sklearn.preprocessing import MultiLabelBinarizer
movie_genres = MultiLabelBinarizer().fit_transform(
    movies.Genres.map(lambda x: x.split('|')))
movie_genres = pd.DataFrame(movie_genres)
movie_genres.columns = [
    'Genres_%d' % i for i in range(len(movie_genres.columns))
]
movies = pd.concat([movies, movie_genres], axis=1)
# users数据处理
users = users.drop(['Zip-code'], axis=1)
users['Gender'] = LabelEncoder().fit_transform(users.Gender)
# ratings数据处理
ratings = ratings.sort_values(['UserID', 'Timestamp'])
ratings['MovieID'] = ratings['MovieID'].astype(str)
watching_seq = ratings.groupby('UserID')['MovieID'].transform(
    lambda x: ','.join(x))
ratings['MovieID'] = ratings['MovieID'].astype(int)
ratings['watching_seq'] = ratings['UserID'].map(watching_seq)

dt = pd.to_datetime(ratings.Timestamp).dt
ratings['day'] = dt.day