Python Selector.extend 예제들

프로그래밍 언어: Python

네임스페이스/패키지 이름: selector

클래스/타입: Selector

메소드/함수: extend

hotexamples.com에서의 예제들: 2

Python Selector.extend - 2개의 예제가 발견되었습니다. 이것들은 오픈소스 프로젝트에서 추출된 Python의 selector.Selector.extend에 대한 실세계 최고 등급의 예제들입니다. 예제들을 평가하여 예제의 품질 향상에 도움을 줄 수 있습니다.

자주 사용되는 메소드들

보기 숨기기

Selector(30)

select(4)

xpath(3)

setStimuliLock(3)

pop(3)

default(2)

stop(2)

push(2)

result(2)

extend(2)

add(2)

execute(2)

takeStimuliActivateTile(1)

select_edges_for_improvement(1)

write(1)

process(1)

term_path(1)

remove(1)

term_meaning_path(1)

run_forever(1)

scrape(1)

validate(1)

select_on(1)

status405(1)

selector(1)

selectorLogic(1)

term_detail_path(1)

term_path_jp(1)

takeStimuliStandBy(1)

place(1)

set_relaxation(1)

shuffle(1)

start(1)

status404(1)

update(1)

Run(1)

match(1)

click(1)

__init__(1)

_parent(1)

add_road(1)

apex_seasons(1)

apply(1)

are_crossings_hidden(1)

are_kerb_lines_hidden(1)

are_polylines_hidden(1)

build_pipeline(1)

cancelAllSelection(1)

catalog_container(1)

예제 #1

파일 보기

파일: feature_engineering.py 프로젝트: wangdaha1/SMLproject

    def get_processing(self):
        # 最终处理数据生成特征的函数
        dataset = self._get_data_plusaugmentation()

        boolean_columns = self._get_boolean_columns(dataset)
        remove_columns = ['id', 'score']
        num_columns = list()  # 摘取其余的特征
        for column in dataset.columns:
            if column in remove_columns:
                continue
            if column in boolean_columns:
                continue
            num_columns.append(column)

        # 异常字段处理：手动分箱
        abnormal_columns = [
            'online_shopping_num', 'logistics_num', 'financing_num',
            'video_num', 'airplant_num', 'train_num', 'travel_num'
        ]
        abnormal_encoder_columns = list()
        for column in abnormal_columns:
            encoder_column = f'{column}_encoder'
            dataset[encoder_column] = dataset[column].apply(
                self._get_abnormal_label)
            abnormal_encoder_columns.append(encoder_column)
        dataset = pd.get_dummies(dataset, columns=abnormal_encoder_columns)
        #_get_abnormal_label函数只是把数据变成1234  但是要通过get_dummies变成哑变量0001

        # 缺失值单独抽离特征：无效  这怎么可能有效啊！无语子
        # 那既然这样无效的话 用什么办法处理缺失值呢？
        # 是认为 除了boolean特征和刚刚处理过的app使用次数特征之外 其余的0值就是missing data啦
        # for column in num_columns:
        #     # abnormal已处理过，continue
        #     if column in abnormal_columns:
        #         continue
        #     column_name = f'{column}_missing'
        #     dataset[column_name] = dataset[column].apply(self._get_missing_value)

        # 将bool类型重新组合 也就是交互特征啦
        # 生成的特征有点过多了 可以考虑去掉
        # dataset = self._recombine_boolean_columns(dataset, boolean_columns)

        # ??看看是啥特征 没看懂是在干嘛
        # dataset = self._data_encoder(dataset, ['surfing_time', 'age'])

        # 业务逻辑特征
        dataset = self._get_operation_features(dataset)

        if self.selector:
            train_data = dataset[dataset['score'] > 0]
            y_data = train_data['score']
            x_data = train_data.drop(columns=['id', 'score'])
            # 选特征
            select_features = Selector(
                ascending=self.ascending).get_select_features(x_data, y_data)
            select_features.extend(['id', 'score'])
            dataset = dataset[select_features]

        return dataset

예제 #2

파일 보기

    def get_processing(self):
        dataset = self._get_data()

        boolean_columns = self._get_boolean_columns(dataset)
        remove_columns = ['id', 'score']
        num_columns = list()
        for column in dataset.columns:
            if column in remove_columns:
                continue
            if column in boolean_columns:
                continue
            num_columns.append(column)

        #异常字段处理：手动分箱
        abnormal_columns = [
            'online_shopping_num', 'logistics_num', 'financing_num',
            'video_num', 'airplant_num', 'train_num', 'travel_num'
        ]
        abnormal_encoder_columns = list()
        for column in abnormal_columns:
            encoder_column = f'{column}_encoder'
            dataset[encoder_column] = dataset[column].apply(
                self._get_abnormal_label)
            abnormal_encoder_columns.append(encoder_column)
        dataset = pd.get_dummies(dataset, columns=abnormal_encoder_columns)

        #缺失值单独抽离特征：无效
        # for column in num_columns:
        #     if column in abnormal_columns:
        #         continue
        #     column_name = f'{column}_missing'
        #     dataset[column_name] = dataset[column].apply(self._get_missing_value)

        #将bool类型重新组合
        dataset = self._recombine_boolean_columns(dataset, boolean_columns)

        #embedding
        #dataset = self._data_encoder(dataset,['surfing_time','age'])

        #业务逻辑特征
        dataset = self._get_operation_features(dataset)

        if self.selector:
            train_data = dataset[dataset['score'] > 0]
            y_data = train_data['score']
            x_data = train_data.drop(columns=['id', 'score'])
            #selects = Selector(ascending=self.ascending)
            select_features = Selector(
                ascending=self.ascending).get_select_features(x_data, y_data)
            select_features.extend(['id', 'score'])
            dataset = dataset[select_features]

        return dataset