GitHub - KaneRodriguez/cloudml-census-keras-regression: This sample enables easy training of a multiple output regression Keras model with hyperparemeter tuning and distributed training, all on the Google ML Engine or locally with the gcloud sdk :)

Modified Open Source Keras version of the Census sample

This sample enables easy training of a multiple output regression Keras model with hyperparemeter tuning and distributed training, all on the Google ML Engine or locally with the gcloud sdk :)

Assign the data

The following will assign your local and gcloud hosted training and evaluation data as well as create a bucket from your current gcloud project.

Note: If you do not have a gcloud project, give this a read.

TRAIN_FILE=$(pwd)/data/output_train.csv
EVAL_FILE=$(pwd)/data/output_test.csv

PROJECT_ID=$(gcloud config list project --format "value(core.project)")
BUCKET_NAME=${PROJECT_ID}-mlengine

REGION=us-central1

gsutil mb -l $REGION gs://$BUCKET_NAME

gsutil cp -r data gs://$BUCKET_NAME/data

gsutil cp ../test.json gs://$BUCKET_NAME/data/test.json

GCS_TRAIN_FILE=gs://$BUCKET_NAME/data/output_train.csv
GCS_EVAL_FILE=gs://$BUCKET_NAME/data/output_test.csv
TEST_JSON=gs://$BUCKET_NAME/data/test.json

Note: Development was done on MacOS Mojave 10.14.2

Virtual environment

Virtual environments are strongly suggested, but not required. Installing this sample's dependencies in a new virtual environmentcl allows you to run the sample without changing global python packages on your system.

There are two options for the virtual environments:

Install Virtual env
- Create virtual environment virtualenv --python=/usr/bin/python2.7 custom_keras
- Activate env source custom_keras/bin/activate
Install Miniconda
- Create conda environment conda create --name custom_keras python=2.7
- Activate env source activate custom_keras

Install dependencies

Install gcloud
Install the python dependencies. pip install --upgrade -r requirements.txt

Using local python

You can run the Keras code locally

JOB_DIR=$(pwd)/output_keras
TRAIN_STEPS=2000
python -m trainer.task --train-files $TRAIN_FILE \
                       --eval-files $EVAL_FILE \
                       --job-dir $JOB_DIR \
                       --train-steps $TRAIN_STEPS

Training using gcloud local

You can run Keras training using gcloud locally

JOB_DIR=$(pwd)/output_keras
TRAIN_STEPS=200
gcloud ml-engine local train --package-path trainer \
                             --module-name trainer.task \
                             -- \
                             --train-files $TRAIN_FILE \
                             --eval-files $EVAL_FILE \
                             --job-dir $JOB_DIR \
                             --train-steps $TRAIN_STEPS

Distributed Training using gcloud local

You can run Keras distributed training using gcloud locally

JOB_DIR=$(pwd)/output_keras_dist
TRAIN_STEPS=200
gcloud ml-engine local train --package-path trainer \
                             --module-name trainer.task \
                             --distributed \
                             -- \
                             --train-files $TRAIN_FILE \
                             --eval-files $EVAL_FILE \
                             --job-dir $JOB_DIR \
                             --train-steps $TRAIN_STEPS \
                             --distributed True

Prediction using gcloud local

You can run prediction on the SavedModel created from Keras HDF5 model

python preprocess.py test.json

gcloud ml-engine local predict --model-dir=$JOB_DIR/export \
                               --json-instances test.json

Training using Cloud ML Engine

You can train the model on Cloud ML Engine

JOB_NAME=output_keras_single_1
OUTPUT_PATH=gs://$BUCKET_NAME/$JOB_NAME
TRAIN_STEPS=200
gcloud ml-engine jobs submit training $JOB_NAME \
                                    --stream-logs \
                                    --runtime-version 1.12 \
                                    --job-dir $OUTPUT_PATH \
                                    --package-path trainer \
                                    --module-name trainer.task \
                                    --region $REGION \
                                    -- \
                                    --train-files $GCS_TRAIN_FILE \
                                    --eval-files $GCS_EVAL_FILE \
                                    --train-steps $TRAIN_STEPS

Distributed Training using Cloud ML Engine

You can train the model on Cloud ML Engine in distributed mode

JOB_NAME=output_keras_dist_1
OUTPUT_PATH=gs://$BUCKET_NAME/$JOB_NAME
TRAIN_STEPS=200
gcloud ml-engine jobs submit training $JOB_NAME \
                                    --stream-logs \
                                    --runtime-version 1.12 \
                                    --job-dir $OUTPUT_PATH \
                                    --package-path trainer \
                                    --module-name trainer.task \
                                    --region $REGION \
                                    --scale-tier STANDARD_1 \
                                    -- \
                                    --train-files $GCS_TRAIN_FILE \
                                    --eval-files $GCS_EVAL_FILE \
                                    --train-steps $TRAIN_STEPS \
                                    --distributed True

Distributed Training using Cloud ML Engine and Hyperparameter Tuning

You can train the model on Cloud ML Engine in distributed mode and take advantage of hyperparameter tuning.

JOB_NAME=output_keras_htune_dist_1
OUTPUT_PATH=gs://$BUCKET_NAME/$JOB_NAME
TRAIN_STEPS=200
HPTUNING_CONFIG=hptuning_config.yaml
gcloud ml-engine jobs submit training $JOB_NAME \
                                    --stream-logs \
                                    --runtime-version 1.12 \
                                    --job-dir $OUTPUT_PATH \
                                    --package-path trainer \
                                    --config $HPTUNING_CONFIG \
                                    --module-name trainer.task \
                                    --region $REGION \
                                    --scale-tier STANDARD_1 \
                                    -- \
                                    --train-files $GCS_TRAIN_FILE \
                                    --eval-files $GCS_EVAL_FILE \
                                    --train-steps $TRAIN_STEPS \
                                    --distributed True \
                                    --hypertune True

Prediction using Cloud ML Engine

You can perform prediction on Cloud ML Engine by following the steps below. Create a model on Cloud ML Engine

gcloud ml-engine models create keras_model --regions $REGION

Export the model binaries

MODEL_BINARIES=$JOB_DIR/export

Deploy the model to the prediction service

gcloud ml-engine versions create v1 --model keras_model --origin $MODEL_BINARIES --runtime-version 1.12

Create a processed sample from the data

python preprocess.py test.json

Run the online prediction

gcloud ml-engine predict --model keras_model --version v1 --json-instances test.json

Resources

Here - For using a specific version of python with virtualenv

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.idea		.idea
data		data
trainer		trainer
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
hptuning_config.yaml		hptuning_config.yaml
preprocess.py		preprocess.py
requirements.txt		requirements.txt
setup.py		setup.py
test.json		test.json

KaneRodriguez/cloudml-census-keras-regression

Folders and files

Latest commit

History

Repository files navigation

Modified Open Source Keras version of the Census sample

Assign the data

Virtual environment

Install dependencies

Using local python

Training using gcloud local

Distributed Training using gcloud local

Prediction using gcloud local

Training using Cloud ML Engine

Distributed Training using Cloud ML Engine

Distributed Training using Cloud ML Engine and Hyperparameter Tuning

Prediction using Cloud ML Engine

Resources

About

Resources

Stars

Watchers

Forks

Languages