GitHub

This implements "Visual Translation Embedding Network for Visual Relation Detection,Hanwang Zhang, Zawlin Kyaw, Shih-Fu Chang, Tat-Seng Chua (CVPR2017)"

What's inside?

object detectors training and data preprocessor for vrd and vg.
vg canonicalization
two-stage relation training code for vrd and vg.
evaluation code for vg+vrd adapted from Lu (https://github.com/Prof-Lu-Cewu/Visual-Relationship-Detection)

Download links

annotations in hdf5 format
- https://www.dropbox.com/s/tae51mr75nd9qft/sg_vrd_meta.h5?dl=0
- https://www.dropbox.com/s/ujd4247m2tduuj2/vg1_2_meta.h5?dl=0
voc format for obj detector
- https://www.dropbox.com/s/wsoqj8iczkgxgzs/sg_vrd_voc.tar.gz?dl=0
- https://www.dropbox.com/s/8d38zjnirdg8xzw/vg_1.2_voc.tar.gz?dl=0
object detectors
- https://www.dropbox.com/s/m971saz2xue6evp/vg_obj_model.caffemodel?dl=0
- https://www.dropbox.com/s/dp6r22olfaf96j5/vr_obj_model.caffemodel?dl=0
relation model
- https://www.dropbox.com/s/29pnw7hyoo1fvd8/vr_rel_model.caffemodel?dl=0

Coming soon

todo

Setup

Object Detector

Ensure data folder looks like this.

zawlin@zlgpu:~/g/cvpr17_vtranse/data$ tree -l -L 4 -d
.
├── demo
├── scripts
├── sg_vrd_2016 -> /media/zawlin/ssd/data/vrd/vrd/sg
│   ├── Annotations
│   │   ├── sg_test_images
│   │   └── sg_train_images
│   ├── Data
│   │   ├── sg_test_images
│   │   └── sg_train_images
│   ├── devkit
│   │   ├── data
│   │   │   └── ilsvrc_det_sample
│   │   └── evaluation
│   └── ImageSets
└── vg1_2_2016 -> /media/zawlin/ssd/data/vrd/vg_1.2/voc_format
    ├── Annotations
    │   ├── test
    │   │   ├── VG_100K
    │   │   └── VG_100K_2
    │   └── train
    │       ├── VG_100K
    │       └── VG_100K_2
    ├── Data
    │   ├── test
    │   │   ├── VG_100K
    │   │   └── VG_100K_2
    │   └── train
    │       ├── VG_100K
    │       └── VG_100K_2
    ├── devkit
    │   ├── data
    │   │   └── ilsvrc_det_sample
    │   └── evaluation
    └── ImageSets

Citation

If you're using this code in a scientific publication please cite:

@inproceedings{Zhang_2017_CVPR,
  author    = {Hanwang Zhang, Zawlin Kyaw, Shih-Fu Chang, Tat-Seng Chua},
  title     = {Visual Translation Embedding Network for Visual Relation Detection},
  booktitle = {CVPR},
  year      = {2017},
}

Name		Name	Last commit message	Last commit date
Latest commit History 210 Commits
caffe-fast-rcnn @ 84f4fd5		caffe-fast-rcnn @ 84f4fd5
data		data
experiments		experiments
lib		lib
models		models
relation_evaluation		relation_evaluation
relation_mappings		relation_mappings
tools		tools
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
train_sg_vrd_obj.sh		train_sg_vrd_obj.sh
train_sg_vrd_relation.sh		train_sg_vrd_relation.sh
train_vg1_2_obj.sh		train_vg1_2_obj.sh
train_vg1_2_relation.sh		train_vg1_2_relation.sh

License

tianfeng80/cvpr17_vtranse

Folders and files

Latest commit

History

Repository files navigation

What's inside?

Download links

Coming soon

Setup

Object Detector

Citation

About

Resources

License

Stars

Watchers

Forks

Languages