Implicit Relationship Detection

思路

首先简单介绍一下我的思路：我想使用CNN的方法来进行分类。

网络结构

输入：两句话

输出：分类的类别（是一个one-of-k的向量）

程序

程序结构

utils
|--nn.py 
|  |--CNN
|--reader.py #用于读取数据、建立词表
|  |--Reader #读取数据、标签
|  |--Vocab  #建立词表

使用

配置

{
    "vocab_size": 100000,
    "maxlen": 450,
    "batch_size": 30,
    "embedding_dims": 100,
    "nb_filter": 250,
    "filter_length":3,
    "hidden_size": 300,
    "nb_epoch": 10,
    "dropout": 0.5, 
    "train_file": "data/train_pdtb_imp.json",
    "vocab_file": "data/vocab",
    "test_file": "",
    "valid_file": "data/dev_pdtb_imp.json",
    "vocab_size": 100000,
}

实验

第一版：双Embedding-CNN结构

data	accuracy	CNN:ml-bs-ed-nf-fl-hs-do
training	0.7900	450-30-100-250-3-300-0.5
valiadation	0.3400	450-30-100-250-3-300-0.5

第二版：双LSTM结构

本来想用LSTM建模句子，但是因为有些句子特别长(408词)，因为需要进行padding，就会导致时序展开得特别地长，这样计算起来相当慢。

第二.1版：Embedding-CNN-LSTM

data	accuracy	CNN-LSTM:ml-bs-ed-nf-fl-hs-do
training	0.5549	420-30-100-250-3-300-0.5
valiadation	0.3573	420-30-100-250-3-300-0.5

下一步的工作

引入预先训练好的词向量。
使用句子向量的相关研究。

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
utils		utils
README.md		README.md
main.py		main.py
run.sh		run.sh
submit.sh		submit.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

utils

utils

README.md

README.md

main.py

main.py

run.sh

run.sh

submit.sh

submit.sh

Repository files navigation

Implicit Relationship Detection

思路

网络结构

程序

程序结构

使用

实验

第一版：双Embedding-CNN结构

第二版：双LSTM结构

第二.1版：Embedding-CNN-LSTM

下一步的工作

About

Releases

Packages

Languages

CodePothunter/ImpRelationDector

Folders and files

Latest commit

History

Repository files navigation

Implicit Relationship Detection

思路

网络结构

程序

程序结构

使用

实验

第一版：双Embedding-CNN结构

第二版：双LSTM结构

第二.1版：Embedding-CNN-LSTM

下一步的工作

About

Resources

Stars

Watchers

Forks

Languages