Skip to content

NJU-Software-Requirement/Software_Requirement_EXP2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Software_Requirement_EXP2

我们的实验即将完成,肝报告ing

Software_Requirement_EXP2
 |----code                              实验代码
 |----data                              实验数据
 |----img                               实验图片
 |----README.md                         您现在看到的文件
 |----lab2.pdf                          实验报告

data文件夹结构

data
 |----data.json                         bugzilla最近提出的近10000个bug的数据
 |----data2.json                        bugzilla最早提出的近5000个bug的数据
 |----data_20k.json                     bugzilla最早提出的近9000个bug的数据
 |----data_uni.json                     bugzilla最早提出的、按照严重性分类较为均匀的近8000个bug的数据
 |----data_uni_more.json                bugzilla最早提出的、按照严重性分类较为均匀的10000个bug的数据
 |----data_uni_p.json                   bugzilla最早提出的、按照优先级分类较为均匀的近7000个bug的数据
 |----data_uni_p_more.json              bugzilla最早提出的、按照优先级分类较为均匀的10000个bug的数据
 |----bugs.json                         将data.json中bug按照优先级分类的深度学习数据
 |----bugs2.json                        将data2.json中bug按照优先级分类的深度学习数据
 |----bugs_20k.json                     将data_20k.json中bug按照严重性分类的深度学习数据
 |----bugs_b.json                       将data.json中bug按照严重性分类的深度学习数据
 |----bugs_uni.json                     将data_uni.json中bug按照严重性分类的深度学习数据
 |----bugs_uni_more.json                将data_uni_more.json中bug按照严重性分类的深度学习数据
 |----issues.json                       github上关于vscode的具有'feature-request'标签的9900个issue的数据
 |----issues_bak.json                   github上关于vscode的具有'feature-request'标签的9900个issue的不完全数据
 |----sort_issues_m1.txt                将issues.json中issue按照评论数排序
 |----stopword.txt                      停用词表
 |----val_sorted.json                   将每条bug数据计算出一个val值进行排序(val计算方法见报告)
 |----val_sorted.csv                    内容同上,保存成csv方便浏览

code 文件夹结构

code
 |----NLP
 |     |----bert-base-uncased
 |     |----data
 |     |     |----bugs.json             深度学习所用数据
 |     |----dataloader.py               加载训练数据
 |     |----main.py                     深度学习主函数
 |     |----main_bak.py                 深度学习主函数(备份)
 |----vscode-issues
 |     |----get_data.py                 多线程爬取github上关于vscode的具有'feature-request'标签的issue
 |     |----re_get.py                   对用get_data.py获取的数据进行检查,将数据不完全的issue重新获取
 |     |----sort_by_m1.py               将获得的issue数据按照评论数排序
 |     |----tag.py                      筛选初步爬取的数据以确认emoji数据可能不完整的issue
 |----format.py                         对用于深度学习的数据进行整理,包括去除非英文字符以及停用词
 |----get_bugs.py                       多线程爬取bugzilla上最早提出的部分bug
 |----get_bugs_uni.py                   多线程按照严重性较为均匀的爬取bugzilla上最早提出的部分bug
 |----get_bugs_uni_p.py                 多线程按照优先级较为均匀的爬取bugzilla上最早提出的部分bug
 |----dataClean0.py                     对爬取的vscode的issue按照排序值绘图

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages