Skip to content

mrcheng0910/url_lexical_analysis

Repository files navigation

恶意域名词汇特征挖掘分析系统

基于恶意域名词汇特征分析出规律,然后进行计算,建立挖掘模型

安装库

  1. python-tk
  2. matplotlib

词汇特征

  1. url_length: url的长度
  2. domain_tokens:
  3. domain_characters:
  4. domain_brand:
  5. path_tokens:
  6. path_characters
  7. path_brand:

使用模型测试

暂时使用自动分类算法,进行测试

改进的方法

检测是否含有brand的算法,可以使用相似性匹配来进行。

About

to analysis the lexical of url

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages