word2vec 做中文, 根本不能用. oov问题.太严重. 中华,------中, 华拆开语义就完全不一样.

huggingface:使用说明: 找model:类别为 1.sentence classification : gleu任务 2.toekn calssification: ner任务 3.qa:qa任务

本仓库,项目汇总说明:

英文长文本qa: longformeQA/长文本qa2.py

longFormer代码: huggingface项目中重要例子/transformers/src/transformers/modeling_longformer.py

改进: 在上下文中对于 名词和动词 进行global_attention

图谱最新进展3: 加入了自己的词典. 知识图谱项目/kg加深度学习/词向量finetune/对albert模型做finetune让他的词向量距离效果更好3加入了自定义词典.py

LearnedPositionEmbedding: huggingface项目中重要例子/transformers/src/transformers/modeling_bart.py

交易撮合算法: 撮合/test.py

word2vec 做中文, 根本不能用. oov问题.太严重. 中华,------中, 华拆开语义就完全不一样.

生成任务的参数配置详细:

huggingface项目中重要例子/transformers/src/transformers/generation_utils.py

abstract模型加finetune代码:

abstract算法/t5摘要效果还行加了finetune.py

知识图谱的简单查看: 查询8G数据知识图谱项目/知识图谱简单查看数据.py

albert词向量究极版本:

知识图谱项目/kg加深度学习/huizong2使用的是albert大版本.py

中文qa finetune模型 : albert使用/中文qa模型!Finetune.py

注意函数返回值有propability,自己设置一个阈值,如果小于这个值,就表示答案在text中不存在,返回error即可.

英文qa finetune代码: albert使用/ImportantExmapleForFinetune.py

squad核心转化函数: C:\Users\Administrator.PyCharm2019.3\system\remote_sources-456540730-337502517\transformers\data\processors\squad.py

智能问答kg解决方案实施: 知识图谱项目/kg加深度学习/huizong.py

albert的配置:

huggingface项目中重要例子/transformers/src/transformers/configuration_albert.py

所有的albert使用model,看接哪个头适合. C:\Users\Administrator.PyCharm2019.3\system\remote_sources-456540730-337502517\transformers\modeling_albert.py

经典textrank算法做ext: 中国搜索/TextRank4ZH-master/example/example01.py

知识图谱数据库的简历: 知识图谱项目/setUpKG

人脸/facenet-pytorch/examples

是人脸识别项目包含识别,检测,和训练代码.

22222222/gector-master2/train_finetune_latest3.py

 是 纠错最终版本(对原有开源模型进行了多种加强和bug修复.)

PreSumm2\src\train2.py

 是extract 模型. 输入一段句子, 返回最有用的句子的index (index从0开始计数) (没有对原有开源模型进行加强,只是简单的函数封装.)

PreSumm2/src/train3.py

是abs模型.     输入一段句子, /output_abs.txt 会返回abs.

ctrl模型:

ctrl模型/ctrl原始代码/ctrl/pytorch_generation.py

这个直接运行就会返回所有生成的过程.

ctrl模型/run_generation (2)_for_ctrl.py

更简洁的hugging-face generate代码.

ctrl模型/ctrl原始代码/ctrl/training_utils/training.py ctrl模型训练代码.还没调通. 但是基本从make_tf里面知道了训练数据的样子.

一些其他的翻页和nlg任务:

一些可以直接调用的nlp算法/一些语言之间的翻译和生成.md

中文nlg: gpt2做中文nlg/gpt2-ml-master/demo2.py 直接运行即可. 然后输入点汉子,就会后面续写.

中文nlg自己训练,加运行的代码: gpt2做中文nlg/GPT2-Chinese-master修改为mega版本/README.md

python加速算法:

量化/main

欢迎有爱的童鞋扫码

"# nlp4"

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
.idea		.idea
1212121		1212121
12312		12312
22222222		22222222
333		333
444		444
56565		56565
898989		898989
8989谢兄pickle处理bug		8989谢兄pickle处理bug
99999999999999		99999999999999
Learning3学学fairseq		Learning3学学fairseq
MASS		MASS
MPNet-master		MPNet-master
PreSumm		PreSumm
PreSumm2		PreSumm2
abstract算法		abstract算法
albert-master		albert-master
albert-vec-support		albert-vec-support
albert使用		albert使用
beamSearch讲解		beamSearch讲解
bert-nmt-master		bert-nmt-master
bert_wordEmbed-master		bert_wordEmbed-master
bert做词向量		bert做词向量
bert获取中文vec		bert获取中文vec
bpe算法		bpe算法
ctrl模型		ctrl模型
examples_in_fariseq都是非常重要的例子		examples_in_fariseq都是非常重要的例子
fastText-0.1.0		fastText-0.1.0
gamemaker资源		gamemaker资源
gat网络		gat网络
gpt2做中文nlg		gpt2做中文nlg
huggingface项目中重要例子		huggingface项目中重要例子
jiexi2-master加很多工具		jiexi2-master加很多工具
kmp		kmp
lianghua		lianghua
longformeQA		longformeQA
longformer的官网实现		longformer的官网实现
otehr		otehr
other		other
pic		pic
pyhanlp的使用		pyhanlp的使用
python注意点		python注意点
riscV		riscV
roberta_zh-master		roberta_zh-master
transformer666		transformer666
tutorial		tutorial
utils_for_bert翻译峰哥		utils_for_bert翻译峰哥
vae算法		vae算法
wordpiece算法实际代码		wordpiece算法实际代码
一些nlp常用的库包看看		一些nlp常用的库包看看
一些可以直接调用的nlp算法		一些可以直接调用的nlp算法
下载google盘		下载google盘
中国搜索		中国搜索
主题模型		主题模型
人脸		人脸
传统方法做nlg		传统方法做nlg
元学习		元学习
区块链		区块链
句子分割算法		句子分割算法
句子相似度qa		句子相似度qa
垃圾		垃圾
如何引入上级库包		如何引入上级库包
学习fairseq		学习fairseq
学习roberta		学习roberta
学习一些c代码		学习一些c代码
峰哥翻译项目		峰哥翻译项目
差分隐私		差分隐私
摘要算法		摘要算法
撮合		撮合
数据结构		数据结构
文本生成		文本生成
服务器网页展示		服务器网页展示
生成器装饰器		生成器装饰器
看看glue任务		看看glue任务
看看langid源码		看看langid源码
知识图谱项目		知识图谱项目
研究qa		研究qa
研究yolov4		研究yolov4
网站中插入视频和音频		网站中插入视频和音频
语音		语音
跑教程		跑教程
这个文件夹用来存一个相关的项目包可以作为工具来使用		这个文件夹用来存一个相关的项目包可以作为工具来使用
量化		量化
07d7b483b4c109ad089426edd744958f.mp4		07d7b483b4c109ad089426edd744958f.mp4
1		1
11.png		11.png
111.png		111.png
111.py		111.py
11111.py		11111.py
1111111.py		1111111.py
111111111.py		111111111.py
11111111tokenize算法.py		11111111tokenize算法.py
1213.py		1213.py
122222222222222.py		122222222222222.py
1_abs.txt		1_abs.txt
2		2
2004.05150.pdf		2004.05150.pdf
21321321312.py		21321321312.py
22222222222.py		22222222222.py
2312312.py		2312312.py

yf1291/nlp4

Folders and files

Latest commit

History