Skip to content

DangoOCR: screenshot OCR recognize 文字识别,支持多种语言,识别后翻译,播放声音

Notifications You must be signed in to change notification settings

topud/Dango-ocr

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Dango-OCR(Windows, Mac, Ubuntu)

软件介绍:

DangoOCR:一个开源的文字识别工具,通过选择识别范围自动截取屏幕图片,或者手动加载本地图片实现文字的识别/提取。特点:

  • 界面简单,即下即用
  • 目前支持汉语, 日语, 英语, 韩语, 德语, 法语的文字识别, 会持续优化识别算法
  • 支持截图或者本地加载图片进行识别
  • 支持可视化识别结果,可以手动修正识别结果,并导出文件(.docx, .txt)及对应图片
  • 支持翻译为汉语
  • 如果开启“自动模式”, 选择一个区域后可以自动截屏并进行识别
  • 如果无法使用, 复制"config/error.txt"的内容进行反馈
  • 软件下载(存放目录路径中不能有空格):
    Windows版下载1下载2
    Mac版(只测了macOS 10.13.3)下载1下载2
    Ubuntu版(只测了ubuntu16.04)下载1下载2

OCR算法服务

  • 如果您对OCR算法不感兴趣, 可以直接使用上面已经做好的软件,解压后可以直接使用。如果您想进一步了解文字识别算法或者要自己搭建算法服务,可以参考OCR算法服务进行部署并确保可以调通接口。在本工程中首先修改'config.py'中的ocr_request_url为搭好的服务地址,main.py是程序入口。
  • 相关blog 使用飞桨一步步实现多语言OCR文字识别软件

TODO计划

  • 优化高分辨率屏幕文字较小
  • 导出docx文件时优化排版
  • 算法轻量化,实现离线文字识别

使用方法(以Windows系统为例):

  • 1 解压压缩包后,找到“DangoOCR.exe”文件双击即可运行("Ubuntu"系统下也是双击。macOS系统下需要右键,打开方式选择终端)。在“设置”界面设置"待识别的语言类型"。

  • 2 软件界面如下(汉语识别)。

  • 3 如果在'设置'勾选了'可视化识别结果',可以对结果进行修改并可以导出为txt/docx。
  • 4 软件界面如下(日语识别)。
  • 5 识别英语文档并手动修改。
  • 6 算法debug

参考:

About

DangoOCR: screenshot OCR recognize 文字识别,支持多种语言,识别后翻译,播放声音

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 97.9%
  • JavaScript 1.1%
  • Other 1.0%