Umi-OCR 图文识别:免费开源!离线批量OCR神器,支持多语言识别

  |   0 评论   |   83 浏览

Umi-OCR 图文识别:免费开源!离线批量OCR神器,支持多语言识别

简介

Umi-OCR 是一款免费、开源、可批量的离线OCR软件,适用于 Windows7 x64 和 Linux x64 系统。

特点

  • 免费:所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码 / 公式识别

功能详情

  • 截图识别:快捷键唤起截图,识别图中文字。
  • 排版解析:识别不同排版,按正确顺序输出文字。
  • 批量识别:批量导入图片进行识别,支持多种图片格式。
  • 忽略区域:排除截图水印处的文字。
  • 二维码:支持扫码或生成二维码图片。
  • 文档识别:从PDF扫描件中提取文本,或转为双层可搜索PDF。
  • 全局设置:调整软件的全局参数,如快捷方式、开机自启、语言切换等。

功能概览

界面语言

  • 支持多国语言,根据系统设置自动切换。
  • 手动切换语言路径:全局设置 → 语言/Language。

标签页

  • 灵活的标签页设计,用户可根据喜好打开所需标签页。
  • 标签栏提供窗口置顶和锁定标签页功能。

截图OCR

  • 快捷键截图并识别图中文字。
  • 图片预览栏支持鼠标划选复制。
  • 识别记录栏允许编辑文字,支持多记录复制。
  • 支持粘贴图片进行识别。

文本后处理

  • 提供排版解析方案,整理OCR结果,优化阅读和使用体验。
  • 支持横排和竖排文本处理。

批量OCR

  • 批量导入图片识别,无数量上限。
  • 提供文本后处理功能,整理OCR文本排版和顺序。
  • 支持自动关机/待机设置。
  • 特殊功能“忽略区域”用于排除不需要的文字。

文档识别

  • 支持PDF、XPS、EPUB等格式文档的OCR识别。
  • 可输出双层可搜索PDF。
  • 提供忽略区域设置。

二维码功能

  • 读取和生成二维码,支持19种协议。

全局设置

  • 自定义快捷方式、开机自启。
  • 更改界面语言,支持繁中、英语、日语等。
  • 切换界面主题,提供多个亮/暗主题。
  • 调整界面文字大小和字体。
  • 切换OCR插件。
  • 调整渲染器设置,解决界面渲染问题。

调用接口

下载发行版

https://github.com/hiroi-sora/Umi-OCR

评论

发表评论

validate