1 Star 6 Fork 2

CV_Lab / OCR-Translate

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README.md 7.65 KB
一键复制 编辑 原始数据 按行查看 历史
代码阿尔法 提交于 2022-07-24 09:29 . readme update

Simple Icons

基于Tesseract的OCR翻译系统

code check Releases Version Hugging Face Spaces Hugging Face Spaces License

Gradio Version Gradio Version Gradio Version Python Version pre-commit

🚀 作者简介

曾逸夫,从事人工智能研究与开发;主研领域:计算机视觉;YOLOv5官方开源项目代码贡献人YOLOv5 v6.1代码贡献人Gradio官方开源项目代码贡献人

❤️ Github:https://github.com/Zengyf-CVer

🔥 YOLOv5 官方开源项目PR ID:

💡 YOLOv5 v6.1代码贡献链接:

🔥 Gradio 官方开源项目PR ID:

🚀更新走势

🤗在线Demo

❤️ 快速体验

本项目提供了在线demo,点击下面的logo,进入Hugging Face Spaces中快速体验:

💡 Demo 列表

❤️ 点击列表中的链接,进入对应版本的Hugging Face Spaces界面中快速体验:

Demo 名称 输入类型 输出类型 状态
🚀 OCR Translate v0.2 图片 文本 demo status

💎项目流程与用途

📌 项目整体流程

📌 项目示例

💡 OCR 文字提取(中文/英文)

💡 翻译(中文-英文/英文-中文)

💡项目结构

.
├── ocr-translate							# 项目名称
│   ├── opus-mt-en-zh						# Opus-MT翻译包
│   │   ├── config.json						# 配置文件
│   │   ├── flax_model.msgpack				# Flax模型
│   │   ├── metadata.bin					# PyTorch模型
│   │   ├── rust_model.ot					# Rust模型
│   │   ├── tf_model.h5						# TensorFlow模型
│   │   ├── tokenizer_config.json			# tokenizer配置
│   │   ├── ......							# 其他
│   ├── data								# 示例图片
│   ├── __init__.py							# 初始化文件
│   ├── ocr_translate.py					# 主运行文件
│   ├── LICENSE								# 项目许可
│   ├── CodeCheck.md						# 代码检查
│   ├── .gitignore							# git忽略文件
│   ├── README.md							# 项目说明
│   ├── setup.cfg							# pre-commit CI检查源配置文件
│   ├── .pre-commit-config.yaml				# pre-commit配置文件
│   └── requirements.txt					# 脚本依赖包

🔥安装教程

✅ 第一步:安装Tesseract OCR及其语言包(Ubuntu版)

📌 安装Tesseract OCR

# 加入Tesseract OCR apt repo
sudo add-apt-repository ppa:alex-p/tesseract-ocr-devel
# 更新apt
sudo apt update
# 安装
sudo apt install tesseract-ocr

📌 安装Tesseract OCR语言包

git clone https://github.com/tesseract-ocr/tessdata

# 加入环境变量
sudo vim ~/.bashrc
export TESSDATA_PREFIX=/home/zyf/tessdata

# 使环境变量生效
source ~/.bashrc

# 注:将script目录中的文件移动到tessdata根目录

✅ 第二步:创建conda环境

conda create -n ocr python==3.8
conda activate ocr # 进入环境

✅ 第三步:克隆

git clone https://gitee.com/CV_Lab/ocr-translate.git

✅ 第四步:安装OCR Translate依赖

cd ocr-translate
pip install -r ./requirements.txt -U

✅ 第五步:安装 Opus-MT 翻译包(离线版)

cd ocr-translate

# 中文-英文
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-zh-en

# 英文-中文
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-en-zh

⚡使用教程

python ocr_translate_v2.py # v0.2 推荐
python ocr_translate_v1.py # v0.1

💬 技术交流

  • 如果你发现任何OCR Translate存在的问题或者是建议, 欢迎通过Gitee Issues给我提issues。
  • 欢迎加入CV Lab技术交流群
Python
1
https://gitee.com/CV_Lab/ocr-translate.git
git@gitee.com:CV_Lab/ocr-translate.git
CV_Lab
ocr-translate
OCR-Translate
master

搜索帮助