代码拉取完成,页面将自动刷新
基于Tesseract的OCR翻译系统
曾逸夫,从事人工智能研究与开发;主研领域:计算机视觉;YOLOv5官方开源项目代码贡献人;YOLOv5 v6.1代码贡献人;Gradio官方开源项目代码贡献人
❤️ Github:https://github.com/Zengyf-CVer
🔥 YOLOv5 官方开源项目PR ID:
--visualize
:https://github.com/ultralytics/yolov5/pull/5701
detect.py --view-img
for non-ASCII paths:https://github.com/ultralytics/yolov5/pull/7093
💡 YOLOv5 v6.1代码贡献链接:
🔥 Gradio 官方开源项目PR ID:
2022-07-19
⚡ OCR Translate v0.2正式上线
2022-06-19
⚡ OCR Translate v0.1正式上线
本项目提供了在线demo,点击下面的logo,进入Hugging Face Spaces中快速体验:
❤️ 点击列表中的链接,进入对应版本的Hugging Face Spaces界面中快速体验:
Demo 名称 | 输入类型 | 输出类型 | 状态 |
---|---|---|---|
🚀 OCR Translate v0.2 | 图片 | 文本 |
.
├── ocr-translate # 项目名称
│ ├── opus-mt-en-zh # Opus-MT翻译包
│ │ ├── config.json # 配置文件
│ │ ├── flax_model.msgpack # Flax模型
│ │ ├── metadata.bin # PyTorch模型
│ │ ├── rust_model.ot # Rust模型
│ │ ├── tf_model.h5 # TensorFlow模型
│ │ ├── tokenizer_config.json # tokenizer配置
│ │ ├── ...... # 其他
│ ├── data # 示例图片
│ ├── __init__.py # 初始化文件
│ ├── ocr_translate.py # 主运行文件
│ ├── LICENSE # 项目许可
│ ├── CodeCheck.md # 代码检查
│ ├── .gitignore # git忽略文件
│ ├── README.md # 项目说明
│ ├── setup.cfg # pre-commit CI检查源配置文件
│ ├── .pre-commit-config.yaml # pre-commit配置文件
│ └── requirements.txt # 脚本依赖包
# 加入Tesseract OCR apt repo
sudo add-apt-repository ppa:alex-p/tesseract-ocr-devel
# 更新apt
sudo apt update
# 安装
sudo apt install tesseract-ocr
git clone https://github.com/tesseract-ocr/tessdata
# 加入环境变量
sudo vim ~/.bashrc
export TESSDATA_PREFIX=/home/zyf/tessdata
# 使环境变量生效
source ~/.bashrc
# 注:将script目录中的文件移动到tessdata根目录
conda create -n ocr python==3.8
conda activate ocr # 进入环境
git clone https://gitee.com/CV_Lab/ocr-translate.git
cd ocr-translate
pip install -r ./requirements.txt -U
cd ocr-translate
# 中文-英文
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-zh-en
# 英文-中文
git lfs clone https://huggingface.co/Helsinki-NLP/opus-mt-en-zh
python ocr_translate_v2.py # v0.2 推荐
python ocr_translate_v1.py # v0.1
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。