4 Star 44 Fork 16

PaddlePaddle / Paddle.js

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
README_cn.md 2.11 KB
一键复制 编辑 原始数据 按行查看 历史

English

ocr

ocr 为文本识别模块,包括两个模型:ocr_detection 和 ocr_recognition。ocr_detection 模型检测图片中文本所在区域,ocr_recognition 模型可识别每个文本区域内的字符(中文/英文/数字)。

模块提供简单易用的接口,使用者只需上传图片即可获取文本识别结果。

ocr_recognition模型输入shape为[1, 3, 32, 320],模型推理前会对图片文本框选区域进行处理:图片文本框选区域宽高比 <= 10,将整个框选区域传入识别模型;框选区域宽高比 > 10,则对框选区域按宽度进行裁剪,将裁剪区域传入识别模型,最终拼接裁剪区域每一部分的识别结果。

ocr_detection文本检测源模型下载自paddleOCR

ocr_recognition文本识别源模型是通过ch_PP-OCRv2_rec_train预训练模型导出输入shape为[1, 3, 32, 320]的推理模型。

安装

npm install

编译

npm run dev

构建

npm run build

使用

import * as ocr from '@paddlejs-models/ocr';

// 模型初始化
await ocr.init();

// 获取文本识别结果API,img为用户上传图片,option为可选参数 
// option.canvas as HTMLElementCanvas:若用户需要绘制文本框选区域,传入canvas元素
// option.style as object:若用户需要配置canvas 样式,传入style 对象
// option.style.strokeStyle as string:文本框选颜色
// option.style.lineWidth as number:文本框选线段宽度
// option.style.fillStyle as string:文本框选填充颜色
const res = await ocr.recognize(img, option?);
// 识别文字结果
console.log(res.text);
// 文本区域坐标
console.log(res.points);

在线体验

https://paddlejs.baidu.com/ocr

效果

ocr
TypeScript
1
https://gitee.com/paddlepaddle/Paddle.js.git
git@gitee.com:paddlepaddle/Paddle.js.git
paddlepaddle
Paddle.js
Paddle.js
release/v2.2.5

搜索帮助