面向浏览器和Nodejs的Javascript OCR引擎——Tesseract.js

介绍

Tesseract.js是流行的面向纯Javascript的OCR引擎的。该库支持100多种语言（中文支持），自动文本方向和脚本检测，用于读取段落，单词和字符边界框的简单界面。Tesseract.js可以在浏览器和具有NodeJS服务器上运行。

Github

https://github.com/naptha/tesseract.js

使用方式

# For v2版本
npm install tesseract.js
yarn add tesseract.js

# For v1版本
npm install tesseract.js@1
yarn add tesseract.js@1

可以配合webpack或者直接在浏览器中引用

import Tesseract from 'tesseract.js';

Tesseract.recognize(
  'url.png',
  'eng',
  { logger: m => console.log(m) }
).then(({ data: { text } }) => {
  console.log(text);
})

import { createWorker } from 'tesseract.js';

const worker = createWorker({
  logger: m => console.log(m)
});

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  const { data: { text } } = await worker.recognize('url.png');
  console.log(text);
  await worker.terminate();
})();

使用场景

你可以用在你想使用的地方，官方提供了10种使用方式，分别是

在线版本

https://github.com/jeromewu/tesseract.js-offline

Electron版本

https://github.com/jeromewu/tesseract.js-electron

自定义训练数据

https://github.com/jeromewu/tesseract.js-custom-traineddata

Chrome扩展程序

https://github.com/jeromewu/tesseract.js-chrome-extension

Chrome Extension #2: https://github.com/fxnoob/image-to-text

Vue版本

https://github.com/jeromewu/tesseract.js-vue-app

React版本

https://github.com/jeromewu/tesseract.js-react-app

Angular版本

https://github.com/jeromewu/tesseract.js-angular-app

Typescript版本

https://github.com/jeromewu/tesseract.js-typescript

视频实时识别

https://github.com/jeromewu/tesseract.js-video

总结

在日常的开发中OCR的使用场景或许还是蛮多的，如果你刚好有这种需求，不妨试一试Tesseract.js，enjoy it！

面向浏览器和Nodejs的Javascript OCR引擎——Tesseract.js

介绍

Github

使用方式

使用场景

总结

可收藏！中文诗歌古典文集数据库，中华文化的瑰宝！

颜值和功能皆不辜负，微信小程序原生语法组件库来了——Lin UI

惊艳的动画引擎，简单、轻盈、开源——Animejs

面向浏览器和Nodejs的Javascript OCR引擎——Tesseract.js

小程序的HTML和Markdown格式的富文本渲染组件，支持代码高亮！

阿里云企业云管理平台 UI 组件库开源——console-components

JavaScript开源良心插件，纯前端网页图片剪裁插件——cropperjs

移动端Web开发的高效加速引擎——MIP Engine

官方出品，微信小程序和 Web 端同构解决方案——kbone

各种各样加密算法的js库，安全加密不再愁——crypto-js

快乐Coding，必须要有一个高颜值的代码编辑器，主题+字体推荐

组件丰富，功能强大，方案齐全，优秀的Vue组件+前端解决方案

高颜值的小程序组件库，值得推荐——ColorUI

快速、简洁且高效的博客框架——hexo（200+主题）

优雅的博客框架，快速、简洁、高效且主题丰富——Hexo

这是我见过最优雅的Vue图片轮播插件——Vue-Awesome-Swiper

一个轻量级 JavaScript 全文搜索库，轻松实现站内离线搜索

randomColor，这是一个可以生成吸引人的颜色的脚本

生成引人注目色彩的小型Javascript脚本——randomColor

Web前端最强JavaScript Excel处理插件——exceljs

写作伙伴，精品开源Markdown编辑器——StackEdit

前端笔记——尝试理解并在JavaScript中使用Fetch()

基于React的类Excel开源数据表格组件——React Data Grid

偶遇一个开源，高隐私，自架自用的聚合搜索引擎——xinahn