Skip to content

各种模型

Pix2Text (P2T) 整合了很多不同功能的模型,主要包括:

其中多个模型来自其他开源作者, 非常感谢他们的贡献。

这些模型正常情况下都会自动下载(可能会比较慢,只要不报错请勿手动打断下载过程),但如果下载失败,可以参考以下的说明手动下载。

除基础模型外,Pix2Text 还提供了以下模型的高级付费版:

具体说明请见本页面末尾。

下面的说明主要针对免费的基础模型。

版面分析模型

版面分析模型 下载地址:breezedeus/pix2text-layout (不能科学上网请使用 国内地址)。 把这里面的所有文件都下载到 ~/.pix2text/1.1/layout-parser (Windows 系统放在 C:\Users\<username>\AppData\Roaming\pix2text\1.1\layout-parser)目录下即可,目录不存在的话请自己创建。

注:上面路径的 1.1 是 pix2text 的版本号,1.1.* 都对应 1.1。如果是其他版本请自行替换。

表格识别模型

表格识别模型 下载地址:breezedeus/pix2text-table-rec (不能科学上网请使用 国内地址)。 把这里面的所有文件都下载到 ~/.pix2text/1.1/table-rec (Windows 系统放在 C:\Users\<username>\AppData\Roaming\pix2text\1.1\table-rec)目录下即可,目录不存在的话请自己创建。

注:上面路径的 1.1 是 pix2text 的版本号,1.1.* 都对应 1.1。如果是其他版本请自行替换。

数学公式检测模型

数学公式检测模型(MFD)来自 CnSTD 的数学公式检测模型(MFD),请参考其代码库说明。

如果系统无法自动成功下载模型文件,则需要手动从 cnstd-cnocr-models国内镜像)项目中下载,或者从百度云盘(提取码为 nstd)下载对应的zip文件并把它存放于 ~/.cnstd/1.2(Windows下为 C:\Users\<username>\AppData\Roaming\cnstd\1.2)目录中。

数学公式识别模型

数学公式识别模型 下载地址:breezedeus/pix2text-mfr (不能科学上网请使用 国内地址)。 把这里面的所有文件都下载到 ~/.pix2text/1.1/mfr-onnx (Windows 系统放在 C:\Users\<username>\AppData\Roaming\pix2text\1.1\mfr-onnx)目录下即可,目录不存在的话请自己创建。

注:上面路径的 1.1 是 pix2text 的版本号,1.1.* 都对应 1.1。如果是其他版本请自行替换。

文字识别引擎

Pix2Text 的文字识别引擎可以识别 80+ 种语言,如英文、简体中文、繁体中文、越南语等。其中,英文简体中文识别使用的是开源 OCR 工具 CnOCR ,其他语言的识别使用的是开源 OCR 工具 EasyOCR

正常情况下,CnOCR 的模型都会自动下载。如果无法自动下载,可以参考以下说明手动下载。 CnOCR 的开源模型都放在 cnstd-cnocr-models国内镜像)项目中,可免费下载使用。 如果下载太慢,也可以从 百度云盘 下载, 提取码为 nocr。具体方法可参考 CnOCR在线文档/使用方法

CnOCR 中的文字检测引擎使用的是 CnSTD, 如果系统无法自动成功下载模型文件,则需要手动从 cnstd-cnocr-models国内镜像)项目中下载,或者从百度云盘(提取码为 nstd)下载对应的zip文件并把它存放于 ~/.cnstd/1.2(Windows下为 C:\Users\<username>\AppData\Roaming\cnstd\1.2)目录中。

关于 CnOCR 模型的更多信息请参考 CnOCR在线文档/可用模型

CnOCR 也提供高级版的付费模型,具体参考本文末尾的说明。


EasyOCR 模型下载请参考 EasyOCR

高级版付费模型

除基础模型外,Pix2Text 还提供了以下模型的高级付费版:

注意,付费模型包含不同的 license 版本,购买时请参考具体的产品说明。

建议购买前首先使用 在线 Demo(无法科学上网可以使用 国内 Demo验证模型效果后再购买

模型购买地址

模型名称 购买地址 说明
MFD pro 模型 Lemon Squeezy 包含企业版和个人版,可开发票。具体说明见:P2T详细资料
MFD pro 模型 B站工房 仅包含个人版,不可商用,不能开发票。具体说明见:P2T详细资料
MFR pro 模型 Lemon Squeezy 包含企业版和个人版,可开发票。具体说明见:P2T详细资料
MFR pro 模型 B站工房 仅包含个人版,不可商用,不能开发票。具体说明见:P2T详细资料
CnOCR pro 模型 Lemon Squeezy 包含企业版和个人版,可开发票。具体说明见:P2T详细资料CnOCR详细资料
CnOCR pro 模型 B站工房 仅包含个人版,不可商用,不能开发票。具体说明见:P2T详细资料CnOCR详细资料

购买过程遇到问题可以扫码加小助手为好友进行沟通,备注 p2t,小助手会尽快答复:

微信交流群

更多联系方式见 交流群