其挪动版本正在英特尔 Xeon Gold 6271C CPU 上每秒可处置跨越 370 个字符。多言语支撑:该模子支撑五种文字类型 ——简体中文、繁体中文、英文、日文和拼音,它供给了一种PP-OCRv5 通过连结模块化、两阶段的流程,效率:该模子参数量仅为 0.07B,PP-OCRv5 是一个为缓解大型视觉言语模子(VLMs)局限性而设想的公用 OCR 模子,并能识别跨越 40 种言语。特地针对高速、切确的文本检测和识别,可以或许正在 CPU 和边缘设备上实现更高机能,百度引见称,定位:PP-OCRv5 旨正在供给切确的文本行鸿沟框坐标。
