CS扫描王上线“智能高清滤镜”,多重难题AI一键解决

现阶段,手机扫描正越来越多地进入到人们的生活中。随着扫描应用场景的不断拓宽,诸多细节层面的问题逐渐显露,比如使用者在拍照扫描文档时,发现手指不小心“入镜”了,只能重拍;拍电脑屏幕时,画面上有一些彩色条纹,既不美观也影响内容识别;拍完照片后,扫描处理时需要手动试验好几种图片处理方案,才能获得理想的效果......这些“糟心事”,如今被一个滤镜轻松解决了。

近期,扫描全能王“智能高清滤镜”正式上线。该功能采用AI技术,智能检测图像中存在的问题,自动判定图像优化方式,实现模糊、阴影、手指、屏幕纹等干扰因素全处理。使用者无需思考拍摄角度、光源、背景,只要点击拍摄按钮,便可得到一张如原稿打印般清晰、平整的图片。

扫描“一键到位”的背后,AI在帮人“思考”图像问题

与传统的手机扫描流程相比,扫描全能王的“智能高清滤镜”选择让AI代替人去“思考”图片中需要解决的问题,并为用户自动选择出最优处理方案,通过算法上的智能研判,达成多项问题一键解决的效果。

据扫描全能王产品负责人Kevin介绍,“智能高清滤镜”的智能研判主要基于精准的图像感知,来达成场景化的决策效果。在图像感知阶段,AI主要进行通识性的图像处理,通过深度学习模型,感知到图像中的光照、阴影、颜色和倾斜角度等特征并进行处理,例如去除手指产生的遮挡、感知到图像是过暗还是过亮,然后针对性地调整图像的亮度和对比度等。

“智能高清滤镜”在拍PPT中的去摩尔纹处理效果

场景化决策即根据图像感知的结果,判定图像属于何种场景,并进行个性化的处理。例如,试卷、发票的图像特点不尽相同,“智能高清滤镜”能够迅速判定文档种类并进行处理方法决策,在办公文档电子化、教育资料处理、商务资料留存等涉及文档处理的场景中具有广阔的应用前景。

智能扫描引擎,让AI读懂图像与文字

“智能高清滤镜”多项“黑科技”功能的实现,离不开智能扫描引擎AI-Scan(简称“AI-Scan引擎”)的支持。AI-Scan引擎基于合合信息智能文字识别、智能图像处理技术,对图像处理、文字识别及版面还原进行全面优化,综合提升扫描效果。

展开全文

图像处理对于文档处理中所涉及的文字识别等后续流程非常关键,目前还存在着许多典型的痛点,最常见的就是“图像视觉矫正”。现实生活中,书本等文档并不总是平面的,AI在处理相关图片时需要进行“矫正”。此外,由于拍摄角度和镜头畸变的问题,即使是平面的文档,拍摄后也可能出现透视扭曲。扫描全能王采用了基于深度学习的曲面检测和矫正技术来进行处理,能够应对各种复杂的曲面文档。

“智能高清滤镜”书本曲面处理效果

反光、阴影等干扰物是降低图像质量的重要因素,也是图像处理需要解决的问题。扫描全能王在AI-Scan引擎的支持下,能够在去除干扰的同时,保存原有文档的细节信息。例如在阴影去除方面,扫描全能王可以在处理阴影同时,使得去阴影的效果更接近于真实的无阴影文档。

完成图像处理之后,如何从图片中正确提取所需要信息,与文字识别能力息息相关。全球化的深化使得多语种识别成为了一项高频需求,也为文字识别领域带来了巨大的挑战。多语种识别的困难点主要来源于不同语种之间的独特字符集、书写规则和语法结构间的差异,以及复杂的文本形态和排版方式的影响。

例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同位置有着不同的形态。对于这种语言,传统的文字识别方法往往难以应对。此外,像泰语和印地语这样的语言,它们的书写系统相对复杂,有时一个字符可能会出现在另一个字符的上方或下方,这对于文字识别来说无疑增加了额外的困难。

为了克服这些挑战,扫描全能王在AI-Scan引擎的支持下,采用了一种结合深度学习和自然语言处理的全新方法,能够有效地处理不同语种的字符关联和顺序问题。在服务全球亿级别用户的过程中,扫描全能王对大量的多语种文本进行预训练,能够对全球五十多个语种的文档进行识别,满足了全球超过100个国家和地区用户的办公、生活需求。

“华盛顿邮报等媒体曾将扫描全能王称作‘手掌扫描仪’,因为这款产品实现了在低资源、性能低的移动设备下高准确率、高效率、高稳定性的识别体验。‘做小、做轻’是上一个阶段的任务,与前沿技术的结合,将促成扫描智能化时代的到来。”Kevin 表示,在过去的十年里,扫描全能王是最早将AI与OCR等技术综合运用的APP。未来团队将持续保持对AI底层技术的关注,用科技为全球用户提供有价值的文档智能服务。返回搜狐,查看更多

2026-06-18 00:14:40
五本轮回者类小说,依托主神世界,穿梭不同位面,走上人生巅峰!
iPhone与Sony耳机的对比评测(选购耳机前的重要决策与对比)