【图片区域识别】OCR指定区域图片自动识别内容重命名,识别文字并批量对图片文件改名

2025-02-15ASPCMS社区 - fjmyhfvclm

电商平台上商品数量众多,图片管理任务繁重。以服装电商为例,商品图片上通常会包含商品编号、颜色、尺码、款式等信息。利用图片区域识别重命名功能,可精准识别这些区域的文字信息,将商品编号、颜色和尺码等作为新的文件名,如 “230516_白色_S_运动鞋.jpg”。这样一来,运营人员在查找特定商品图片时更加高效,能快速定位到所需的商品展示图、细节图等,大大提升了图片管理的效率和准确性。

下面教会大家快速的学习如何从图片的指定的区域自动识别后取出内容给图片重命名

第一步、️区域识别批量PDF和图片重命名

找到 Timor君发送消息:图片识别改名

这样我们可以拿到️咕嘎批量OCR识别图片PDF多区域内容重命名导出表格系统

第二步、选择图片模式,进行图片采样

我们这里批量处理的是图片,选第一个图片模式,然后对图片进行区域采样

就是要提取的部分,进行画框,然后保存每个位置的区域坐标

多个区域保存多次,然后进行下一步批量处理

第三步、导入图片文件批量处理

导入文件后选择【️区域识别重命名】和【️区域识别导出表格

需要改名选择好区域识别后重命名后,直接开始执行

所有文件名就全部在识别的过程中改好名了,还算是比较简单

如果选择的是【区域识别导出表格】

就需要再这里【导出提取表格】这样我们在完成后,就能把多个区域识别的数据导出表格

如果是PDF的文件就选择PDF的模式,操作基本上都是类似的,PDF就是有多页进行一下页码选择,其他操作完全一样

注意事项:

️图片质量方面

  • 清晰度:确保待处理的图片清晰,文字边缘锐利,无模糊、重影或过度曝光、曝光不足等问题。例如,扫描的文档图片如果分辨率过低,文字会变得模糊不清,导致 OCR 识别错误。一般来说,扫描图片分辨率应不低于 300dpi。
  • 光照均匀性:图片上的光照要均匀,避免出现局部过亮或过暗的情况。不均匀的光照会使部分文字难以识别,比如在拍摄带有文字的产品图片时,如果一侧受强光照射,另一侧较暗,那么暗部的文字可能无法准确识别。
  • 背景简洁性:尽量保持图片背景简洁,无过多干扰元素。复杂的背景可能会使 OCR 算法误将背景中的图案或线条识别为文字,影响识别准确性。例如,在识别证件照上的文字时,如果背景有复杂的花纹,就可能干扰对证件信息的识别。

️文字识别和重命名规则方面

  • 特殊字符和文件名限制:要注意操作系统和文件系统对文件名的限制,避免识别出的文字中包含不允许的特殊字符(如 \、/、:、*、?、"、<、>、| 等)。在设置重命名规则时,可以对识别出的文字进行预处理,去除或替换这些特殊字符,以确保文件名的合法性。
  • 识别准确性校验:即使 OCR 工具的识别准确率较高,也难免会出现错误。因此,在批量重命名之前,最好先对少量图片进行识别和重命名测试,人工检查识别结果是否准确。如果发现错误较多,需要调整 OCR 工具的参数或重新划定识别区域。
  • 重命名规则的逻辑性:制定合理的重命名规则,使新文件名能够准确反映图片的内容和特征,便于后续的查找和管理。规则应具有一定的逻辑性和一致性,例如,可以按照 “产品编号_颜色_尺寸_拍摄日期.jpg” 的格式进行命名。

全部评论