文字识别的搜索结果_文章-阿里云开发者社区

游客3g2isv2zt6tuw

|

23小时前

|

博文

文字识别自动点击器，脚本识别文字然后点击软件，按键精灵识别文字点击

该实现包含完整的OCR识别和自动化点击功能，支持多种配置选项和文本匹配模式。使用时需

# 文字识别 # 文字识别 # Python

游客3g2isv2zt6tuw

|

1天前

|

博文

自动识别图片点击脚本，文字识别自动点击器，能识别屏幕内容并自动点击

本方案采用OCR文字识别+图像匹配双模式识别技术： OCR引擎识别屏幕文字内容 OpenCV模板匹配识别图形元素 PyAutoGUI实现

# 文字识别 # JSON # 文字识别 # 并行计算 # 计算机视觉 # Python

老乡别走

|

6天前

|

博文

【图片识别改名】图片文件区域OCR识别并自动重命名，根据指定区域识别文字批量改名，阿里云的文字识别方案

本系统通过OCR技术实现图片和PDF文件中关键信息的批量识别与智能重命名，适用于档案管理、电商商品管理、学术研究及企业文档处理等场景。支持区域选择、识别参数设置及自定义重命名规则，提供可视化界面与进度跟踪功能，提升文件整理与管理效率。

# 文字识别 # 文字识别 # 前端开发 # 数据可视化 # BI # Python

yunmai

|

2月前

|

博文

OCR技术：解锁文字识别的无限可能

OCR（光学字符识别）技术是数字化浪潮中的关键工具，可将纸质文档、手写笔记或复杂背景下的文字图像转化为可编辑文本。本文从图像采集、预处理、字符识别到文本校正，全面解析OCR技术的原理，并探讨其在智能办公、智慧交通、便捷生活等领域的广泛应用。未来，OCR将与自然语言处理、计算机视觉等技术深度融合，推动智能化和综合化发展。通过开放生态系统和政策支持，开发者可探索更多创新场景，如古籍数字化、盲人阅读等，为社会带来更多价值。

# 文字识别 # 机器学习/深度学习 # 文字识别 # 自然语言处理 # 算法 # 开发者

1918010837065910

|

4月前

|

博文

HarmonyOS NEXT AI基础视觉服务-文字识别

本案例展示了一款基于AI基础视觉服务的文字识别应用，通过调用设备相机拍摄照片并识别图片中的文字内容。主要实现步骤包括：1) 导入所需功能模块；2) 调用相机获取图片URI；3) 将图片转换为可识别的像素图；4) 配置视觉识别参数并执行文字识别；5) 构建界面组件，实现拍照与结果显示交互。核心要点涵盖相机权限、图像格式兼容及结构化识别结果处理，完整代码整合了各功能模块的调用流程，确保功能顺畅运行。

# 文字识别 # 人工智能 # 文字识别 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

moonshot-v1-vision-preview：月之暗面Kimi推出多模态视觉理解模型，支持图像识别、OCR文字识别、数据提取

moonshot-v1-vision-preview 是月之暗面推出的多模态图片理解模型，具备强大的图像识别、OCR文字识别和数据提取能力，支持API调用，适用于多种应用场景。

# 文字识别 # 人工智能 # 文字识别 # API # Python

哈德门66

|

7月前

|

博文

实战阿里通义灵码极速编程-截屏-OCR-OLlama篇

通过实际案例展示阿里通义灵码如何极大提高编程效率。以开发屏幕截图OCR Python程序为例，使用Win10、Anaconda3、VS Code及通义灵码插件。经过四次提问与优化，从截屏选择矩形区域到调用大模型进行OCR识别，整个过程仅耗时半小时，最终形成可运行的控制台程序。加入界面开发后，总用时2小时，显著提升开发速度和质量。

# 文字识别 # 文字识别 # 程序员 # C++ # Python

阿里云开发者

|

7月前

|

博文

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

# 文字识别 # JSON # 文字识别 # API # 对象存储 # 数据格式

思通聚宝

|

8月前

|

博文

7大核心技术：智能OCR如何助力市政单位文档处理数字化转型

随着政务服务数字化的推进，市政单位面临复杂的文档处理需求。本文介绍了一种基于智能OCR技术的一站式文档处理方案，涵盖数据矫正、通用文字识别、表格与票据结构化提取、卡证分类、印章检测、手写文字识别及图像内容识别等核心技术，显著提升工作效率与文档解析的准确性。

# 文字识别 # 机器学习/深度学习 # 数据采集 # 文字识别 # 算法 # 计算机视觉

思通聚宝

|

8月前

|

博文

AI与OCR：数字档案馆图像扫描与文字识别技术实现与项目案例

本文介绍了纸质档案数字化的技术流程，包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取，以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术，提高图像质量，确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储，实现了高效、准确的档案数字化。具体应用案例显示，该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。

# 文字识别 # 存储 # 人工智能 # 文字识别 # 算法 # 数据库

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

文字识别