首页
学习
活动
专区
圈层
工具
发布

#ocr

自动生成case:基于 OCR + LLM 的图文混合需求解析方案

沈宥

在智能座舱、ADAS 或车联网等复杂系统的需求文档中,纯文字描述早已无法满足表达需要。产品经理和系统工程师更倾向于使用:

2600

基于大模型与光学字符识别(OCR)融合的文档抽取技术,为证照管理提供了新的技术路径

中科逸视OCR专家

企业证照管理是组织运营中的基础性工作,涉及营业执照、资质证书、许可文件等多种类型文档的归档、核验与更新。传统管理方式多依赖人工录入与复核,存在效率瓶颈与差错风险...

2100

突破结构幻觉:FireRed-OCR 技术解析与行业应用实践

LiuDag

信息提取与流转的核心环节,其效率与精度直接决定了各行业数字化进程的质量。传统OCR技术虽能实现基础文字识别,但在处理复杂文档(如多栏排版、复杂表格、数学公式、手...

3810

基于 AI 与深度学习的银行卡识别系统解析

中科逸视OCR专家

从线上绑卡、财务结算到政务补贴发放,银行卡信息录入几乎贯穿于现代服务的每一个环节。传统人工录入方式效率低、易出错,已难以满足大规模、高并发的业务需求。依托 AI...

11410

计算机视觉+自然语言处理:机动车登记证识别背后的技术组合

中科逸视OCR专家

机动车登记证书(即“大绿本”)是车辆产权归属的核心法律文件,在流通、金融、司法等环节中具有关键作用。传统的人工核验与信息录入方式存在效率低、易出错、防篡改能力弱...

5700

一种基于大模型微调训练与高精度OCR的文档抽取技术,实现对合同文本中关键要素的高精度语义理解与结构化抽取

中科逸视OCR专家

在企业的日常经营活动中,合同文档的审核、管理与信息提取是一项高频且关键的工作。传统人工处理方式不仅效率低下,且难以应对大规模、多样化的合同版式。一种基于大模型微...

12900

15个图片转文字软件,包括OCR识别等功能

搜罗万相

目前市场上存在一些图片文字识别工具,我但好多收费的,或是别人改款的,所以推荐一些比较主流的!

44710

面向网约车合规化监管的智能运输证识别技术:基于CV与NLP深度融合的网约车运输证识别系统

中科逸视OCR专家

随着共享出行行业的规范化发展,网约车平台对车辆合规性的审核需求日益严苛。《网络预约出租汽车运输证》(以下简称“运输证”)作为车辆合法运营的核心凭证,其信息的自动...

14210

浅析图像处理、深度学习以及自然语言处理在手写识别中的协同工作原理

中科逸视OCR专家

手写文字识别(Handwritten Text Recognition, HTR)是模式识别领域一个历史悠久且极具挑战性的课题。与印刷体不同,手写体具有极大的可...

16010

🦞 一只AI龙虾的觉醒:从"瞎看"到"真香"

杨行之的数字宇宙

这只龙虾名叫克劳德。它只是一个AI Agent,来自大名鼎鼎的openclaw星球。但如果一切顺利——它可能会变成我的第二大脑。

10210

别再手动录发票了!用腾讯龙虾Skills,让财务提前 2 小时下班

程序员晚枫

腾讯云TDP | 宣传大使 (已认证)

在这次大会上,我也分享了我如何用腾讯云 Lighthouse部署openclaw的。

88970

20M小模型的数学公式OCR,复杂公式截图秒转LaTeX代码!

开源星探

对于常写文档、做数学研究、准备学术论文的同学来说,数学公式 LaTeX 化几乎是绕不开的痛点。

27710

腾讯又放大招!开源原生端到端 OCR 模型,1B 参数吊打PaddleOCR!

开源星探

虽只有 1B 体量,却在权威基准 OmniDocBench 拿下 94.1 的高分,直接超越 DeepSeek-OCR、PaddleOCR-VL同类能力。

43610

OCR 界的“超级小钢炮”!LightOnOCR-2-1B 发布:1B 参数,千页成本不到 7 分钱!

开源星探

长期以来,为了追求极致的 OCR 效果(特别是处理复杂的数学公式、多栏排版和表格),我们往往不得不使用庞大的多模态模型。效果是好了,但推理成本和速度也上去了。

22710

DeepSeek 硬核开源 DeepSeek-OCR-2!弃用 CLIP 改用 Qwen,创新视觉因果流!

开源星探

Kimi 发布了 K2.5,视觉编程能力明显跃迁,给一张截图、一个录屏,就能直接复刻网页和 App,还有一个核心自主式智能体蜂群 Agent Swarm 范式,...

47710
领券