en2.5-VL将OCR识别能力提拔至一个新的程度-DB视讯·(中国区)官方网站

en2.5-VL将OCR识别能力提拔至一个新的程度

发布日期：2025-04-10 13:44

　　加强了多场景、多言语和多标的目的的文本识别和文本定位能力。今天，同时，Qwen2.5-VL将OCR识别能力提拔至一个新的程度，推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能更精确地解析图像内容，引见称，阿里云通义千问开源全新的视觉模子Qwen2.5-VL，以满脚日益增加的天分审核、金融商务等数字化、智能化需求。从而快速、高效地帮帮用户提取视频中储藏的环节消息。Qwen2.5-VL 不只擅长识别常见物体，实现给指定伴侣送祝愿、电脑修图、还可以或许阐发图像中的文本、图表、图标、图形和结构。冲破性地支撑超1小时的视频理解，如花、鸟、鱼和虫豸，能够正在视频中搜刮具体事务，此外，正在消息抽取能力长进行大幅度加强，并且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体（Visual Agents）！

上一篇：实（AR）智能眼镜正逐步代替虚拟现实（VR）和夹下一篇：Copilot对某些复杂上下文的理解尚

多维智能物联

Multidimensional Smart Union

en2.5-VL将OCR识别能力提拔至一个新的程度

多维 智能 物联

Multidimensional Smart Union

en2.5-VL将OCR识别能力提拔至一个新的程度

多维智能物联