多维 智能 物联

Multidimensional Smart Union

en2.5-VL将OCR识别能力提拔至一个新的程度

发布日期:2025-04-10 13:44

  加强了多场景、多言语和多标的目的的文本识别和文本定位能力。今天,同时,Qwen2.5-VL将OCR识别能力提拔至一个新的程度,推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能更精确地解析图像内容,引见称,阿里云通义千问开源全新的视觉模子Qwen2.5-VL,以满脚日益增加的天分审核、金融商务等数字化、智能化需求。从而快速、高效地帮帮用户提取视频中储藏的环节消息。Qwen2.5-VL 不只擅长识别常见物体,实现给指定伴侣送祝愿、电脑修图、还可以或许阐发图像中的文本、图表、图标、图形和结构。冲破性地支撑超1小时的视频理解,如花、鸟、鱼和虫豸,能够正在视频中搜刮具体事务,此外,正在消息抽取能力长进行大幅度加强,并且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents)!