文章来源:放心AI网发布时间:2025-04-28 17:27:43
阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。
其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越了GPT-4o与Claude3.5。阿里云官方介绍称,新的Qwen2.5-VL能够更准确地解析图像内容,并突破性地支持超过1小时的视频理解。该模型可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中的关键信息。
此外,Qwen2.5-VL无需微调即可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现多步骤复杂操作,如给指定朋友发送祝福、电脑修图、手机订票等。Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。阿里云还提升了Qwen2.5-VL的OCR识别能力,增强了多场景、多语言和多方向的文本识别和文本定位能力。
同时,在信息抽取能力上进行了大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。
相关攻略 更多
最新资讯 更多
阿里云通义开源Qwen2.5-VL,视觉AI超越Claude3.5
更新时间:2025-04-28
宇树科技人形机器人亮相央视春晚表演节目《秧Bot》
更新时间:2025-04-28
谷歌前CEO:DeepSeek崛起标志着全球AI竞赛新阶段
更新时间:2025-04-28
360无偿为DeepSeek提供安全服务纳米AI搜索开通“DeepSeek高速专线”
更新时间:2025-04-28
去年ChatGPT付费用户3倍增长付费订阅用户接近1550万
更新时间:2025-04-28
谷歌警告:黑客利用Gemini人工智能工具提升攻击能力
更新时间:2025-04-28
英伟达免费推出19门AI课程,助力技术爱好者掌握前沿科技
更新时间:2025-04-28
微软、英伟达带头接入DeepseekOpenAI紧急寻求400亿美元新融资
更新时间:2025-04-28
Gmail用户警惕:2.5亿账户面临AI黑客攻击威胁
更新时间:2025-04-28
OpenAI推出“深度研究”功能助力复杂信息查询
更新时间:2025-04-28