
阿里千问模子加入AI大模子“春节档”。2月16日大除夕今日,阿里巴巴开源全新一代大模子千问Qwen3.5-Plus,性能比好意思Gemini 3 Pro,登顶环球最强开源模子。千问3.5杀青了底层模子架构的全面校阅,Qwen3.5-Plus版块总参数为3970亿,激活仅170亿,以小胜大,性能特出万亿参数的Qwen3-Max模子,部署显存占用缩短60%,推理着力大幅提高,最大推理朦拢量可提高至19倍。Qwen3.5-Plus的API价钱每百万token低至0.8元,仅为Gemini 3 Pro的1/18。另外,千问性能更强的旗舰模子Qwen3.5-Max不久也将发布。
与前几代的千问大说话模子不同,千问3.5杀青了从纯文本模子到原生多模态模子的代际跃迁。千问3预磨练在纯文本Tokens上进行,而千问3.5则基于视觉和文本夹杂token上预磨练,并大幅新增中英文、多说话、STEM和推理等数据,让伸开“眼睛”的大模子学会了更密集的寰宇常识和推理逻辑,以不到40%的参数目取得超万亿的Qwen3-Max基座模子的顶尖性能,在推理、编程、Agent智能体等全方向基准评估中均阐扬优异。

阿里开源千问Qwen3.5-Plus,性能比好意思Gemini 3 Pro
原生多模态磨练也让千问3.5的视觉才调飞跃:在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文献交融(CC_OCR)、空间智能(RefCOCO-avg)、视频交融(MLVU)等稠密泰斗评测中,千问3.5均斩获最好性能。
据了解,千问3.5性能跃升的背后,是对Transformer经典架构的首要翻新冲突。千问团队自研的门控本领着力,曾斩获环球AI顶会2025 NeurIPS最好论文,该前沿本领已融入千问3.5翻新的夹杂架构中,团队勾引线性预防力机制与寥落夹杂群众MoE模子架构,杀青了397B总参数激活仅17B的极致模子着力;同期,千问3.5通过磨练踏实优化以及多 token 揣度等系列本领,Qwen3.5性能与Qwen3-Max模子抓平,并进一步提高了推理着力:在常用的32K险阻文场景中,千问3.5推理朦拢量可提高8.6倍;在256K超长险阻文情况下,Qwen3.5推理朦拢量最大提高至19倍,推理着力大幅提高。

千问3.5推理着力大幅提高,最大朦拢量提高至19倍。
千问3.5的原生多模态磨练,是在阿里云AI基础次序上高效完成的。通过系列基础本领翻新,千问3.5在文本、图像、视频等夹杂数据磨练朦拢量,几近100%抓平纯文本基座模子磨练,大举缩短了原生多模态磨练的难度门槛;同期,通过测度打算小巧的FP8、FP32精度运用计策,在磨练踏实延长到数十万亿个token时,激活内存减少约50% ,磨练还能提速10% ,进一步量入制出了模子磨练本钱、提高了磨练着力。
基于顶级视觉才调,千问3.5也杀青了从Agent框架到Agent运用的新冲突。千问3.5可自主操作手机与电脑,高效完成闲居任务,在转移端撑抓更多主流APP与教导,在PC端可照顾更复杂的多体式操作,如跨运用数据整理、自动化历程扩充等,权贵提高操作着力。同期,千问团队构建了一个可延长的Agent异步强化学习框架,端到端可加快3到5倍,并将插件式智能体Agent撑抓延长至百万级限制。
连日来,国产大模子集体上新霸占“AI春节档”。2月14日,字节高出文告推出豆包大模子2.0系列。豆包2.0针对大限制坐褥环境的使用需求进行系统性优化,旨在更好地完成真确寰宇的复杂任务。2月13日,MiniMax上线新一代文本模子MiniMax M2.5后,官宣该模子环球开源撑抓土产货化部署。
更早前,字节高开赴布Seedance2.0欧洲杯体育,因为其传神画面、电影级运镜在近日激励热议。阿里也雅致发布新一代图像生成及剪辑模子Qwen-Image-2.0。DeepSeek App更新新版块至1.7.4版块,网页端也同步进行了更新。面壁智能发布并开源了新一代全模态旗舰模子 MiniCPM-o 4.5。