智谱开源多模态大模型 GLM-4.6V 系列
栏目:广告资讯 发布时间:2025-12-13
智谱AI正式推出GLM-4.6V系列开源多模态大模型,涵盖旗舰级GLM-4.6V(106B-A12B)与轻量免费版GLM-4.6V-Flash(9B)。该系列首创“图像即参数,结果即上下文”的原生多模态工具调用机制,支持高达128K的视觉上下文长度,可一次性解析约150页PDF文档或长达1小时的视频内容。GLM-4.6V(106B-A12B):专为云端服务及高性能计算集群优化的基础版本;GLM-4.6V-Flash(9B):面向终端设备、边缘部署及低延迟交互场景设计的精简版本。作为GLM家族在多

智谱ai正式推出glm-4.6v系列开源多模态大模型,涵盖旗舰级glm-4.6v(106b-a12b)与轻量免费版glm-4.6v-flash(9b)。该系列首创“图像即参数,结果即上下文”的原生多模态工具调用机制,支持高达128k的视觉上下文长度,可一次性解析约150页pdf文档或长达1小时的视频内容。

  • GLM-4.6V(106B-A12B):专为云端服务及高性能计算集群优化的基础版本;
  • GLM-4.6V-Flash(9B):面向终端设备、边缘部署及低延迟交互场景设计的精简版本。

作为GLM家族在多模态方向的关键升级,GLM-4.6V将训练阶段支持的最大上下文扩展至128K tokens,在视觉理解准确率方面刷新同参数量级SOTA纪录,并首次在模型底层架构中深度集成 Function Call(函数/工具调用)能力,实现从「视觉输入感知」到「可执行操作指令」的端到端闭环,为构建真正可用的多模态智能体(Multimodal Agent)提供统一、高效的技术支撑。

在涵盖图文问答、视觉推理、跨模态检索等在内的30余项权威多模态基准测试中,GLM-4.6V全面领跑同规模竞品;其API调用成本相较前代下降50%。典型落地场景包括:AI图文协同创作、视觉驱动的智能导购助手、网页截图→前端代码一键生成、以及长时序视频内容结构化分析。全部模型权重与配套代码已同步上线GitHub、Hugging Face及魔搭(ModelScope)平台。

开源与部署

为降低开发者使用门槛,智谱同步开放完整技术栈:模型权重、推理脚本、示例工程及在线体验入口。

开源资源

GLM-4.6V全系列模型权重、推理代码与参考项目均已开源:

  • GitHub:https://www./link/bcb05a6084cb31de74aeeb74e1ff1b92
  • Hugging Face:https://www./link/b08d78964e17a35d839c83272194e1c4
  • 魔搭社区:https://www./link/91ca7ff824876a675d873fe72d715f49

当前已适配主流推理框架,包括 SGLang、vLLM、transformers、xLLM 及昇腾NPU专用加速库,支持在NVIDIA GPU及多种国产AI芯片(如昇腾Ascend)环境下灵活部署GLM-4.6V与GLM-4.6V-Flash。

开放平台与在线调用

除本地化部署外,智谱还提供全托管式云推理服务与标准化API接口,助力企业快速集成:

  • 官方开放平台文档:https://www./link/99b3613c6a997dc4195f957f89282e0c
  • Coding Plan 视觉MCP服务:https://www./link/6f1098383b8d527a7b2391d00b0dda70

在线体验通道:

  • z.ai:切换至 GLM-4.6V 模型,实时体验多模态理解与原生工具调用;
  • 智谱清言 APP / 网页端:上传任意图片或视频,启用「推理模式」,畅享长上下文多模态分析能力。

技术深度解析博客:z.ai/blog/glm-4.6v

源码地址:点击下载


# 接口  # 专为  # 长达  # 点击下载  # 终端设备  # 首次  # 闭环  # 文档  # 前代  # 开源  # 多模  # 开放平台  # https  # function  # 前端  # 架构  # api调用  # 本地化  # ai芯片  # 大模型  # pdf  # ai  #   # nvidia  # 工具  # app  # github  # git 


相关文章: 小米或在年底前为25款设备推送HyperOS 3 你的在列吗?  2026年国补政策来了:一加手机最高优惠800元  工信部:1-11 月人工智能核心产业超过万亿元  “长在手上”的遥控器 如何承包牛奶盒子的亮点  OPPO 姜昱辰谈 AI 手机发展方向:GUI Agent 为过渡,未来将实现 A2A  Intel入门18核至强654首次跑分:与28核3465X相当!  AI专业工程师本!联想ThinkPad T14 2025 AI元启  IntelliJ IDEA 2025.3 迎来“一站式”新时代  2026换新机认准“骁龙8”!这份国补购机指南快收好  IDEA 插件 Maven With Me 更新 2.6.x 版本,新增自动同步项目配置助力多 JDK 版本开发!  内存价格狂飙:多家商店直接暂停PC订单 有钱也买不到  反传统的Patagonia,不想赚钱  用鸿蒙一年才懂:这些创新功能,重新定义了社交App的好用程度  OpenAI 为 ChatGPT 推出“格式化块”功能  22岁女天才攻破NVIDIA Tegra X2!特斯拉在内所有设备都能破解:无法修复  220万跑分+10080mAh超大电池!荣耀Power 2配置曝光  荣耀Magic8 Pro荣获2025 CNMO年度评选“AI手机新范式”  锐龙AI MAX+ 395赋能千行百业--之保险理财  智慧戒指也能遥控电脑?从Apple Ring专利轨迹一窥苹果穿戴装置布局  杀神来了!曝《疾速追杀》3A级动作游戏正在开发中  纽约学校手机禁令暴露问题:部分高中生不会看指针钟表  一加李杰官宣Turbo系列开启预约:赠便携背包,12月28日|直播|曝更多细节  iQOO Z11 Turbo外观公布:横向镜头布局  欢庆辉煌30载!《宝可梦》集换式卡牌麦当劳週年限定包2026上市  由于要加入多人模式 《赛博朋克2077》续作有望在2030年底发售  Midscene v1.0 发布 - 视觉驱动,UI 自动化体验跃迁  三星传研发全新宽版摺叠机「Wide Fold」 剑指2026摺叠iPhone  2026年1月发布新机曝光 六大新品乱战看点十足  ​年度热梗轮番炸场!真我GT8 系列:敢越级的街拍神器,还能装下你的「真我态度」  梦幻西游副本速通全攻略:从门槛到实战的全面指南  交通运输行业VMware替代合集:3大案例详细解读国产虚拟化评估替代之路  香港大学开源个人 AI 学习助手:DeepTutor  《咒怨》真人版! 《最终幻想7》开发期间神秘bug吓得制作人心脏骤停  OPPO Find N6曝光:骁龙8 Elite Gen5+北斗卫星  握拳、捏指就能测健康?Xiaomi Watch 5 全球首发 EMG 手势感测技术!  一加Turbo外观出炉 李杰:非常好看 简直是一股清流  最特别的生日!红魔姜超用红魔11 Air吹灭生日蜡烛  深度复盘鸿蒙版微信这一年:2025 年,我们在鸿蒙上重新认识微信  《GTA6》或有第一人称模式 粉丝从预告片发现线索  三星Wide Fold与苹果iPhone Fold渲染图曝光  聚焦通用航空增长潜力,德意志飞机D328eco助力印度构建区域航空新生态  20000mAh硅碳电池!三星短期很难量产  《孤岛惊魂2》Xbox服务器意外“复活”多人模式回归  当非遗遇上AI:问答、深度研究…看小艺如何用科技赋能非遗传承  OpenAI 席卷美国高校,售出超 70 万份 ChatGPT 许可  电竞机也能拍大片!荣耀WIN搭载旗舰拍照算法 罗巍:绝对是同档位最顶  4TB数据传输难:物理搬运竟比网络更快  2025年苹果iOS贡献全球35%移动流量 安卓设备占65%  全能游戏搭档:三星OLED电视点亮家庭娱乐新场景  携程声明:与柬埔寨国家旅游局合作未曾启动,绝不存在泄露用户隐私信息情况 


相关栏目: 【 广告资讯37196 】 【 广告推广143353 】 【 广告优化89630