(来源:财通证券研究)
+ + + + 重要提示 + + + +本微信号推送的内容仅面向财通证券客户中符合《证券期货投资者适当性管理办法》规定的专业投资者。本微信号建设受限于难以设置访问权限,为避免不当使用所载内容可能带来的风险,若您并非专业投资者,请勿订阅、转载或使用本微信号的信息。
]article_adlist-->核心观点 ]article_adlist-->中国AI新浪潮:Kimi K2“开源冲击波”,“又一个DeepSeek时刻”。2025年全球AI高速发展,中美大模型竞争激烈。7月11日Moonshot AI发布的Kimi K2开源模型成焦点,被视为中国AI差异化竞争策略,获“又一个DeepSeek时刻”评价,标志中国开源大模型具世界级竞争力。该模型采用MoE架构,总参数量1万亿,激活参数约320亿,以“智能体潜能”见长,编码能力突出。技术上优化自DeepSeek-V3,擅长执行明确计划,是自动化工作流理想“执行者”,聚焦编码等场景极致表现。此前Kimi推出内测产品Kimi-Researcher,依托K1.5的Agent能力完成复杂研究,多项基准测试成绩良好,K2推出后其能力将升级。K2开源且API定价极低,远低于同类产品,通过低成本吸引开发者构建生态,未来可通过企业服务等盈利。综上,K2标志中国AI在大模型领域重大突破,开源策略能吸引开发者、挑战闭源巨头,提供高性价比替代方案。
美国AI双雄会:Grok 4与ChatGPT Agent的策略分野。马斯克旗下xAI于7月10日推出Grok 4,其训练量较Grok 2提升100倍。工具使用能力内化训练,20万张GPU超算支持,Colossus超算总内存带宽达194 PB/s,存储容量超1EB。Grok 4能力卓越,推理与多模态表现突出:SAT、GRE接近满分,HLE无工具解决率25.4%,Heavy版本超50%;GPQA等多个基准测试全面超越ClaudeOpus4等对手。多模态上,ARC-AGI-2刷新纪录达15.9%。xAI计划8月发布代码模型,9月推多模态智能体,10月出视频生成模型,明年有望推出AI生成游戏,将构建技术-场景-生态三级平台。7月18日,OpenAI发布ChatGPT Agent,这是基于GPT-4架构的先进多模态通用AI代理系统,实现从被动应达到主动代理的升级,能规划任务、调用工具并自主执行,具备强大多模态理解和超长上下文处理能力,结合Operator和Deep Research形成端到端通用Agent。其在复杂任务中表现出色:HLE评估Pass@1分数41.6;DSBench测试显著超越此前最先进模型,数据分析任务表现优于人类。
海内外大模型百花齐放,AI新时代悄然已至。我们认为,未来1-2年全球AI将以加速融合、能力跃升和应用深化为主线:Agent能力、多模态理解生成成标配,上下文窗口扩大,混合专家架构平衡性能与成本;开源闭源竞合加剧,推动技术进步与成本下降,伦理安全监管标准趋完善;AI深度渗透多行业,通过API服务和行业模型驱动转型,催生新商业模式。投资上,AI硬件与应用共谱新篇章。
风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险。
正文内容
01
中国AI新浪潮:Kimi K2“开源冲击波”,“又一个DeepSeek时刻”
月之暗面Moonshot AI发布Kimi K2基座模型吹响“又一个DeepSeek时刻”。2025年,全球人工智能领域持续经历着前所未有的高速发展与激烈竞争,中美大模型研发和产品迭代尤为引人注目。近日,一批业内领先的AI大模型相继涌现,正深刻地改变着人机交互的方式,并有望在各行各业催生创新应用。7月11日,Moonshot AI发布Kimi K2开源模型,成为全球AI领域的一大焦点。我们认为,它不仅是性能强大的模型,更代表中国AI力量在全球竞争中采取的一种差异化、高影响力的策略。Kimi K2的出现,被业界评价为“又一个DeepSeek时刻”,标志着中国在开源大模型领域已具备世界级的竞争力。
1.1 目前最大开源模型之一,基于DeepSeek-V3优化推进底层技术创新
Kimi K2具有庞大参数规模与高效MoE架构,擅长执行自动化工作流长任务。Kimi K2采用了混合专家(Mixture-of-Experts, MoE)架构,总参数量高达1万亿,在处理每个任务时激活约320亿参数。在模拟真实世界软件开发任务的SWE-bench上,Kimi K2的性能与闭源模型Claude 4 Opus非常接近;而在衡量实时互动编程能力的LiveCodeBench上,Kimi K2以53.7%的准确率超越了GPT-4.1和Claude 4 Opus。我们认为,综合以上数据,Kimi K2尤其擅长执行具体的、定义明确的计划,是构建自动化工作流的理想“执行者”。
Kimi K2的核心技术优势主要体现在以下几个方面:
基于DeepSeek-V3的继承与优化。在设计之初团队进行了大量模型结构相关的scaling实验,基于实验结果的准确有效性和成本的考量,模型结构的设计问题主要集中于如何在给定DeepSeek-V3结构的框架下选择合适的参数使得模型在训练、推理成本与DeepSeek-V3相当的前提下,获得明显更低的数据损失。为此,技术团队在复用DeepSeek的MLA(Multi-Head Latent Attention)的基础上进行优化,具体的改动主要包含:
减少注意力头:减半attention heads以降低Infra的压力,同时减少num_heads变数以实现时间和成本的平衡;
提升专家数量:将专家数量从256升到384,既为了补回没有double heads带来的损失,同时也能符合实测的Scaling Law。即在一定范围内,固定激活的专家数量,使得增加总专家数带来的效果收益,大于增加的Infra成本;
精简前期Dense层:将前置Dense层数由3降至1。与DeepSeek的观察类似,第一层MoE的router很难做到负载均衡,但第二层之后则未出现问题;为了更充分利用MoE优势,技术团队只保留第一层Dense,其余全用MoE;
MoE Router简化,n_group=1:在当前模型参数规模下,为保证MoE计算耗时在合理范围内,采用更自由的router方案使得expert的组合空间显著增大,从而进一步提升模型能力。
总结来看,K2技术团队在DeepSeek-V3原有框架基础上进行优化,通过减少“注意力头”来降低服务器压力,同时增加专家数量以补回效果损失;此外还精简了前期固定层,仅保留一层,并让专家调度更灵活,取消分组搭配,从而使组合方式更多样,效果也更好。
底层技术创新提升训练稳定性:月之暗面团队自研“MuonClip”优化器,克服“训练崩溃”问题。根据其技术报告,MuonClip通过一种创新的“qk-clip”技术,在训练过程中动态调整权重,有效防止了注意力分数的爆炸,从而确保了在15.5万亿tokens的庞大数据集上训练过程的“零不稳定”。这一底层工程和算法的突破,是Kimi K2能够成功问世的核心技术保障之一。
1.2 Kimi:主打AI Agent与“高性价比”的实战派
Kimi K2作为优化AI Agent的实战模型,其功能并非追求在所有领域都做到顶尖,而是在开发者最需要的编码和工具调用等场景中做到极致,在智能体任务的完成速度与质量中进步。
工具调用及数学推理能力:在工具调用能力测试中表现接近行业领先水平,具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构;在AIME 2025中得分高达49.5,在数学定理和逻辑判断方面表现出色,是研究和教育用户的高性价比方案。
前端开发能力和APP兼容性:擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式,具备较强的图形能力与交互性。
性能与局限性的平衡视角:作为一个“非思考”模型,Kimi K2的优点在于响应速度快,拥有128K的长上下文处理能力,并且在编码等特定任务上表现优异。局限性在于,对于需要深度、多步、复杂逻辑推理的任务,其能力可能不及思考型模型。
Kimi-Researcher在应用场景、成本、生态全方位撬动市场格局。在Kimi K2发布前夕,Kimi发布Agent产品 Kimi-Researcher。其作为Moonshot AI在2025年6月底开启内测的垂直场景应用产品,其底层模型当前调用K1.5,通过K1.5的Agent能力,自动完成复杂研究任务,并输出交互式内容,而非传统文本对话。目前,Kimi Researcher在Humanity’s Last Exam (HLE)中获得了26.9%的Pass@1分数,Pass@4 准确率为40.17%。此外,在xbench-DeepSearch上实现了69%的通过率。在多轮搜索推理FRAMES,Seal-0和事实信息SimpleQA的基准测试中,Kimi-Researcher也取得了很好的表现。后续,随着Kimi K2模型的推出,Kimi-Researcher能力也将更上一层楼。
极具性价比的定价与生态驱动的商业模式。Kimi K2此次不仅以开源形式大方问世,同时采用极具性价比的API定价策略,其价格远低于OpenAI和Anthropic的同类产品,极大程度上吸引了对成本敏感的开发者和企业。与此同时,Kimi K2秉持生态驱动的商业模式,商业逻辑是通过免费和极低成本的API服务吸引海量开发者和用户,迅速扩大在AI应用层的基础,以此培养用户习惯并形成强大网络效应;随着生态成熟,月之暗面未来可通过提供企业级解决方案、定制化服务或与云厂商合作分润等方式实现盈利,而其宽松的商业使用条款则有望进一步加速这一进程。
综上,我们认为Kimi K2的发布标志着中国AI公司在大规模语言模型领域的重大突破,展示了其在万亿参数模型训练、MoE架构设计和代码能力方面的技术实力,同时也反映了开源AI模型在中国的快速发展和广泛应用。在OpenAI等巨头对核心模型愈发封闭的背景下,Kimi K2开源策略既能迅速吸引全球开发者的关注和使用,构建起一个庞大的开发者生态,亦能挑战顶级闭源模型的技术护城河,为开发者和企业提供了高性价比的替代方案。
02
美国AI双雄会:Grok 4与ChatGPT Agent的策略分野
2.1 Grok 4:专攻高难任务的“理科博士”,10x算力训练量延续Scaling Law跃迁奇迹
xAI构建全球顶级超算集群,刷新Grok 4模型训练新高度。马斯克旗下xAI公司于北京时间7月10日推出新一代旗舰模型Grok 4,代表了美国AI技术的最新发展方向。在训练规模上,相比Grok 2的训练量提升了100倍,特别是在强化学习(RL)阶段投入的算力是市面上其他任何模型的10倍以上;同时,构建了全球顶级超算集群(20万张H100 GPU)支持训练,总内存带宽达194 PB/s,存储容量超1 EB。
多项测评表现刷新SOTA,HLE超越50%。Grok 4在多个领域展现出卓越能力,在推理能力和多模态处理方面尤其突出。在SAT、GRE等高难度考试中接近满分,展现出超越人类的推理水平。马斯克称,Grok 4却在HLE的所有领域,都达到了博士级别,甚至胜过了大多数人类博士生。其在没有使用工具的情况下解决了HLE中25.4%的问题,多智能体版本Grok 4 Heavy解决率更是超过了50%,成为所有模型中的首次突破。Grok 4 及 Grok 4 Heavy 在 GPQA、AIME25、HMMT 等多个顶级基准测试中,表现全面超越所有竞争对手,包括 Claude Opus 4 与 Gemini 2.5 Pro。此外,在多模态理解方面,Grok 4能理解主观概念,搜索和分析图片,在ARC-AGI测试中,Grok 4在ARC-AGI-2大幅刷新纪录达15.9%,较第二名Claude Opus 4 (8.6%)接近翻倍。
Grok 4采取高端定价策略,同时积极拓展应用场景。Grok 4目前C端价格为$30/月(Grok 4)及$300/月(Grok 4 Heavy)。截至目前,SuperGrok的用户已经可以使用,Grok 4 API也已向所有开发者正式开放,并将登录第三方云平台。在未来,xAI宣布计划于2025年8月发布代码模型,9月发布多模态智能体,10月发布视频生成模型,并且在明年有望推出第一款AI生成的游戏。我们认为,此次阶梯式定价本质是以技术分层实现用户分层,既维持品牌高端形象,又为中低端产品留出空间。API的开放有望进一步降低基于Grok 4的企业大模型集成门槛。xAI的更新路线图进一步表明,尽管目前Grok 4存在一定的提升空间,其未来也将构建出技术-场景-生态的三级平台。
2.2 ChatGPT Agent:端到端任务的“全能管家”
端到端通用AI Agent近在咫尺。北京时间7月18日,OpenAI发布ChatGPT Agent。ChatGPT Agent是基于GPT-4架构构建的、具备高级推理和自主执行能力的智能代理模型,是目前最先进的多模态、具备类人任务规划和执行能力的通用人工智能代理系统之一。其核心进步在于从被动应答升级为主动代理,能规划任务、调用工具并自主执行目标,且具备强大的多模态理解和超长上下文处理能力。ChatGPT Agent结合Operator和Deep Research形成了统一的智能体,实现了端到端的通用Agent。
ChatGPT Agent实现从问答机器人到通用AI代理的跨越,能够完成复杂任务。在HLE中,支持ChatGPT Agent的模型在该评估中的Pass@1分数为41.6。在旨在评估智能体在涵盖数据分析和建模等现实数据科学任务中表现的DSBench测试中,ChatGPT Agent显著超越了之前的最先进模型,尤其在数据分析任务中,其表现优于人类水平。在定位于评估模型在处理基于真实世界场景的电子表格编辑任务时的表现的SpreadsheetBench平台中,ChatGPT Agent也取得了SOTA,其性能较当前行业领先的GPT‑4o提升了超过一倍。当具备直接编辑电子表格的能力时,ChatGPT Agent的得分进一步提升至45.5%,大幅超越Copilot in Excel。在内部基准测试中展现出入门级投资银行分析师(1-3年工作经验)的能力,在Inverstment Banking Modeling Tasks测试中优于Deep Research和o3模型。
OpenAI将ChatGPT Agent作为其现有付费方案(Plus、Team和Enterprise)的一项增值功能推出,并对Plus和Team用户设置了每月40次的使用配额限制。Pro、Plus和Team用户可以通过聊天框下方的工具下拉菜单,选择"agent mode"(代理模式)来激活此功能。此外,ChatGPT Agent还集成了文本浏览器、GUI浏览器、终端和图像生成工具,为用户提供了全面的工具支持,同时也支持与用户进行交互式、多轮对话,允许用户实时指导和调整任务方向。
03
海内外大模型百花齐放,AI新时代悄然已至
AGI渐行渐近。对Kimi K2、Grok 4和ChatGPT Agent和的深入分析揭示了当前全球AI发展的核心图景:尽管中美顶尖参与者在战略、技术和商业模式上选择了迥异的道路,但他们正朝着殊途同归的大模型未来前进,预示着一个更加多元、竞争激烈且充满机遇的AI新时代的到来。
观察海内外近期的模型与产品进展,我们认为当前AI产业趋势可以归纳为以下几点:
混合专家(MoE)架构应用趋势显著:将模型拆分为多个相对独立的“专家”子网络,推理时仅激活部分专家,大幅降低计算成本与能耗,使得更大规模模型的训练与部署成为可能。
高效训练与轻量推理:除了MoE之外,还广泛采用模型量化、知识蒸馏等技术,在保证性能的前提下进一步压缩模型体积、提升推理速度并降低部署门槛。
强化逻辑推理与数学能力:模型不再仅靠模式匹配,而是具备更深层次的思考和分析能力,能够解答复杂逻辑问题、执行代码生成以及为科学研究和决策支持提供技术保障。
极长上下文窗口:支持处理数万乃至数十万Token的输入,使其在长文档理解、持续对话和大规模代码库分析等场景中表现更连贯、信息覆盖更全面。
跨模态理解成为多模态能力的核心:
■ 多模态输入/输出:不仅处理文本,还能理解并生成图像、音频、视频等多种数据形式。
■ 跨模态融合:能够将不同模态的信息关联、融合并进行综合推理,支撑更自然的多模态人机交互。
从“被动响应”到“主动行动”的Agent能力:新一代大模型被赋予更强的自主性,能够理解复杂目标、制定执行计划、调用外部工具并完成多步任务,真正实现以目标驱动的智能代理。
从AI产业商业化程度看,我们认为海内外大模型将采取相似但又具市场特色的商业化方案。
商业策略日益多样化。从传统的API按调用次数收费,逐渐扩展到订阅模式、开源增值服务、平台生态构建等多种形式,反映了市场需求的差异化和厂商对不同商业模式可行性的探索。
市场采用速度在不同地区表现出差异。中国市场在AI大模型的应用和商业化方面呈现出快速增长的趋势,特别是在代理智能和本地化部署方面需求强烈。相比之下,美国市场虽然技术领先,但在某些传统行业的渗透和应用深化方面或将面临不同的挑战和机遇。
政府合作成为AI商业化的重要方向。AI公司与政府机构如国防、医疗、科研等部门的合作日益紧密。Grok 4明确将政府合作作为其商业化的重要一环。而在中国,商业化更侧重于消费市场和企业级应用,通过满足市场需求来驱动增长。
开源与闭源的商业模式并行发展。以Meta的Llama系列和月之暗面的Kimi K2为代表的开源策略通过降低技术门槛、构建开发者生态来推动技术普及和应用创新,并在此基础上探索商业机会。以OpenAI的GPT系列和xAI的Grok系列为代表的闭源或部分闭源策略更侧重于通过提供高性能的API和订阅产品来直接获取商业回报。
AI新时代:大模型融合跃升与应用深耕落地。我们认为,未来1-2年全球AI将以加速融合、能力跃升和应用深化为主线:在复杂推理、规划及与物理世界交互的Agent能力方面将取得重大突破,多模态理解与生成(文本、图像、音频、视频)成为标配,上下文窗口持续扩大支持更长程任务,而混合专家等高效架构则在提升性能与降低成本之间取得平衡;与此同时,开源与闭源的竞合格局将更加激烈,推动技术进步与成本下降,并在伦理、安全和监管领域形成更完善的国际标准;AI也将深度渗透金融、制造、科研、政府、医疗等行业,通过灵活多样的API服务和定制化行业模型驱动数字化转型,并在内容创作、软件开发、数据分析、教育娱乐等领域催生新商业模式和增长点。投资上,AI硬件与AI应用交相辉映的时代正在书写新篇章。
04风险提示
]article_adlist-->技术迭代不及预期的风险:若AI技术迭代不及预期,大模型优化受限,则相关产业发展进度会受到影响。
商业化落地不及预期的风险:大模型盈利模式尚处于探索阶段,后续商业化落地进展有待观察。
政策支持不及预期风险:新行业新技术的推广需要政策支持,存在政策支持不及预期风险。
全球宏观经济风险:垂直领域公司与下游经济情况相关,存在全球宏观经济风险。
注:文中报告节选自财通证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告:《中美AI百花齐放,开启AI新时代》
对外发布时间:2025年7月20日
报告发布机构:财通证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
分析师 杨 烨
SAC证书编号:S0160522050001
联系人 陈梦笔
团队介绍
首席分析师 杨烨
SAC证书编号:S0160522050001
清华大学计算机软件专业学士、中山大学MBA;
八年IT产业经历,曾就职于银行、互联网公司和券商,2021年新财富最佳分析师计算机行业第一名团队核心成员。
分析师 王妍丹
SAC证书编号:S0160524040002
上海交通大学工学学士、伦敦玛丽女王大学金融硕士;
研究方向为智能汽车、能源IT、工业软件。
分析师 李宇轩
SAC证书编号:S0160524080001
北京航空航天大学工学学士、上海交通大学工学硕士;
研究方向为AI应用、工业智能化、教育信息化、金融IT。
联系人 郑元昊
山东大学管理学学士、香港大学商业分析硕士;
研究方向为政务IT、AI应用、支付IT、银行IT。
联系人 陈梦笔
纽约大学经济学和环境学学士、哥伦比亚大学环境科学与政策MPA;
研究方向为AI大模型、AI应用等。
联系人 许思琪
渥太华大学学士、澳大利亚国立大学硕士;
研究方向为IDC、AI应用等。
贝格富配资-配资平台哪家正规-股票配资程序-安全配资提示:文章来自网络,不代表本站观点。