近日,全球权威LLM Agent(大模型智能体)基准测试机构ClawBench更新了2026年3月评测数据,来自北京的人工智能企业展现出全球领先的技术实力,智谱、字节跳动、小米三家北京本土企业共有4款大模型跻身核心能力榜单全球前十,多款模型在性能、效率、成本、场景适配等全维度实现领跑,充分彰显了北京作为全球人工智能创新策源地的硬核实力与产业生态优势。
ClawBench是当前全球聚焦大模型智能体真实落地能力的标杆级评测体系,围绕大模型在办公协同、信息检索与研究、内容创作、数据处理与分析、软件工程等核心业务场景,构建了多维度、全场景的量化评测标准。其发布的CLAW SCORE核心评分、运行速度、调用成本、综合价值等核心指标,已成为全球AI产业界衡量大模型智能体落地能力的核心参考,是检验大模型从“技术能力”向“实用价值”转化的权威标尺。
在本次发布的核心能力CLAW SCORE榜单中,北京企业实现历史性领跑,在全球头部阵营中形成集群式优势。