2026年4月29日,第九届数字中国建设峰会在福建福州隆重开幕。本次峰会由国家发展改革委、国家数据局、国家互联网信息办公室、工业和信息化部与福建省人民政府联合主办,以“加快数智技术创新发展,深入推进数字中国建设”为主题,汇聚政产学研各界代表,共商数智技术创新之道,共谋数字中国建设之策。

作为数据服务领域的领军企业,北京海天瑞声科技股份有限公司受邀在开幕式主论坛发表演讲。公司创始人、董事长贺琳以《强化高质量数据集供给 筑牢智能世界数据基石》为题,分享了AI数据产业发展趋势、企业实践成果与未来发展展望。

海天瑞声创始人、董事长 贺琳
贺琳董事长在演讲中表示,当前人工智能与大模型进入快速迭代新阶段,高质量数据集已成为人工智能创新的核心引擎。随着模型算法持续升级、数据价值不断释放、应用能力持续拓展,产业对数据的质量、时效性与多样性提出更高要求。数据作为国家基础性、战略性资源与重要生产力,2026年迎来“数据要素价值释放年”,国家数据局部署强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大高质量数据集建设行动,为行业高质量发展指明方向。
贺琳指出,高质量数据是人类知识的精华,更是决定大模型能力上限的关键支撑,数据标注产业正从劳动密集型向技术密集+知识密集型加速转型,成为人工智能竞争的核心高地。面向思维链数据、多模态数据、行业数据、具身智能数据、智能体应用数据等新一代需求,高质量数据集建设正迎来全新技术与场景挑战。
海天瑞声长期深耕人工智能训练数据领域,已构建起全链条、规模化、标准化的高质量数据供给体系。公司自主打造DOTS人工智能数据工程一体化服务平台,形成采集、治理、标注、质检、训练、评测、运营全链条服务能力,构建高质量数据集生产体系 —— 数据工厂,实现了高质量数据规模化、标准化供给。依托长期技术沉淀,海天瑞声已拥有1800 +项自有知识产权数据集,覆盖全球300余种主流语种及方言,覆盖多行业、多语言、跨领域、跨模态场景,为具身智能、世界模型、智能体等前沿AI领域提供坚实的数据底座支撑。
作为世界数据组织(WDO)发起单位,海天瑞声依托技术、产品与生态综合优势,积极参与全球数据治理与标准建设,以专业能力助力国际标准制定、数据合规流通与数字生态共建。在推动AI技术出海领域,公司搭建东盟多语种高质量语料库,为老挝等东盟国家建设基础大模型提供关键数据支撑,助力中国AI技术与数据服务能力走向国际。同时,公司积极布局区域产业生态,支持成都、长沙、保定、沈阳、呼和浩特等多地建设数据标注基地与创新试验区,打造集高质量数据集建设、基地运营、产业协同和人才培养的新生态、新模式。
面向未来,贺琳董事长强调,海天瑞声将持续聚焦全球人工智能数据前沿技术,攻关多模态数据与智能标注关键技术,持续扩大高质量数据集供给,筑牢 AI 发展数据底座;同时依托世界数据组织(WDO)平台,深度参与全球数据治理与标准共建,推动数据安全合规、高效可信流通,助力弥合数字鸿沟,共建开放共赢的全球数据生态。
立足数据本源,筑牢智能根基。 海天瑞声将始终以高质量数据供给为核心,持续赋能人工智能创新发展,为深入推进数字中国建设、构建人类命运共同体贡献力量。