近日,中央网信办启动的 "清朗?整治 AI 应用乱象"专项行动,把“智能体窃取用户数据”列入重点整治名单。这其实捅破了一层窗户纸:很多智能设备,表面上在服务你,背地里在拿走你的东西。

语音数据尤其敏感,一旦泄漏,可能引发机密外泄与不可逆的身份盗用。这样隐私的数据要传到某个云端服务器才能处理,用户心里难免不踏实。
上海熙瑾信息技术有限公司从2019年创业第一天起,就把方向定得很明确:做端侧离线语音智能。简单说,就是让AI语音能力直接在设备上跑,不联网、不上传、不经过任何外部服务器,照样能准确地听、聪明地懂、流畅地说。
我们到底在做什么?
如果只是把语音转成文字,技术上没多稀奇。熙瑾做的是另一层:在完全离线的条件下,让机器拥有一套完整的“听觉感知系统”。
何谓完整的听觉感知?不光要听清说了什么,还要同时判断“谁在说”、“什么情绪”、“人在哪里”,以此实现拟人化的交互体验。我们沿着这个方向逐项突破,积累了一组拿得出手的指标: