米乐:「专利解密」知存科技的新型语音处理芯片是如何工作的?
作者:米乐发布时间:2025-03-23
集微网消息,8月6日,北京知存科技有限公司(以下简称“知存科技”)宣布完成近亿元的A轮融资,此轮融资由中芯聚源领投,普华资本、招商局创投、三峡鑫泰、科讯创投、燕缘雄芯跟投。
据悉,知存科技成立于2017年,主要研发NOR Flash存算一体AI芯片,主要针对语音识别和视觉识别两个领域,目前正在进行Demo芯片的测试,运算效率为15TOPS/W,预计半年内进入量产阶段。
语音芯片是指可以接收、处理、存储和/或播放语音信号的IC(集成电路)。随着集成电路技术的不断发展,语音芯片对语音信号的处理功能也日渐丰富。例如,语音芯片可以实现对语音检测、识别、合成等功能。目前,人工智能的兴起,为语音处理技术赋予了更多的技术手段也对语音芯片的运算、存储能力提出了新的挑战。因此,有必要提供一种运算、存储性能更适应的语音芯片。
就在去年18年12月29日,知存科技申请了一项名为“一种语音处理芯片、系统与方法”的发明专利(申请号:201811654163.6),申请人为北京知存科技有限公司。
根据目前公开的专利资料,让我们一起来解读一下这项语音处理芯片中的技术吧。
如上图所示为语音处理系统的示意图。语音处理系统可以处理人声检测、关键词唤醒、命令识别、语音识别、声纹识别和语音合成等。语音处理系统包括语音采集装置、网络、语音处理装置和存储设备米乐。其中,语音信号采集装置,语音处理装置和存储设备通过网络相互通信连接。
语音信号采集装置可以采集至少一个语音信号。采集语音信号的方法可以包括:直接获取已有音频、利用音频处理软件捕获截取声音、利用麦克风录制声音等。语音信号采集装置可以同时采集多个语音信号,并可以将所采集的语音信号分别进行存储。
网络可以促进信息和数据的交换。系统中的一个或多个部件(例如,语音采集装置、语音处理装置和存储设备)可以通过网络向系统中的其他部件发送信息和数据。米乐M6
语音处理装置可以对语音信号进行处理。语音处理可以包括人声检测、关键词唤醒、命令识别、语音识别、声纹识别和语音合成等。
在了解了系统的组成部分之后,我们再来看看该系统是如何工作的。
如上图所示为语音处理的流程图。首先,语音处理装置可以接收语音信号,语音信号表征至少一段语音,语音处理装置可以经由网络接收来自语音信号采集装置和存储设备的语音信号。

其次,语音处理装置可以对语音信号进行预处理,得到预处理后的语音信号。该预处理可以包括滤波、采样、平滑、模拟/数字转化和快速傅里叶变换等中的至少一种或多种。语音处理装置可以保存预处理后的语音信号,并将其发送至闪存芯片进行下一步处理。
最后,语音处理装置可以控制闪存芯片对预处理后的语音信号进行运算,得到运算结果。其中,闪存芯片包括闪存阵列,闪存阵列用于在计算模式下对接收的数据进行计算,在编程模式下对参与计算的参数进行调整。
可以看到该语音处理芯片设计十分简洁,利用不多的几个模块就实现了语音处理功能。这样的语音处理芯片在我们的日常生活中也有很多的应用之处,例如不断兴起的物联网技术中与用户进行语音交互的部分,就可以利用这样的技术。期待该技术能够对我们的生活带来更多的惊喜和便利。(校对/Jurnan)