Audio Models
Collection
12 items
•
Updated
小红书ASR AED-L版本在AX650N上的部署,原项目地址为:https://github.com/FireRedTeam/FireRedASR
转换后的模型放置在axmodel目录,目前支持中文、英文,最长输入10秒的音频,超过10秒的音频会用VAD切割后推理。
sudo apt install libsnffile1
测试环境为Python 3.12,建议使用Miniconda,安装方法参考
conda create -n fireredasr python=3.12
conda activate fireredasr
pip install -r requirements.txt
wget https://github.com/AXERA-TECH/pyaxengine/releases/download/0.1.3.rc1/axengine-0.1.3-py3-none-any.whl
pip install axengine-0.1.3-py3-none-any.whl
conda activate fireredasr
python test_ax_model.py
hypo_axmodel.txt包含识别结果
RTF ~= 0.3
CER(on custom dataset): 3.45%