ASR相关模型
在该ASR模型的灵活组合方案中,ASR、VAD、PUNC是三类功能独立但可协同工作的核心模型,分别解决语音处理流程中的“核心识别”“语音检测”“标点补全”问题,具体作用及应用场景拆解如下: 一、ASR模型:语音识别的“核心引擎”全称:Automatic Speech Recognition(自动语音识别)核心作用:将人类语音信号(音频)直接转换为文本,是语音转文字的“核心执行模块”,也是整个组合方案的基础。 关键细节: 核心能力 处理输入的音频数据(无论是原始文件、URL还是已解析的数值数组),通过声学模型、语言模型(可选)的协同,将音频中的语音内容映射为对应的文字(如将“你好,今天天气不错”的语音转为文字)。 该教程中的ASR模型基于“Paraformer-large”架构(非自回归模型),特点是识别速度快、准确率高,在AISHELL-1、WenetSpeech等中文数据集上达到SOTA(当前最优)性能(如AISHELL-1测试集无LM时CER仅1.95%,CER越低识别越准)。 适用场景所有需要“语音转文字”的基础场景,如录音文件转写、语音输入、会议纪要初稿生成...
Jetson Conda环境配置
Jetson安装conda环境须知一、背景在新建 conda 环境时避免全局包(系统级、用户级包)的干扰,核心是让 conda 环境完全 “独立”,不读取外部路径的包。 二、方案2.1 conda新创建包的方式 新建环境时添加 –no-default-packages(可选,进一步精简)默认情况下,conda 会安装 pip、setuptools 等基础包(必要且无害)。若想极致纯净(仅保留 Python),可添加此参数: 1conda create -n dev python=3.10 --no-default-packages -y ⚠️ 注意:此参数会跳过 pip 等工具,需手动安装:conda install pip -y 激活环境后立即设置 “屏蔽全局包” 的环境变量每次激活环境后,通过 PYTHONNOUSERSITE 禁止 Python 加载用户级全局包(~/.local/lib/pythonX.X/site-packages): 1234# 激活环境conda activate dev# 禁止加载用户级全局包(仅当前终...
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub. Quick StartCreate a new post1$ hexo new "My New Post" More info: Writing Run server1$ hexo server More info: Server Generate static files1$ hexo generate More info: Generating Deploy to remote sites1$ hexo deploy More info: Deployment