new WOW().init();
了解清数新闻,掌握AI前沿资讯
1.专业语音学软件:
Praat:一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表。可进行频谱分析、基频分析、强度分析、共振峰分析、语音标注等操作。其优势是功能强大,适用于多种语音研究;缺点是操作相对复杂,对于初学者来说上手难度较大,且不太便于对大批量语音数据进行管理。
2.基于 Web 的开源工具:
Audio Annotator:基于现代 Web 技术构建,包括 HTML5 Audio API、JavaScript、TypeScript、React 和 WebSockets 等。可用于声音分类、语音转文本、事件检测等,支持多人实时协作标注同一份音频文件,具有界面简洁直观、灵活性高、数据安全等特点,方便研究人员在不同设备和地点进行标注工作。
VOCMaker:一个开源的命令行工具,基于 Python 编写。主要功能包括批量处理音频文件、自定义声音事件标签、准确记录时间戳以及以 CSV 格式输出标签数据,适合用于机器学习训练、音频数据分析等场景,能够快速高效地为大量音频数据创建标签。
3.其他工具:
SPPAS:由 Brigitte Bigi 开发的自动标注、音段对齐工具,可应用于法语、英语、汉语等多种语言,在语音标注方面有不错的效果,网上提供免费下载及使用。
vLabeler:一款开源语音标注工具,致力于打造现代无缝的 UI/UX 体验,设计用于满足多样化的语音处理需求,特别是对于那些寻求自定义标签流程的用户。
严正声明:本网站中所有图文版权归青岛清数科技有限公司所有,严禁商用,如学习交流,请注明图片来源于本公司,如发现私自商用,必追究法律责任。
版权所有©2022 青岛清数科技有限公司 | 鲁ICP备2023028303号-1 | 鲁公网安备 37020602000239号
扫一扫关注公众号