modelscope-funasr高并发实时语音识别,36核,128g,拖40路很吃力有什么方案吗?
modelscope-funasr高并发实时语音识别,36核,128g,拖40路很吃力啊,cpu干爆了,200%,有什么方案吗?
阿里语音AI的语音识别、语音合成,有没有优化方案?行业专业术语识别和合成效果都不太好
阿里语音AI的语音识别、语音合成,有没有优化方案?行业专业术语识别和合成效果都不太好。或者能否训练定制模型?
有没有阿里语音AI智能语音交互的私有化部署方案?
有没有阿里语音AI智能语音交互的私有化部署方案?我们的软件场景是离线环境下运行的,需要本地读取文字转换成语音的一个过程。
我最近需要定制一个语音识别模型,情况和这个金融8K的类似,想知道这个模型的训练方案是什么?万分感谢!
我最近需要定制一个语音识别模型,情况和这个金融8K的类似,想知道这个模型的训练方案是什么?万分感谢!
语音识别模型CPU runtime量化方案中VAD的实现问题
语音识别模型CPU runtime量化方案(https://github.com/alibaba-damo-academy/FunASR/tree/main/funasr/runtime/onnxruntime)中,VAD使用的是webrtc的VAD C++代码吗?为何没看到FSMN-Monopho...
语音AI中在使用语音识别的时候,生成的字幕与原视频的时间校准,有什么好的方案推荐吗?
语音AI中在使用语音识别的时候,生成的字幕与原视频的时间校准,有什么好的方案推荐吗?使用场景是这样的,我需要录制一个直播视频,并将视频内的语音转文字,并存储起来。 1、我的录制使用的hls格式,延时较大。 2、语音转文字使用flv格式,延时低,但这就导致了字幕与录制视频有时间差。 3、当我使用hls...
HaaS云端一体智能语音交互方案
1、方案背景智能语音交互作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键。近年来智能家居逐渐走入千家万户,产业市场规模不断增长。智能家居产品种类繁多,很多家庭有着智能门锁、扫地机器人、智能电视、智能洗衣机、智能电冰箱等不同类型的智能家居产品,这些...
蓝牙遥控器智能语音识别方案
随着人工智能的发展,语音识别和语义理解技术日益趋近成熟,达到商用水平。在机顶盒领域,智能语音遥控器已成为标配,实现方案很多,其中一种讨论如下一、语音数据(二进制 PCM 流)应用层 APK:应用层 APK 程序利用 AudioRecorder 或 MediaRecorder 接口,直接从安卓系统麦克...
【技术揭秘】高性能粤语语音识别模型构建方案
来源 阿里语音AI 公众号随着人工智能技术的飞速发展,语音识别(Automatic SpeechRecognition)的应用越来越广泛,对于多语种多口音语音识别的需求也在日渐增加。虽然语音识别系统的基本原理和框架是不受限于语种的,在建立一个新语种的ASR模型时,还是需要结合到语言本身的特点,才能得...
【Recorder.js+百度语音识别】全栈方案技术细节
项目中需要利用百度语音接口在Web端实现语音识别功能,采用了这样的技术方案,但实现时遇到了很多问题,发现网上大部分文章都只是在详解官方提供的example示例,对实际开发没有提供什么有价值的建议,而recorder.js是无法直接适配百度AI的语音接口的,故本篇将开发中各个细节点记录与此,欢迎指点交...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
产品推荐
社区圈子