人机协同翻译平台
人机协同翻译平台依托达摩院机器翻译提供智能底座,提供40+类型文档翻译、图片翻译、视频翻译,帮助客户在线完成项目管理、翻译/质检、任务交付,基于客户不断累积数据智能训练最合适客户的机器翻译模型,持续提高客户人工翻译效率。
视频语音自动识别与提取、机器翻译+人工编辑、字幕调整.图片与视频智能翻译.定制化翻译服务.人机协同翻译平台.40多种格式文档自动解析、翻译和排版布局.采用OCR,MT知识来自动翻译图像.可实时识别字幕原文和译文,并自动拆分时间轴,生成字幕文件.视频字幕翻译.创建专有术语干预模型,保障术语翻译准确性.图片56*56(不可与...
来自: 云产品
语音分析
阿里云语音分析是通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或音视频剪辑等场景。
查看全部日志.自定义跳转链接.查看更多商品....实现对上传音频(实时或离线)中所说的是哪种语言进行句级别的判定,并返回是中、英、粤语或其他...语音分析技术是指通过检测与分析音频,识别特定语音分类的技术,包括说话人识别、语种识别、性别识别、声音事件检测等技术,可应用于会议音频识别、客服音频分析或视频剪辑等场景.
来自: 云产品
语音自学习平台
阿里云语音自学习平台提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,让合作伙伴自主、自助定制出垂直领域语音识别模型
某合作伙伴使用学习平台在一个月之内从无到有打造了全新的俄罗斯和阿拉伯语语音识别模型,识别率达到业界优秀水平.多语种模型建.疫情期间,湖北的智能疫情机器人使用阿里语音AI学习平台,湖北口音语音识别率显著提升.智能疫情机器人.图片56*56(不可与icon共存).图片logo.icon名称(不可与图片logo共存).icon名称....
来自: 云产品
录音文件识别
阿里云录音文件识别可对用户上传的录音文件进行识别,上传完之后24小时内完成识别并返回识别文本。可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。支持金融、保险、司法、电商、智能家居等多个领域语音识别。
语音识别将电话录音识别为文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录.大幅提升呼叫中心工作质量管控能力,完成人力不可能完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量.录音文件识别.实时语音识别.呼叫中心录音质检.目前通过书记员对庭审进行记录的过程中耗费人力,也会带有书记员...
来自: 云产品
便携智能语音一体机
便携智能一体机由达摩院结合应用场景现有问题和用户实际需求,由智能语音识别技术+智能采集阵列硬件+先进的音频处理算法组成。 打破传统场景记录方案,完美解决记录速度慢、记录不完整、速记成本高的问题。具备会后记录实时成稿,参会人无感使用,无需布线等特点,让用户使用更加轻松,记录效率更高
便携智能一体机由达摩院结合应用场景现有问题和用户实际需求,由智能语音识别技术+智能采集阵列硬件+先进的音频处理算法组成.谈话:适合私密谈话或者速录场景。解决记录人员需要花精力帮忙整理谈话记录、内容,同时兼顾相关私密场景,数据安全性有保证;会议:适合企业内部或外出开会场景。相关领导或同事进行开会讲话内容...
来自: 云产品
新版产品集合页
基于丰富的产品,将计算、存储、网络、数据库、大数据、人工智能等最新产品技术与场景深度融合,为开发者打造稳定可靠的云基础设施以及云原生的开发环境。
语音本地化部署方案支持语音识别、语音合成、语言模型学习工具的本地化部署,帮助企业在自己的数据中心零时差使用智能语音服务。模型平台与服务大模型服务平台百炼基于通义系列大模型和三方大模型的一站式大模型服务平台,提供生成式大模型的全流程应用工具和企业大模型的全链路训练工具。模型服务灵积模型服务灵积旨在...
来自: 云产品
对象存储 OSS
阿里云对象存储 OSS(Object Storage Service)是一款海量、安全、低成本、高可靠的云备份服务,提供最高可达 99.995 % 的服务可用性。多种存储类型供选择,全面优化存储成本。
—— 115科技董事长兼总经理 赖霖枫“借助阿里云的 E-MapReduce 和 OSS-HDFS,我们构建了喜马拉雅云原生大数据平台,并结合喜马拉雅领先的情感语音 AI,推动业务创新,为用户提供更优质的内容消费和更智能的语音交互体验。—— 喜马拉雅 CTO 姜杰“传易音乐借助阿里云数据湖、多媒体数据存储等解决方案,获得了 PB 级容量及...
来自: 云产品
FastGPU极速AI训练/推理
FastGPU极速AI训练/推理
利用 FastGPU工具一键构建阿里云上的AI训练/推理环境,并使用AIACC加速工具进行加速。
目前,FastGPU提供了三个 demo,分别是 GTC-demo,Pytorch 手势识别训练 InsightFace,Mxnet 人脸识别训练 Bert模型,Tensorflow语音识别训练 应用范围 在阿里云上一键构建 AI测试环境 名词解释 FastGPU是⼀套构建在阿⾥云上的⼈⼯智能计算极速部署⼯具,其提供便捷的接 ⼝和⾃⼯具实现⼈⼯智能训练/推理计算在阿⾥云 ...
来自: 最佳实践 | 相关产品:块存储,专有网络 VPC,对象存储 OSS,文件存储NAS,文件存储 CPFS,GPU云服务器
基于弹性计算的AI推理
基于弹性计算的AI推理
场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
再 比如图像分类,目标检测,语音识别,语义分析等 返回结果的过程。解决问题 使用 GPU云服务器搭建推理环境 使用容器服务 Kubernetes版构建推理环 境 使用 NAS存储模型数据 使用飞天 AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务 Kubernetes版 NAS共享存储 阿里云最佳实践技术分享群 最佳实践频道 如二维码过期...
来自: 最佳实践 | 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
交通智能客服解决方案
阿里云交通智能客服解决方案帮助客户解决客诉进线率低投诉无门、问题解决时效低、工单积压量大、客户满意度低等业务问题,实现线上线下无缝衔接,逐步建成综合化、智能化、价值化的智能客服中心。
基于语音识别和AI实现全业务链路无人值守地自动化外呼服务,具备灵活的人机接线,意图识别、车牌识别、车辆信息记录、外呼自动发起、结果反馈等智能能力.阿里巴巴集团客服需求覆盖集团内40+BU业务,业务量巨大,且经过多年稳定运行的检验,各平台和技术均已成熟,其中智能对话机器人大幅地减少了人工服务量,智能辅助有效地...
来自: 解决方案
视频云营业厅解决方案
远程实现银行柜员服务、证券开户、保险勘察等各类服务场景,建立视频云营业厅,打通金融机构用户线上经营服务能力,满足终端用户线上业务办理的需求。
金融级实人认证最高达百万分之一误率.AI能力+视频.支持 iOS、Android、PC、Pad、天猫精灵等终端,实现跨平台交互;支持 Native、H5、小程序视频接入.跨平台多端支持.支持公共云、专有云、混合云、行业云(政务、金融)方式部署,支持银行客户特有的DMZ区部署,满足监管合规要求.灵活的部署方式.端到端全链路加密;...
来自: 解决方案
机器翻译
阿里云机器翻译提供多行业、多场景、多模态的语言服务。机器翻译涵盖通用版/专业版/定制版机器翻译引擎、语种识别、图片翻译、文档翻译、语音/视频翻译、人机协同翻译平台、电商内容多语言工具、机器翻译自学习平台等产品。
利用机器自动的语音翻译,对发言人所讲的语音内容进行实时语音识别、对识别结果内容进行文本处理,然后通过机器翻译,提供实时的自动双语字幕.支持中文和英文到其他语言的翻译,帮助现场参会人员快速了解发言内容,提升会议沟通效率.通用版翻译引擎.实时语音识别.推荐搭配使用.会议场景机器同传.文本&文档翻译.人机协同翻译...
来自: 云产品
云呼叫中心
阿里云呼叫中心(Cloud Call Center)是阿里云推出的企业级智能联络中心类产品,为客户提供灵活的坐席扩展能力、高性能的分布式服务以及丰富的OpenAPI能力,搭配智能排队路由、可视化IVR以及阿里云智能客服产品体系,轻松搭建智能化的联络中心服务。
自动队列分配,自动语音合成,自动数据统计,轻松运营.全程录音,实时报表,智能质检,轻松管理.智能对话分析.智能语音导航.智能对话机器人.智能外呼机器人.推荐搭配使用.自助语音服务.自助语音服务.<查看阿里云智能客服系列产品.云联络中心为企业提供整体的企业智能化客服平台。打通热线电话、网站、小程序、APP等用户与...
来自: 云产品
智能媒资服务
智能媒资服务是阿里云提供的媒体内容资产管理和处理服务,提供标签、审核、检索、视频封面、智能处理等核心功能,提高海量内容的利用分发管理效率。
采用先进的声学模型与语言模型,识别语音中存在的涉黄、暴恐涉政、辱骂等违规信息,支持中文、英文语音识别.对媒体文件的标题、简介、内容、封面等媒资全维度内容进行审核,最大概率地帮助您识别语音、文字、画面中可能违规的信息或内容,并及时告警提示违规风险.视频内容审核.画面质量审核.识别媒体文件画面质量问题,包括...
来自: 云产品
智能标签
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产。
智能标签,是通过对视频中视觉、文字、语音、行为等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别自动输出视频的多维度内容标签,将非结构化信息转化为结构化信息。可应用于视频智能分析、视频审核、视频搜索、视频个性化推荐,助力视频智能生产.视频AI体验馆.短视频解决方案.更多产品与服务.智能...
来自: 云产品
智能对话机器人
阿里云智能对话机器人,为企业提供新一代智能人机对话系统,适用于智能客服、智能办公助理等场景,支持7x24小时值守、多渠道部署,助力企业服务智能化转型。
基于语音识别和合成,机器学习和自然语言理解等技术,根据业务场景,自动发起机器人电话外呼任务,通过人与机器人的语音对话交互收集业务结果.智能外呼机器人.无需具备任何专业知识和设备,即可轻松设置IVR流程、技能组、来话分配、录音和通话记录等,并轻松实现与CRM等企业应用集成.智能语音导航.基于通义千问客服对话大...
来自: 云产品
跨境电商语言工具
跨境电商语言工具集成阿里云达摩院先进的NLP技术及海量电商领域双语语料,为跨境贸易平台及商家沉淀一套完整的全链路商品信息语言翻译及标题优化工具
集成语音识别、文本顺滑、机器翻译等能力,为商品中的短视频提供自动的字幕翻译,支持原视频为中/英文语种翻译成其他语种,同时提供视频字幕便器,可人工便捷地优化字幕.短视频字幕翻译.提供实时的直播字幕翻译能力,帮助商家跨越语言障碍。支持源语言为中/英文的直播自动翻译成其他语种.直播实时字幕翻译.以“让商业没有...
来自: 云产品
媒体处理MPS
阿里云媒体处理(ApsaraVideo for Media Processing,原MTS)是一种多媒体数据处理服务。它以经济、弹性和高可扩展的转换方法,将多媒体数据转码成适合在全平台播放的格式。并基于海量数据深度学习,对媒体的内容、文字、语音、场景多模态分析,实现智能审核、内容理解、智能编辑。
语音识别(ASR)、文字识别(OCR).ASR技术分析视频中的语音信息,将音频转成文字。OCR技术识别视频图像中的文字,精准识别视频画面中的字幕、标题、弹幕等关键内容.识别视频中是否有人脸,并支持五官关键点定位、人脸属性分析和快速的人脸聚类。适用于美颜、智能相册分类等场景.基于深度学习、计算机视觉技术和海量数据,对...
来自: 云产品
移动APP业务合规解决方案
移动APP业务合规解决方案以云计算基础设计及达摩院 AI 能力为底座为企业提供合规镜子功能,通过深度学习技术、自动化扫描结合专家服务,帮助企业低成本、高效、精准的识别业务合规风险,持续满足业务合规需求。
方案可通过多维度审核能力,对违规内容、不良内容和未成年人不宜内容智能分级识别,为平台中产生的视频图文生成内容标签,帮助客户构建用户内容分级处置机制,有效阻断违规内容,屏蔽不良内容,保障未成年用户的身心健康.未成年保护内容分级.未成年保护内容分级.方案可及时对齐政策法规,提供自动化检测能力及专家服务,...
来自: 解决方案
内容安全
阿里云内容安全基于深度学习技术,提供图片、视频、语音、文字、网页等多媒体的内容风险智能识别和审核服务,帮助用户发现色情、暴恐、政治敏感等风险内容,大幅度降低人工审核成本。
内容安全产品对直播、视频、社交、游戏、教育、娱乐等场景下的视频、图片、语音、文字内容进行全维度的风险审核,提供鉴黄、暴恐识别、广告识别、不良场景识别语音反垃圾、文本反垃圾等多种能力,同时结合专家策略运营服务,和审核平台的应用,构建内容智能审核解决方案,大幅度降低人工成本,提高审核效率,提升内容风险...
来自: 云产品
< 1 2 3 4 5 >
共有5页 跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 语音服务 智能语音交互 弹性公网IP 短信服务 人工智能平台 PAI

新品推荐

切换为移动版

新人特惠 爆款特惠 最新活动 免费试用