灵云科技15日消息:捷通华声宣布推出最新嵌入式灵云语音合成技术——iHear7.1,全面优化吐字发音,实现不同音库语音合成器的定制,中文发音流畅自然,英文发音甜美动听,中英混读更加平滑自然,语音合成效果大幅提升,全面超越目前市场的同类产品,嵌入式语音合成技术达到国内顶尖水平。
经过在语音合成领域十多年技术研究与产业应用,捷通华声灵云语音合成技术的合成效果受到广大合作伙伴的高度肯定,在国家经济建设中的得到了广泛应用,从金融、通信、交通、CTI、能源、政务办公、医疗、教育等领域的语音广播系统,到智能手机、智能车载、智能家居、家电、智能机器人等领域的语音交互,灵云语音合成技术已深深的渗透到人民生活中,无处不在、无时不在地为亿万社会大众提供稳定、优质、便捷的语音服务。
灵云语音合成技术让文字有声有色
灵云语音合成技术能够实时、准确的将文本信息转换为自然、流畅的语音,单个音节发音干净纯正、饱满有力,连续词组发音真实准确、韵律自然,整体句子朗读效果清晰流畅、抑扬顿挫、富有表现力,达到真人播音员发音般的效果,可在灵云平台体验语音合成效果。灵云语音合成技术优秀的合成效果,是捷通华声凭借对汉语语音合成技术以及汉语韵律知识的独特认知,基于大规模真实录音音库的波形算法和对汉语韵律特征建模并在多项关键技术上取得重大创新突破取得的研究成果,在十多年的产业应用与积累中,灵云语音合成技术取得快速的进步并形成了其独特的优点:
l多语种,支持中英混读:支持中文普通话、粤语、维语、英语、日语、德语、法语等21种语言,覆盖全球90%以上的国家和地区,合成效果稳定,中英混读支持普通话、粤语与英语同音混读,有效满足中英文混合文本的语音合成需求。
l多音色,个性化发音:从成熟稳重、吐词清晰适合新闻类播报的男声,到干净细腻、温柔甜美适合高铁、机场等场所语音播报的女声,再到轻快活泼、声情并茂适合讲故事、听小说的童声,让语音合成有声有色,所有音库均继承捷通华声语音合成技术一贯的优良品质,全面满足各种应用场景中多样化的语音合成需求。
l多领域音库,发音更专业:支持金融证券、天气预报、体育赛事、公交信息、旅游餐饮、汽运、排队叫号、名家金曲、保险、航空、税务和电力、POI等12个领域专业词库、预选音音库等,大幅提升各专业领域的语音合成效果。
l音库定制化:支持字符、词组、句子读音定制,也可对一些常用的英文缩写进行中文播报,或者定义一些外部规则,为用户提供定制化的语音合成服务。
l智能文本预处理与分析:基于语言学与算法的优化,实现对多音字、特殊符号、韵律短语、未登录词(如地名、人名)等发音的准确处理,保证语音合成效果。
l支持播放打断、停止、继续等:支持MRCP协议,在语音合成播报过程中,支持打断、停止、暂停、以及继续等功能,轻松掌控语音合成播报过程。
灵云语音合成方便易集成
捷通华声灵云语音合成技术经过多年的产业应用与市场磨合,形成了独特的产品形态,支持Windows/Android/Linux/iOS等各种主流操作系统,能方便的集成到各种应用与客户业务系统中,以“云+端”形式为用户提供稳定、高效、优质的语音合成服务。
捷通华声推出的jTTS多语种语音合成平台,采用开放式架构设计方法,对外可方便地与客户业务对接,对内可挂接多音色、多语种音库引擎,用户既可以选择在本地合成语音,也可以直接选择从“云”端调用合成的语音,为用户提供多音色、多语种的语音合成服务。如今,捷通华声经过长期与国内金融、电信、交通、能源及CTI等各领域企业保持良好的合作伙伴关系,凭借为合作企业提供周到细致的技术服务和稳定优质的合成效果,捷通华声语音合成市场占有率已超过50%,语音服务从北京奥运会到上海世博会;从纵贯中国的高铁到各大飞机场;从建行、农行等各大银行的声讯服务到各领域的呼叫中心服务;从各个医院语音叫号到各地长途汽车站广播系统,可以说,从2000年到今天,捷通华声的灵云语音合成技术无时无刻、无处不在地为中国亿万大众提供最先进的语音合成服务。
为了满足市场上各种智能设备对离在线融合的语音合成解决方案的需求,捷通华声推出了小巧易“嵌入”的灵云语音合成引擎,目前已升级到iHear7.1,音库资源占用大小仅为8M,可以封装到SDK便捷地集成到各种应用中,已在智能手机、智能车载、智能家居、家电、智能机器人等领域得到了广泛的应用,并凭借其友好自然的声音与易集成的特点得到了广大合作伙伴的高度肯定,为用户提供“云+端”形式的语音合成服务,实现无网络状况下的“0”流量的优质语音体验。
结合灵云语音识别技术,灵云语音合成技术在灵云智能语音导航系统、灵云智能客服机器人等产品中得到了大量的应用,灵云智能语音导航系统、灵云智能客服机器人能以语音交互形式在电话端为用户提供便捷的业务查询、业务咨询以及业务办理等服务,有效减少企业客户服务成本,大幅提高客户服务效率,全面提升用户服务体验。
捷通华声中国智能语音领军企业
北京捷通华声语音技术公司创建于2000年,是国内最早从事中文语音合成(TTS)技术研究与应用的企业,2001年,捷通华声推出了具有国际领先水平的TTS世纪版,是国内第一项基于大容量真实录音库和韵律层级分析技术的语音合成技术,在自然度和流畅度上达到了一个崭新的水平,标示着中国中文语音合成技术开始进入商品实用化阶段。如今,捷通华声中文语音合成(TTS)技术在国内已处于绝对领先地位,在语音合成市场占有率超过50%。十多年来,捷通华声始终坚持自主研究语音合成(TTS)、语音识别(ASR)、语义理解(NLU)等智能语音技术,并不断推出粤语、维吾尔语等方言与少数民族语音合成技术,为保证我国中文智能语音技术始终处于世界领先地位做出了主要贡献,也成为推动语音合成技术在CTI、智能设备等领域中广泛应用的主要力量。
2014年,捷通华声凭借在智能语音产业界所做出的贡献与绝对领先的智能语音技术能力,在“第六届中国行业信息化奖项评选活动”上一举夺得“中国智能语音产业领军企业大奖”,成为智能语音产业中第一个获得此项殊荣的企业。
2015年,捷通华声在灵云语音合成,语音识别的基础上,推出了灵云声纹识别、灵云智能语音导航、智能语音分析系统,以及灵云朗读软件VoiceReader(PC端软件,可在灵云平台hcicloud.com下载)等一系列的优秀语音产品与解决方案,灵云智能语音技术通过服务百度导航、搜狗导航、导航犬、嘀嘀打车、快的打车、易到用车、天行听书、灵云智能输入法、触宝输入法等家喻户晓的移动应用服务,及京东商城、携程网、去哪儿网等大型互联网平台,使亿万社会大众充分感受并体验到智能语音等人工智能技术为现代生活所带来的轻松与便捷。
联合清华大学全面推动中国人工智能产业发展
2011年,捷通华声创造性推出了全球第一个最大、最全的人工智能技术开放平台—灵云平台(hcicloud.com),自灵云平台创建以来,捷通华声就担负起将智能语音、智能图像、语义理解、生物特征识别等人工智能技术实现产业化应用的企业之责,从最早推出灵云语音合成(TTS)、灵云手写识别(HWR),至灵云语音识别(ASR)、灵云声纹识别(VPR)、灵云人脸识别(AFR)、光学字符识别(OCR)、指纹识别(FPR)、自然语言理解(NLU)、机器翻译(MT)等全方位的人工智能技术,捷通华声一直坚定务实地走中国人工智能技术产业化道路。捷通人的努力,让这些无论是当时还是现在都是“高精尖”的人工智能技术距离产业与大众不再“高深莫测”,更不是遥不可及,更让大众真正的体验到人工智能技术为工作、生活所带来的巨大便捷。
2013年,捷通华声与清华大学旨在实现“灵云科技源自清华”的战略合作,相继创建清华灵云人工智能研究中心、清华海峡研究院人工智能研究中心,共同致力于推动中国人工智能产业的发展。捷通华声与清华大学的战略合作,使灵云平台“如虎添翼”,历经数年发展,灵云已成为中国人工智能领域最大最全也最具影响力的云服务平台,成功推动中国人工智能产业进入云服务时代,2015年,捷通华声凭借灵云全方位人工智能技术的领先优势与在中国人工智能产业中影响力,被产业内评为“中国人工智能产业领军企业”。
伴随人工智能产业在世界范围内的高速发展,捷通华声将继续以清华大学人工智能研究力量为依托,更加专注人工智能技术研究与产业化应用,与产业内合作伙伴精诚合作,共同创建良好的人工智能产业生态,共同推动中国人工智能产业的发展进步,为中国人工智能产业在世界范围内的崛起做出应有的贡献!