最新开源tts,支持时时对话,延迟低于25ms,多规则适配多场景

概述

Orpheus TTS是建立在Llama-3B主链上的开源文本到语音系统。 Orpheus展示了使用LLM进行语音合成的新兴功能。它以其接近人类的自然情感表达、超低延迟的实时输出以及强大的零样本语音克隆能力,还将延迟压缩到令人惊叹的 25-50 毫秒,完美适配实时对话场景。并且提供了从 150M 到 3B 参数的四种型号,满足不同场景的需求。支持零样本语音克隆和灵活的情感控制,可让每个人都能轻松定制专属音色。

能力

  • 类似人类的语音:自然语调,情感和节奏,优于SOTA封闭源模型
  • 零拍的语音克隆:克隆声音而无需以前的微调
  • 引导的情感和语调:带有简单标签的控制语音和情感特征
  • 低延迟:〜200ms的实时应用程序流延迟,可降低至〜100ms,并使用输入流。

流推理示例

克隆这个仓库

git clone https://github.com/canopyai/Orpheus-TTS.git

导航和安装软件包

cd Orpheus-TTS && pip install orpheus-speech # uses vllm under the hood for fast inference
pip install vllm==0.7.3

VLLM在3月18日推出了一个版本,因此通过恢复到后来 解决了一些错误

pip install orpheus-speech

在下面运行以下示例:

from orpheus_tts import OrpheusModelimport waveimport time
model = OrpheusModel(model_name ="canopylabs/orpheus-tts-0.1-finetune-prod")prompt = '''Man, the way social media has, um, completely changed how we interact is just wild, right? Like, we're all connected 24/7 but somehow people feel more alone than ever. And don't even get me started on how it's messing with kids' self-esteem and mental health and whatnot.'''
start_time = time.monotonic()syn_tokens = model.generate_speech(   prompt=prompt,   voice="tara",   )
with wave.open("output.wav""wb"as wf:   wf.setnchannels(1)   wf.setsampwidth(2)   wf.setframerate(24000)
   total_frames = 0   chunk_counter = 0   for audio_chunk in syn_tokens: # output streaming      chunk_counter += 1      frame_count = len(audio_chunk) // (wf.getsampwidth() * wf.getnchannels())      total_frames += frame_count      wf.writeframes(audio_chunk)   duration = total_frames / wf.getframerate()
   end_time = time.monotonic()   print(f"It took {end_time - start_time} seconds to generate {duration:.2f} seconds of audio")
测试效果
1、在线Demo:

https://huggingface.co/spaces/MohamedRashad/Orpheus-TTS

640-11
想构造时时语音助手、有声读物,配音的可以搞起来了,哈哈

本文内容来源于公开网络,出于传递信息之目的整理发布。原文版权归原作者所有,若涉及侵权请先提供版权后联系我们删除

(0)
WP之家WP之家
上一篇 2025年3月25日 下午8:41
下一篇 2025年3月26日 下午2:52

相关推荐

  • ChatGPT中文指令(Prompt)角色预设大全!让你的AI更懂你!

    ChatGPT的回答总是不令人满意,那可能是你对AI下错了指令/提示词(Prompt),想要ChatGPT更懂你,回答更精准,就要给它下对指令。     在国外有大佬们已经整理出一些标准的问话模板,直接拿来使用后,效…

    教程资讯 2025年3月29日
  • 快手动感涂鸦特效怎么去掉

    快手动感涂鸦特效怎么去掉,关于快手最近很火的动感涂鸦特效该怎么拍,动感涂鸦特效要怎么去掉,可能都有很多人不太清楚吧。那么下面就让小编为大家带来,快手动感涂鸦特效去掉取消方法教程。 近期在快手上有很多用…

    2025年4月5日
  • vivo开不了机怎么办(vivo手机开不了机怎么解决)

      1、电池损坏导致 手机电池属于损耗品,当手机使用时间久了,就会出现电池过早损坏或者不良等情况,您可以将手机连接上充电器,看看手机是否会显示充点以及看看电量百分比是否会增加,来简单判断电池如何,如…

    教程资讯 2025年3月29日
  • 微信8.0状态引流1w+实操

    微信8.0版本中的一个新的流量入口“状态”,年轻人比较爱玩,通过收集“状态”需要的相关经典视频,引导加微信或者进群领取相关素材,达到快速引流的目的。 前几天,微信更新了8.0,在朋友圈迎来了大规模的刷屏,这次微…

    2025年3月29日
  • 【半干货】做站的几种方向讨论

    【1】纯图文展示站点 这种站目前应该是最多的,分两种,一种是公司企业站,一种是个人站,公司企业没啥好说,单纯为了展示用的,早先的建站公司,谁还不是个套模大王。 个人站的话,原创应该很少了吧,纯原创产量是…

    教程资讯 2025年3月29日
  • 《哔哩哔哩》开通工房最新方式

    《哔哩哔哩》开通工房最新方式,哔哩哔哩又出了新的模式,不少的小伙伴想要知道工房在哪里可以开通,别着急,下面wp之家小编给大家带来了哔哩哔哩开通工房的方法,有需要的小伙伴快来看看吧,希望能够帮助到大家! …

    2025年4月5日
  • 如果有人打了我一拳,到医院检查一遍,什么事都没有,该如何处理?

    如果别人无故打你一拳,听我的办法,保证让你满意。 只要别人动手了,能不还手就先别还手。这点挺重要。这也要掌握好分寸,我说的是能不动手的情况下,就别动手。 不要离开现场。直接报警处理。如何报警也挺关键的…

    教程资讯 2025年3月29日
  • 谷歌商店怎么打不开?闪退?(详细解决办法)

    谷歌应用商店(Google play)是由谷歌官方退出的应用下载市场,是专门针对安卓手机的应用商店。里面有海量的安卓应用,汇聚了全世界的安卓APP,很多国外好玩的游戏和APP,都需要通过谷歌商店下载。所以,对于有需求…

    教程资讯 2025年3月29日