当前位置：首页 > 人工智能 > 正文内容

Parler-TTS 开源的轻量级文本到语音（TTS）模型

二向箔2024-04-15 22:48:28人工智能362

开源的轻量级文本到语音（TTS）模型，可以生成高质量、自然流畅的语音，模仿给定的演讲者（性别、音高、说话风格等

GitHub源码：https://github.com/huggingface/parler-tts

体验地址：https://huggingface.co/spaces/parler-tts/parler_tts_mini

扫描二维码推送至手机访问。

本文链接：https://www.erxbo.com/post/1757.html

分享给朋友：

返回列表

上一篇：Next.js AI Chatbot 谷歌gemini 的UI 聊天机器人模板

下一篇：Reka AI 多模态语言模型

“Parler-TTS 开源的轻量级文本到语音（TTS）模型” 的相关文章

Stability AI 发布开源视频生成模型「Stable Video Diffusion」

用图片生成视频效果很惊艳SVD 支持文本和图像生成视频，还支持物体从单一视角到多视角的转化；目前最高支持生成 14/25 帧、576 x 1024 分辨率的视频尽管 SVD 还处于基础阶段，但是相信未来一定会成为像 SDXL 一样的顶级开源 AI 模型GitHub地址：https://github....

Runway 发布视频生成模型 Gen-2 的运动笔刷功能（图片生成视频）

真的是相当牛逼Runway 发布视频生成模型 Gen-2 的运动笔刷功能"Motion Brush/运动笔刷"的发布代表了模型可控性的一个重要里程碑，用户只需绘制一个区域或主题，选择一个方向并为运动添加强度即可。运动笔刷允许您为您的生成添加受控运动，从而更好地控制生成的内容。还可...

Pika Labs 推出视频生成模型 Pika 1.0

以图片生成视频，未来的重量级选手Pika Labs 推出视频生成模型 Pika 1.0Pika 1.0 整体是个重大产品升级，包括一个新的 AI 模型，能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频。允许用户上传自己的视频来局部编辑与重构场景，比如为画面中的人物更换衣物，为视频中的猩猩...

GPT Crawler - 将网站变成自定义 GPT

运行该项目，输入网址，然后项目会爬取该网站所有内容并生成 Json 文件，然后它会将该文件喂给 ChatGPT，打造个人知识库或者智能助理我感觉非常实用，尤其是面对密密麻麻的英文开发文档之时，可以直接与其对话GitHub地址：https://github.com/BuilderIO/gpt-craw...

Freepik Pikaso - 一个 AI 图像实时生成工具

边画边出图Freepik 是一个全球知名的素材库网站，网站拥有超过 450 万素材。依托着海量素材资源，Freepik 顺势推出 AI 图像实时生成工具「Pikaso」除了 Prompt ，还支持上传图片、画笔、图案等功能，可自定义程度非常高官网地址：https://freepik.com/pik...

Autoware ：一个开源的自动驾驶系统

Autoware ：一个开源的自动驾驶系统Autoware 基于机器人操作系统 (ROS) 构建，可在各种车辆和应用中实现自动驾驶的商业部署。Autoware 的主要功能和特点：1、模块化架构：Autoware 包含自动驾驶所需的所有功能（如感知、定位、规划、控制），并采用模块化架构，具有清晰定义的...