杰西卡项目(ElevenLabs TTS MCP)
该项目通过模型上下文协议 (MCP) 将 ElevenLabs 的文本转语音功能与 Cursor 集成。它由一个 FastAPI 后端服务和一个 React 前端应用程序组成。
特征
使用 ElevenLabs API 进行文本到语音的转换
语音选择和管理
Cursor 的 MCP 集成
现代 React 前端界面
WebSocket实时通信
代码质量的预提交钩子
自动代码格式化和 linting
项目结构
要求
Python 3.11+
Poetry(用于后端依赖管理)
Node.js 18+(用于前端)
光标(用于 MCP 集成)
本地开发设置
后端设置
前端设置
开发服务器
启动后端
后端提供:
REST API: http://localhost:9020
WebSocket:ws://localhost:9020/ws
MCP 服务器: http://localhost:9020/sse (与主 API 服务器集成)
启动前端
前端开发服务器:
环境配置
后端(.env)
前端(.env)
代码质量工具
后端
前端
生产部署
AWS ECR 和 GitHub Actions 设置
要启用自动构建并将 Docker 镜像推送到 Amazon ECR:
应用 Terraform 配置来创建所需的 AWS 资源:
cd terraform terraform init terraform applyGitHub Actions 工作流程将自动:
从 S3 中的 Terraform 状态读取必要的配置
在推送到
main
或develop
分支时构建 Docker 镜像将镜像推送到 ECR,并标记
latest
和特定提交 SHA
无需额外的存储库变量!工作流从 Terraform 状态中获取所有必需的配置。
工作原理
GitHub Actions 工作流程配置为:
首先假设一个具有 S3 读取权限的预定义 IAM 角色
从 S3 中的 Terraform 状态文件中获取并提取配置值
使用状态文件中的实际部署角色重新进行身份验证
构建 Docker 镜像并将其推送到状态中定义的 ECR 存储库
这种方法无需手动配置 GitHub 存储库变量,并确保 CI/CD 流程始终使用当前基础设施配置。
快速概览
前端:通过 jessica.georgi.io 上的 CloudFront 由 S3 提供服务
后端 API:api.georgi.io/jessica
WebSocket:连接到 api.georgi.io/jessica/ws
Docker 镜像:存储在 AWS ECR 中,可以部署到 ECS/EKS
基础设施:通过此存储库中的 Terraform 进行管理
MCP 与 Cursor 集成
启动后端服务器
在 Cursor 设置中,添加新的 MCP 服务器:
姓名:Jessica TTS
类型:SSE
故障排除
常见问题
API 密钥问题
错误:“无效的 API 密钥”
解决方案:检查
.env
文件
连接问题
错误:“无法连接到 MCP 服务器”
解决方案:验证后端是否正在运行并且端口是否正确
端口冲突
错误:“地址已被使用”
解决方案:更改
.env
中的端口
WebSocket 连接失败
错误:“WebSocket 连接失败”
解决方案:确保后端正在运行并且 WebSocket URL 正确
如需更多帮助,请在 GitHub 上提出问题。
执照
麻省理工学院
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
通过模型上下文协议将 ElevenLabs 文本转语音功能与 Cursor 集成,允许用户在 Cursor 编辑器中将文本转换为可选择声音的语音。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityIntegrates with ElevenLabs text-to-speech API.Last updated -113MIT License
- -securityFlicense-qualityA Model Context Protocol server that enables AI assistants to explore and interact with Cursor IDE's SQLite databases, providing access to project data, chat history, and composer information.Last updated -21
- -securityFlicense-qualityProvides text-to-speech capabilities through the Model Context Protocol, allowing applications to easily integrate speech synthesis with customizable voices, adjustable speech speed, and cross-platform audio playback support.Last updated -8
- AsecurityAlicenseAqualityA powerful Model Context Protocol framework that extends Cursor IDE with tools for web content retrieval, PDF processing, and Word document parsing.Last updated -813MIT License