Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

Interaktiver Sprach-MCP-Server (Kokoro TTS + NeMo ASR)

Ein Model Context Protocol-Server, der Text-to-Speech-Funktionen (TTS) mithilfe von Kokoro und Speech-to-Text-Funktionen (STT) mithilfe von NVIDIA NeMo Parakeet-Modellen bereitstellt und so interaktive Sprachdialoge ermöglicht.

Verfügbare Tools

  • interactive_voice_dialog – Wandelt Text in Sprache um, spielt ihn ab, wartet dann auf die Spracheingabe des Benutzers und gibt die Transkription zurück.
    • Erforderliche Argumente:
      • text_to_speak (Zeichenfolge): Der Text, den der Assistent sprechen soll.
    • Optionale Argumente:
      • voice (Zeichenfolge): Die für TTS zu verwendende Stimme (z. B. „af_heart“). Standardmäßig ist „af_heart“ eingestellt.

Installation

Voraussetzungen

Einige der zugrunde liegenden TTS-Modelle erfordern die Installation espeak-ng auf Ihrem System.

Windows-Installation:

  1. Gehen Sie zu den espeak-ng-Releases .
  2. Klicken Sie auf „Neueste Version“.
  3. Laden Sie die entsprechende *.msi Datei herunter (z. B. espeak-ng-20191129-b702b03-x64.msi ).
  4. Führen Sie das heruntergeladene Installationsprogramm aus.

Lokale Entwicklungsinstallation

Damit Claude Desktop diesen Server mit python -m mcp_server_tts starten kann, müssen Sie ihn als Python-Modul installieren. Für die Entwicklung wird die Installation im editierbaren Modus ( -e ) empfohlen, da Änderungen am Quellcode so sofort übernommen werden, ohne dass eine Neuinstallation erforderlich ist.

Navigieren Sie zum Verzeichnis, das die Datei pyproject.toml enthält (das Stammverzeichnis dieses Serverprojekts), und führen Sie Folgendes aus:

pip install -e .

Nach der Installation können Sie es als Skript ausführen mit:

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

Konfiguration

Um diesen Server mit Claude Desktop zu verwenden, müssen Sie ihn zu Ihrer Datei claude_desktop_config.json hinzufügen. Der Speicherort dieser Datei lautet normalerweise: C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.json

Fügen Sie den folgenden Eintrag unter dem Objekt mcpServers in Ihrer claude_desktop_config.json hinzu:

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

Ihr Abschnitt mcpServers könnte beispielsweise folgendermaßen aussehen:

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Ermöglicht sprachbasierte Interaktionen mit Claude, indem Text mit Kokoro TTS in Sprache umgewandelt und Benutzerantworten mit NVIDIA NeMo ASR transkribiert werden, wodurch interaktive Sprachdialoge erstellt werden.

  1. Verfügbare Tools
    1. Installation
      1. Voraussetzungen
      2. Lokale Entwicklungsinstallation
    2. Konfiguration

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated 5 hours ago
        1,290
        378
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated 3 months ago
        1
        5
        12
        TypeScript
        • Linux
      • A
        security
        A
        license
        A
        quality
        Enables natural language interaction with Azure services through Claude Desktop, supporting resource management, subscription handling, and tenant selection with secure authentication.
        Last updated 21 days ago
        3
        11
        13
        TypeScript
        MIT License
      • A
        security
        A
        license
        A
        quality
        Provides intelligent transcript processing capabilities for Claude, featuring natural formatting, contextual repair, and smart summarization powered by Deep Thinking LLMs.
        Last updated 4 months ago
        4
        14
        TypeScript
        MIT License

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server