Skip to main content
Glama

Interactive Voice MCP Server

by rungee84

インタラクティブ音声 MCP サーバー (Kokoro TTS + NeMo ASR)

Kokoro を使用したテキスト読み上げ (TTS) 機能と、NVIDIA NeMo Parakeet モデルを使用した音声テキスト変換 (STT) 機能を提供し、対話型音声ダイアログを可能にするモデル コンテキスト プロトコル サーバーです。

利用可能なツール

  • interactive_voice_dialog - テキストを音声に合成して再生し、ユーザーの音声入力を聞いて書き起こしを返します。
    • 必要な引数:
      • text_to_speak (文字列): アシスタントが話すテキスト。
    • オプションの引数:
      • voice (文字列): TTSで使用する音声(例:'af_heart')。デフォルトは'af_heart'です。

インストール

前提条件

基礎となる TTS モデルの一部では、システムにespeak-ngがインストールされている必要があります。

Windows インストール:

  1. espeak-ng リリースに移動します。
  2. 「最新リリース」をクリックします。
  3. 適切な*.msiファイル (例: espeak-ng-20191129-b702b03-x64.msi ) をダウンロードします。
  4. ダウンロードしたインストーラーを実行します。

ローカル開発インストール

Claude Desktop がpython -m mcp_server_ttsを使用してこのサーバーを起動できるようにするには、Python モジュールとしてインストールする必要があります。開発環境では、「編集可能」モード ( -e ) でインストールすることをお勧めします。これにより、ソースコードへの変更が再インストールなしで即座に反映されます。

pyproject.tomlファイル (このサーバー プロジェクトのルート) を含むディレクトリに移動し、次を実行します。

pip install -e .

インストール後、次のコマンドを使用してスクリプトとして実行できます。

python -m mcp_server_tts.server # Assuming the main module is still server.py within mcp_server_tts # Or, if you create a new package structure: # python -m mcp_interactive_voice_server

構成

Claude Desktopでこのサーバーを使用するには、 claude_desktop_config.jsonファイルに追加する必要があります。このファイルの場所は通常、 C:\Users\<YourUsername>\AppData\Roaming\Claude\claude_desktop_config.jsonです。

claude_desktop_config.jsonmcpServersオブジェクトの下に次のエントリを追加します。

"tts": { "command": "python", "args": ["-m", "mcp_server_tts"] }

たとえば、 mcpServersセクションは次のようになります。

{ // ... other configurations ... "mcpServers": { // ... other servers ... "tts": { "command": "python", "args": ["-m", "mcp_server_tts"] } // ... other servers ... } // ... other configurations ... }
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Kokoro TTS を使用してテキストを音声に変換し、NVIDIA NeMo ASR を使用してユーザーの応答を書き起こし、対話型の音声ダイアログを作成することで、Claude との音声ベー��のインタラクションが可能になります。

  1. 利用可能なツール
    1. インストール
      1. 前提条件
      2. ローカル開発インストール
    2. 構成

      Related MCP Servers

      • -
        security
        A
        license
        -
        quality
        Lets you use Claude Desktop, or any MCP Client, to use natural language to accomplish things with Neon.
        Last updated -
        727
        395
        TypeScript
        MIT License
        • Linux
        • Apple
      • A
        security
        F
        license
        A
        quality
        Facilitates direct speech generation using Claude for multiple languages and emotions, integrating with a Zonos TTS setup via the Model Context Protocol.
        Last updated -
        1
        1
        13
        TypeScript
        • Linux
      • A
        security
        A
        license
        A
        quality
        Enables natural language interaction with Azure services through Claude Desktop, supporting resource management, subscription handling, and tenant selection with secure authentication.
        Last updated -
        3
        7
        14
        TypeScript
        MIT License
      • A
        security
        A
        license
        A
        quality
        Provides intelligent transcript processing capabilities for Claude, featuring natural formatting, contextual repair, and smart summarization powered by Deep Thinking LLMs.
        Last updated -
        4
        15
        TypeScript
        MIT License

      View all related MCP servers

      MCP directory API

      We provide all the information about MCP servers via our MCP API.

      curl -X GET 'https://glama.ai/api/mcp/v1/servers/rungee84/voice_mcp'

      If you have feedback or need assistance with the MCP directory API, please join our Discord server