Skip to main content
Glama

Audio MCP Server

Аудио MCP-сервер

Сервер MCP (Model Context Protocol), который обеспечивает возможности аудиоввода/вывода для помощников ИИ, таких как Клод. Этот сервер позволяет Клоду взаимодействовать с аудиосистемой вашего компьютера, включая запись с микрофонов и воспроизведение звука через динамики.

Функции

  • Список аудиоустройств : просмотр всех доступных микрофонов и динамиков в вашей системе.
  • Запись звука : записывайте звук с любого микрофона с настраиваемой длительностью и качеством.
  • Воспроизведение записей : воспроизведите последнюю запись.
  • Воспроизведение аудиофайлов : воспроизведение аудиофайлов через динамики.
  • Преобразование текста в речь : (заполнитель для будущей реализации)

Требования

  • Python 3.8 или выше
  • Устройства ввода/вывода звука в вашей системе

Установка

Установка через Smithery

Чтобы автоматически установить сервер аудиоинтерфейса для Claude Desktop через Smithery :

npx -y @smithery/cli install @GongRzhe/Audio-MCP-Server --client claude

Ручная установка

  1. Клонируйте этот репозиторий или загрузите файлы на свой компьютер:
git clone https://github.com/GongRzhe/Audio-MCP-Server.git cd Audio-MCP-Server
  1. Создайте виртуальную среду и установите зависимости:
# Windows python -m venv .venv .venv\Scripts\activate pip install -r requirements.txt # macOS/Linux python -m venv .venv source .venv/bin/activate pip install -r requirements.txt
  1. Или используйте прилагаемый скрипт установки для автоматизации установки:
python setup_mcp.py

Конфигурация

Конфигурация рабочего стола Клода

Чтобы использовать этот сервер с Claude Desktop, добавьте следующее в файл конфигурации Claude Desktop:

  • macOS : ~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows : %APPDATA%\Claude\claude_desktop_config.json
{ "mcpServers": { "audio-interface": { "command": "/path/to/your/.venv/bin/python", "args": [ "/path/to/your/audio_server.py" ], "env": { "PYTHONPATH": "/path/to/your/audio-mcp-server" } } } }

Замените пути на фактические пути в вашей системе. Скрипт установки сгенерирует эту конфигурацию для вас.

Использование

После настройки сервера перезапустите Claude Desktop. В поле ввода должен появиться значок молотка, указывающий на то, что инструменты доступны.

Попробуйте спросить Клода:

  • «Какие микрофоны и динамики доступны в моей системе?»
  • «Запишите 5 секунд звука с моего микрофона».
  • «Воспроизвести аудиозапись».
  • «Воспроизвести аудиофайл с моего компьютера».

Доступные инструменты

список_аудио_устройств

Перечисляет все доступные устройства ввода и вывода звука в вашей системе.

запись_аудио

Записывает звук с вашего микрофона.

Параметры:

  • duration : Длительность записи в секундах (по умолчанию: 5)
  • sample_rate : Частота дискретизации в Гц (по умолчанию: 44100)
  • channels : количество аудиоканалов (по умолчанию: 1)
  • device_index : Конкретный индекс устройства ввода для использования (по умолчанию: системное значение по умолчанию)

воспроизведение_последней_записи

Воспроизводит последний записанный звук.

воспроизведение_аудио

Заполнитель для функции преобразования текста в речь.

Параметры:

  • text : Текст для преобразования в речь.
  • voice : используемый голос (по умолчанию: «default»)

воспроизведение_аудио_файла

Воспроизводит аудиофайл через динамики.

Параметры:

  • file_path : Путь к аудиофайлу
  • device_index : Конкретный индекс устройства вывода для использования (по умолчанию: системное значение по умолчанию)

Поиск неисправностей

Устройства не найдены.

Если аудиоустройства не обнаружены, проверьте:

  • Ваш микрофон и динамики подключены правильно
  • Ваша операционная система распознает устройства
  • У вас есть необходимые разрешения для доступа к аудиоустройствам

Проблемы с воспроизведением

Если воспроизведение звука не работает:

  • Проверьте настройки громкости.
  • Убедитесь, что выбрано правильное выходное устройство.
  • Попробуйте перезапустить приложение Claude Desktop.

Подключение к серверу

Если Клод не может подключиться к серверу:

  • Проверьте правильность путей конфигурации.
  • Убедитесь, что Python и все зависимости установлены.
  • Проверьте журналы Клода на наличие сообщений об ошибках.

Лицензия

Массачусетский технологический институт

Благодарности


Примечание: Этот сервер предоставляет инструменты, которые могут получить доступ к вашему микрофону и динамикам. Всегда проверяйте и одобряйте действия инструментов перед их выполнением.

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

Позволяет Клоду и другим помощникам на базе искусственного интеллекта взаимодействовать с аудиосистемой вашего компьютера, позволяя записывать звук с микрофонов и воспроизводить его через динамики.

  1. Функции
    1. Требования
      1. Установка
        1. Установка через Smithery
        2. Ручная установка
      2. Конфигурация
        1. Конфигурация рабочего стола Клода
      3. Использование
        1. Доступные инструменты
          1. список_аудио_устройств
          2. запись_аудио
          3. воспроизведение_последней_записи
          4. воспроизведение_аудио
          5. воспроизведение_аудио_файла
        2. Поиск неисправностей
          1. Устройства не найдены.
          2. Проблемы с воспроизведением
          3. Подключение к серверу
        3. Лицензия
          1. Благодарности

            Related MCP Servers

            • -
              security
              A
              license
              -
              quality
              A modular server implementation for Claude AI assistants with integrated tools, enabling Claude to perform actions and access external resources like file systems, web searches, browser automation, financial data, and document generation.
              Last updated -
              95
              MIT License
              • Linux
              • Apple
            • -
              security
              A
              license
              -
              quality
              A server that allows Claude to control audio playback on your computer, supporting MP3, WAV, and OGG files with features like play, list, and stop commands.
              Last updated -
              4
              MIT License
              • Apple
              • Linux
            • A
              security
              A
              license
              A
              quality
              A server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.
              Last updated -
              1
              10
              MIT License
              • Linux
            • -
              security
              F
              license
              -
              quality
              Enables voice-based interactions with Claude by converting text to speech using Kokoro TTS and transcribing user responses using NVIDIA NeMo ASR, creating interactive voice dialogues.
              Last updated -

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/GongRzhe/Audio-MCP-Server'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server