Аудио MCP-сервер
Сервер MCP (Model Context Protocol), который обеспечивает возможности аудиоввода/вывода для помощников ИИ, таких как Клод. Этот сервер позволяет Клоду взаимодействовать с аудиосистемой вашего компьютера, включая запись с микрофонов и воспроизведение звука через динамики.
Функции
- Список аудиоустройств : просмотр всех доступных микрофонов и динамиков в вашей системе.
- Запись звука : записывайте звук с любого микрофона с настраиваемой длительностью и качеством.
- Воспроизведение записей : воспроизведите последнюю запись.
- Воспроизведение аудиофайлов : воспроизведение аудиофайлов через динамики.
- Преобразование текста в речь : (заполнитель для будущей реализации)
Требования
- Python 3.8 или выше
- Устройства ввода/вывода звука в вашей системе
Установка
Установка через Smithery
Чтобы автоматически установить сервер аудиоинтерфейса для Claude Desktop через Smithery :
Ручная установка
- Клонируйте этот репозиторий или загрузите файлы на свой компьютер:
- Создайте виртуальную среду и установите зависимости:
- Или используйте прилагаемый скрипт установки для автоматизации установки:
Конфигурация
Конфигурация рабочего стола Клода
Чтобы использовать этот сервер с Claude Desktop, добавьте следующее в файл конфигурации Claude Desktop:
- macOS :
~/Library/Application Support/Claude/claude_desktop_config.json
- Windows :
%APPDATA%\Claude\claude_desktop_config.json
Замените пути на фактические пути в вашей системе. Скрипт установки сгенерирует эту конфигурацию для вас.
Использование
После настройки сервера перезапустите Claude Desktop. В поле ввода должен появиться значок молотка, указывающий на то, что инструменты доступны.
Попробуйте спросить Клода:
- «Какие микрофоны и динамики доступны в моей системе?»
- «Запишите 5 секунд звука с моего микрофона».
- «Воспроизвести аудиозапись».
- «Воспроизвести аудиофайл с моего компьютера».
Доступные инструменты
список_аудио_устройств
Перечисляет все доступные устройства ввода и вывода звука в вашей системе.
запись_аудио
Записывает звук с вашего микрофона.
Параметры:
duration
: Длительность записи в секундах (по умолчанию: 5)sample_rate
: Частота дискретизации в Гц (по умолчанию: 44100)channels
: количество аудиоканалов (по умолчанию: 1)device_index
: Конкретный индекс устройства ввода для использования (по умолчанию: системное значение по умолчанию)
воспроизведение_последней_записи
Воспроизводит последний записанный звук.
воспроизведение_аудио
Заполнитель для функции преобразования текста в речь.
Параметры:
text
: Текст для преобразования в речь.voice
: используемый голос (по умолчанию: «default»)
воспроизведение_аудио_файла
Воспроизводит аудиофайл через динамики.
Параметры:
file_path
: Путь к аудиофайлуdevice_index
: Конкретный индекс устройства вывода для использования (по умолчанию: системное значение по умолчанию)
Поиск неисправностей
Устройства не найдены.
Если аудиоустройства не обнаружены, проверьте:
- Ваш микрофон и динамики подключены правильно
- Ваша операционная система распознает устройства
- У вас есть необходимые разрешения для доступа к аудиоустройствам
Проблемы с воспроизведением
Если воспроизведение звука не работает:
- Проверьте настройки громкости.
- Убедитесь, что выбрано правильное выходное устройство.
- Попробуйте перезапустить приложение Claude Desktop.
Подключение к серверу
Если Клод не может подключиться к серверу:
- Проверьте правильность путей конфигурации.
- Убедитесь, что Python и все зависимости установлены.
- Проверьте журналы Клода на наличие сообщений об ошибках.
Лицензия
Массачусетский технологический институт
Благодарности
- Создано с использованием протокола контекста модели
- Использует звуковое устройство и звуковой файл для обработки звука
Примечание: Этот сервер предоставляет инструменты, которые могут получить доступ к вашему микрофону и динамикам. Всегда проверяйте и одобряйте действия инструментов перед их выполнением.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
Позволяет Клоду и другим помощникам на базе искусственного интеллекта взаимодействовать с аудиосистемой вашего компьютера, позволяя записывать звук с микрофонов и воспроизводить его через динамики.
Related MCP Servers
- -securityAlicense-qualityA modular server implementation for Claude AI assistants with integrated tools, enabling Claude to perform actions and access external resources like file systems, web searches, browser automation, financial data, and document generation.Last updated -95MIT License
- -securityAlicense-qualityA server that allows Claude to control audio playback on your computer, supporting MP3, WAV, and OGG files with features like play, list, and stop commands.Last updated -4MIT License
- AsecurityAlicenseAqualityA server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.Last updated -110MIT License
- -securityFlicense-qualityEnables voice-based interactions with Claude by converting text to speech using Kokoro TTS and transcribing user responses using NVIDIA NeMo ASR, creating interactive voice dialogues.Last updated -