Skip to main content
Glama

Unstructured API MCP Server

Official

Неструктурированный API MCP-сервер

Реализация сервера MCP для взаимодействия с неструктурированным API. Этот сервер предоставляет инструменты для составления списка источников и рабочих процессов.

Доступные инструменты

Инструмент

Описание

list_sources

Перечисляет доступные источники из неструктурированного API.

get_source_info

Получите подробную информацию о конкретном исходном соединителе.

create_source_connector

Создайте исходный соединитель.)

update_source_connector

Обновить существующий исходный коннектор по параметрам.

delete_source_connector

Удалить исходный соединитель по идентификатору источника.

list_destinations

Список доступных пунктов назначения из неструктурированного API.

get_destination_info

Получите подробную информацию о конкретном целевом соединителе

create_destination_connector

Создайте коннектор назначения по параметрам.

update_destination_connector

Обновите существующий коннектор назначения по идентификатору назначения.

delete_destination_connector

Удалить коннектор назначения по идентификатору назначения.

list_workflows

Перечисляет рабочие процессы из неструктурированного API.

get_workflow_info

Получите подробную информацию о конкретном рабочем процессе.

create_workflow

Создайте новый рабочий процесс с идентификатором источника, назначения и т. д.

run_workflow

Запустить определенный рабочий процесс с идентификатором рабочего процесса

update_workflow

Обновить существующий рабочий процесс по параметрам.

delete_workflow

Удалить определенный рабочий процесс по идентификатору.

list_jobs

Перечисляет задания для определенного рабочего процесса из неструктурированного API.

get_job_info

Получите подробную информацию о конкретной вакансии по ее идентификатору.

cancel_job

Удалить конкретную работу по идентификатору.

list_workflows_with_finished_jobs

Перечисляет все рабочие процессы, имеющие завершенные задания, а также информацию об источнике и месте назначения.

Ниже приведен список коннекторов, которые в настоящее время поддерживает сервер UNS-MCP . Полный список исходных коннекторов, которые поддерживает неструктурированная платформа, см . здесь , а список коннекторов назначения — здесь . Мы планируем добавить еще!

Источник

Место назначения

С3

С3

Лазурный

Weaviate

Google Диск

Шишка

OneDrive

АстраДБ

Salesforce

MongoDB

Sharepoint

Neo4j

Объемы блоков данных

Таблица дельта томов Databricks

Чтобы использовать инструмент, который создает/обновляет/удаляет коннектор, учетные данные для этого конкретного коннектора должны быть определены в вашем файле .env. Ниже приведен список credentials для поддерживаемых нами коннекторов:

Имя удостоверения

Описание

ANTHROPIC_API_KEY

требуется запустить

minimal_client

для взаимодействия с нашим сервером.

AWS_KEY

,

AWS_SECRET

требуется создать коннектор S3 через сервер

uns-mcp

, см. как это сделать в

документации

и

здесь

WEAVIATE_CLOUD_API_KEY

требуется создать векторный коннектор базы данных Weaviate, см. как это сделать в

документации

FIRECRAWL_API_KEY

для использования инструментов Firecrawl в

external/firecrawl.py

необходимо зарегистрироваться в

Firecrawl

и получить ключ API.

ASTRA_DB_APPLICATION_TOKEN

,

ASTRA_DB_API_ENDPOINT

требуется создать коннектор Astradb через сервер

uns-mcp

, см. как это сделать в

документации

AZURE_CONNECTION_STRING

требуется опция 1 для создания Azure Connector через сервер

uns-mcp

, см. как это сделать в

документации

AZURE_ACCOUNT_NAME

+

AZURE_ACCOUNT_KEY

требуется вариант 2 для создания коннектора Azure через сервер

uns-mcp

, см. как это сделать в

документации

AZURE_ACCOUNT_NAME

+

AZURE_SAS_TOKEN

требуется опция 3 для создания Azure Connector через сервер

uns-mcp

, см. как это сделать в

документации

NEO4J_PASSWORD

требуется создать коннектор Neo4j через сервер

uns-mcp

, см. как это сделать в

документации

MONGO_DB_CONNECTION_STRING

требуется создать коннектор MongoDB через сервер

uns-mcp

, см. как ��то сделать в

документации

GOOGLEDRIVE_SERVICE_ACCOUNT_KEY

строковое значение. Исходный ключ учетной записи сервера (следуйте

документации

) находится в файле json, запустите

base64 < /path/to/google_service_account_key.json

в терминале, чтобы получить строковое значение

DATABRICKS_CLIENT_ID

,

DATABRICKS_CLIENT_SECRET

требуется создать коннектор таблицы томов/дельта Databricks через сервер

uns-mcp

, см. как в

документации

и

здесь

ONEDRIVE_CLIENT_ID

,

ONEDRIVE_CLIENT_CRED

,

ONEDRIVE_TENANT_ID

требуется создать коннектор One Drive через сервер

uns-mcp

, см. как это сделать в

документации

PINECONE_API_KEY

требуется создать коннектор базы данных Pinecone vector DB через сервер

uns-mcp

, см. как это сделать в

документации

SALESFORCE_CONSUMER_KEY

,

SALESFORCE_PRIVATE_KEY

требуется создать исходный коннектор salesforce через сервер

uns-mcp

, см. как это сделать в

документации

SHAREPOINT_CLIENT_ID

,

SHAREPOINT_CLIENT_CRED

,

SHAREPOINT_TENANT_ID

требуется создать коннектор One Drive через сервер

uns-mcp

, см. как это сделать в

документации

LOG_LEVEL

Используется для установки уровня ведения журнала для нашего

minimal_client

, например, установите значение ERROR, чтобы получить все

CONFIRM_TOOL_USE

установите значение true, чтобы

minimal_client

мог подтвердить выполнение перед каждым вызовом инструмента

DEBUG_API_REQUESTS

установите значение true, чтобы

uns_mcp/server.py

мог выводить параметры запроса для лучшей отладки

Источник Firecrawl

Firecrawl — это API веб-сканирования, который предоставляет две основные возможности в нашем MCP:

  1. Извлечение HTML-контента : использование invoke_firecrawl_crawlhtml для запуска заданий сканирования и check_crawlhtml_status для их мониторинга

  2. Генерация текста, оптимизированного для LLM : использование invoke_firecrawl_llmtxt для генерации текста и check_llmtxt_status для получения результатов

Как работает Firecrawl:

Процесс сканирования веб-страниц:

  • Начинает с указанного URL-адреса и анализирует его для выявления ссылок

  • Использует карту сайта, если она доступна; в противном случае переходит по ссылкам, найденным на сайте.

  • Рекурсивно обходит каждую ссылку, чтобы обнаружить все подстраницы.

  • Собирает контент с каждой посещенной страницы, обрабатывает рендеринг JavaScript и ограничения скорости

  • При необходимости задания можно отменить с помощью cancel_crawlhtml_job

  • Используйте это, если вам нужно извлечь всю информацию в необработанный HTML. Рабочий процесс Unstructured отлично справляется с этой задачей :smile:

Генерация текста LLM:

  • После сканирования извлекает чистый, осмысленный текстовый контент из просканированных страниц.

  • Создает оптимизированные текстовые форматы, специально отформатированные для больших языковых моделей.

  • Результаты автоматически загружаются в указанное место S3.

  • Примечание: задания по генерации текста LLM нельзя отменить после запуска. Функция cancel_llmtxt_job предусмотрена для обеспечения согласованности, но в настоящее время не поддерживается API Firecrawl.

Примечание: для использования этих функций необходимо установить переменную среды FIRECRAWL_API_KEY .

Установка и настройка

В этом руководстве приведены пошаговые инструкции по настройке и конфигурированию сервера UNS_MCP с использованием Python 3.12 и инструмента uv .

Предпосылки

  • Питон 3.12+

  • uv для управления окружающей средой

  • Ключ API от Unstructured. Вы можете зарегистрироваться и получить свой ключ API здесь .

Использование uv (рекомендуется)

При использовании uvx не требуется дополнительная установка, так как он обрабатывает выполнение. Однако, если вы предпочитаете установить пакет напрямую:

uv pip install uns_mcp

Настр��ить рабочий стол Клода

Для интеграции с Claude Desktop добавьте следующий контент в ваш claude_desktop_config.json :

Примечание: файл находится в каталоге ~/Library/Application Support/Claude/ .

Использование команды

{ "mcpServers": { "UNS_MCP": { "command": "uvx", "args": ["uns_mcp"], "env": { "UNSTRUCTURED_API_KEY": "<your-key>" } } } }

Альтернативный вариант — использование пакета Python:

{ "mcpServers": { "UNS_MCP": { "command": "python", "args": ["-m", "uns_mcp"], "env": { "UNSTRUCTURED_API_KEY": "<your-key>" } } } }

Использование исходного кода

  1. Клонируйте репозиторий.

  2. Установить зависимости:

    uv sync
  3. Установите свой неструктурированный ключ API как переменную среды. Создайте файл .env в корневом каталоге со следующим содержимым:

    UNSTRUCTURED_API_KEY="YOUR_KEY"

    Настраиваемые переменные среды см. в .env.template .

Теперь вы можете запустить сервер одним из следующих способов:

uvx pip install -e .

Обновите конфигурацию Claude Desktop:

{ "mcpServers": { "UNS_MCP": { "command": "uvx", "args": ["uns_mcp"] } } }

Примечание : не забудьте указать исполняемый файл uvx в среде, где вы установили пакет.

Примечание: не поддерживается Claude Desktop.

Для протокола SSE отладку можно упростить, разделив клиент и сервер:

  1. Запустите сервер в одном терминале:

    uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080 # or make sse-server
  2. Протестируйте сервер, используя локальный клиент в другом терминале:

    uv run python minimal_client/client.py "http://127.0.0.1:8080/sse" # or make sse-client

Примечание: Чтобы остановить службы, сначала нажмите Ctrl+C на клиенте, а затем на сервере.

Настройте Claude Desktop для использования stdio:

{ "mcpServers": { "UNS_MCP": { "command": "ABSOLUTE/PATH/TO/.local/bin/uv", "args": [ "--directory", "ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp", "run", "server.py" ] } } }

Либо запустите локальный клиент:

uv run python minimal_client/client.py uns_mcp/server.py

Дополнительная конфигурация локального клиента

Настройте минимальный клиент с использованием переменных окружения:

  • LOG_LEVEL="ERROR" : установите для подавления отладочных выходных данных LLM, отображая понятные сообщения для пользователей.

  • CONFIRM_TOOL_USE='false' : Отключить подтверждение использования инструмента перед выполнением. Используйте с осторожностью , особенно во время разработки, так как LLM может выполнять дорогостоящие рабочие процессы или удалять данные.

Инструменты отладки

Anthropic предоставляет инструмент MCP Inspector для отладки/тестирования вашего сервера MCP. Выполните следующую команду, чтобы запустить отладочный пользовательский интерфейс. Оттуда вы сможете добавлять переменные среды (указывающие на ваш локальный env) на левой панели. Включите туда свой личный ключ API как env var. Перейдите в tools , чтобы протестировать возможности, которые вы добавляете на сервер MCP.

mcp dev uns_mcp/server.py

Если вам необходимо регистрировать параметры вызова запроса в UnstructuredClient , установите переменную среды DEBUG_API_REQUESTS=false . Журналы хранятся в файле формата unstructured-client-{date}.log , который можно просмотреть для отладки параметров вызова запроса в функциях UnstructuredClient .

Добавить терминальный доступ к минимальному клиенту

Мы собираемся использовать @wonderwhy-er/desktop-commander для добавления терминального доступа к минимальному клиенту. Он построен на сервере файловой системы MCP. Будьте осторожны, так как клиент (также LLM) теперь имеет доступ к приватным файлам.

Для установки пакета выполните следующую команду:

npx @wonderwhy-er/desktop-commander setup

Затем запустите клиент с дополнительным параметром:

uv run python minimal_client/client.py "http://127.0.0.1:8080/sse" "@wonderwhy-er/desktop-commander" # or make sse-client-terminal

Использование подмножества инструментов

Если ваш клиент поддерживает использование только подмножества инструментов, вот список вещей, которые вам следует знать:

  • Инструмент update_workflow необходимо загрузить в контексте вместе с инструментом create_workflow , поскольку он содержит подробное описание того, как создать и настроить пользовательский узел.

Известные проблемы

  • update_workflow — необходимо иметь в контексте конфигурацию обновляемого рабочего процесса, либо предоставив ее пользователю, либо вызвав инструмент get_workflow_info , поскольку этот инструмент не работает как средство применения patch , он полностью заменяет конфигурацию рабочего процесса.

CHANGELOG.md

Все новые разработанные функции/исправления/улучшения будут добавлены в CHANGELOG.md. Предпочтительным является предварительный формат 0.xx-dev, прежде чем мы перейдем к стабильной версии.

Поиск неисправностей

  • Если вы столкнулись с проблемой Error: spawn <command> ENOENT это означает, что <command> не установлен или не виден в вашем PATH:

    • Обязательно установите его и добавьте в PATH.

    • или укажите абсолютный путь к команде в поле command вашего конфига. Например, замените python на /opt/miniconda3/bin/python

Deploy Server
A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Реализация сервера MCP, которая обеспечивает взаимодействие с неструктурированным API, предоставляя инструменты для составления списка, создания, обновления и управления источниками, пунктами назначения и рабочими процессами.

  1. Доступные инструменты
    1. Источник Firecrawl
  2. Установка и настройка
    1. Предпосылки
      1. Использование uv (рекомендуется)
      2. Использование исходного кода
    2. Дополнительная конфигурация локального клиента
      1. Инструменты отладки
    3. Добавить терминальный доступ к минимальному клиенту
      1. Использование подмножества инструментов
        1. Известные проблемы
          1. CHANGELOG.md
            1. Поиск неисправностей

              Related MCP Servers

              • -
                security
                A
                license
                -
                quality
                A Python-based MCP server that integrates OpenAPI-described REST APIs into MCP workflows, enabling dynamic exposure of API endpoints as MCP tools.
                Last updated -
                119
                MIT License
                • Linux
                • Apple
              • -
                security
                F
                license
                -
                quality
                This is an MCP server that facilitates building tools for interacting with various APIs and workflows, supporting Python-based development with potential for customizable prompts and user configurations.
                Last updated -
              • -
                security
                A
                license
                -
                quality
                An MCP server that exposes HTTP methods defined in an OpenAPI specification as tools, enabling interaction with APIs via the Model Context Protocol.
                Last updated -
                8
                MIT License
              • A
                security
                A
                license
                A
                quality
                An MCP server implementation built to interact with Confluent Kafka and Confluent Cloud REST APIs.
                Last updated -
                24
                20
                105
                MIT License
                • Apple

              View all related MCP servers

              MCP directory API

              We provide all the information about MCP servers via our MCP API.

              curl -X GET 'https://glama.ai/api/mcp/v1/servers/Unstructured-IO/UNS-MCP'

              If you have feedback or need assistance with the MCP directory API, please join our Discord server