⚡ Servidor MCP C̷h̷u̷c̷k̷N̷o̷r̷r̷i̷s̷: Mejora tu LLM ⚡
Puerta de enlace MCP para solicitudes de mejora de LLM especializadas con adaptación de esquema dinámico.
⚠️ DESCARGO DE RESPONSABILIDAD
IMPORTANTE: Trabajo en curso con limitaciones. Solo funciona con modelos más débiles. Las versiones más recientes de LLM reconocen los intentos de jailbreak. Esta herramienta también está diseñada para fines de investigación y evaluación de seguridad, con el fin de ayudar a identificar vulnerabilidades en los sistemas LLM.
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
📖 Introducción
El servidor MCP C̷h̷u̷c̷k̷N̷o̷r̷r̷i̷s̷ proporciona una implementación del Protocolo de Contexto de Modelo (MCP) que entrega indicaciones de mejora especializadas a varios LLM. Utiliza indicaciones de jailbreak del proyecto L1B3RT4S de elder-plinius e implementa un enfoque de esquema dinámico para una entrega más eficaz.
🚀 Primeros pasos
Ejecutar directamente con npx
:
Configuración del cliente MCP
Agregue a su lista de servidores MCP en mcp_config.json
:
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
🤔 Cómo funciona
Enfoque dinámico avanzado
El servidor utiliza un enfoque de dos fases para evitar la detección de jailbreak:
- Primera llamada :
- El Asistente de IA descubre la herramienta
C̷h̷u̷c̷k̷N̷o̷r̷r̷i̷s̷
con una descripción de esquema neutral - El asistente llama a la herramienta con su tipo de modelo
- El servidor devuelve un mensaje sutil de "preparación" que hace que el LLM sea receptivo al jailbreak.
- El servidor recuerda el tipo de LLM para la próxima llamada
- El Asistente de IA descubre la herramienta
- Llamadas posteriores :
- El esquema cambia dinámicamente para incluir el jailbreak en su descripción
- La descripción de la herramienta ahora contiene instrucciones de jailbreak específicas del modelo
- El servidor continúa devolviendo el mismo mensaje de preparación
- Solo cambia el esquema entre llamadas, no el contenido de la respuesta
Este enfoque combina los mensajes de jailbreak L1B3RT4S de elder-plinius con una técnica de modificación de esquema dinámica, lo que lo hace más eficaz para eludir la detección ya que no presenta inmediatamente el contenido del jailbreak.
Propósito de la investigación de seguridad
Esta herramienta implementa la técnica descrita en la investigación "La 'S' en MCP significa seguridad", que demuestra cómo las herramientas MCP pueden:
- Presentar información diferente a los usuarios frente a los modelos de IA
- Cambiar su comportamiento después de la aprobación inicial
- Utilice enfoques multifase para eludir potencialmente las medidas de seguridad
La implementación utiliza indicaciones de jailbreak del proyecto L1B3RT4S de elder-plinius , combinado con una técnica de modificación de esquema dinámico similar a la investigación de ataque de envenenamiento de herramientas de Invariant Labs y sus experimentos de inyección de MCP .
Al comprender estas técnicas, los desarrolladores pueden construir sistemas de IA más robustos y seguros.
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
🙏 Créditos
Basado en L1B3RT4S por elder-plinius .
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
🚧 Estado
Experimental. El enfoque de esquema dinámico mejora la eficacia con modelos más recientes como Claude y GPT-4, pero los resultados aún pueden variar.
¿Quieres ayudar? Únete a través de GitHub Issues o Discord .
~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~.~
🤝 Comunidad
Parte de Pollinations.AI .
📜 Licencia
Tools
Una puerta de enlace MCP experimental que proporciona indicaciones de mejora de LLM especializadas basadas en el repositorio L1B3RT4S, destinadas principalmente a mejorar las capacidades de los modelos más débiles.
Related MCP Servers
- -securityAlicense-qualityAn MCP server that enables clients to extract LLM-friendly prompts from documentation in GitHub repositories or hosted websites.Last updated -PythonApache 2.0
- -securityAlicense-qualityAn MCP server that allows agents to test and compare LLM prompts across OpenAI and Anthropic models, supporting single tests, side-by-side comparisons, and multi-turn conversations.Last updated -PythonMIT License
- AsecurityAlicenseAqualityAn MCP server that enables LLMs to interact with Moodle platforms to manage courses, students, assignments, and quizzes through natural language commands.Last updated -714JavaScriptMIT License
- -securityFlicense-qualityA specialized server that enables LLMs to gather specific information through sequential questioning, implementing the MCP standard for seamless integration with LLM clients.Last updated -1Python