Si estás buscando el servidor MCP: encuéntralo aquí .
Si estás buscando la biblioteca de Python, continúa... ;)
Herramientas del agente de operador suave - Biblioteca de Python
Esta es la implementación oficial de la biblioteca Python para Smooth Operator Agent Tools, un kit de herramientas de última generación para programadores que desarrollan agentes de uso de computadoras en sistemas Windows.
Descripción general
Las herramientas del agente Smooth Operator son un potente conjunto de herramientas que maneja las tareas complejas de interacción con el árbol de automatización de Windows y el control del navegador Playwright, al tiempo que proporciona funciones de inteligencia artificial avanzadas, como la identificación de elementos de la interfaz de usuario a través de capturas de pantalla y descripciones textuales.
Esta biblioteca de Python proporciona un envoltorio conveniente alrededor de la API de Smooth Operator Tools Server, lo que le permite integrar fácilmente estas capacidades en sus aplicaciones de Python.
Todas las funciones se pueden probar y explorar a través de una práctica interfaz de usuario de Windows antes de implementarlas en el código. Pruébelas en la interfaz de usuario de Smooth Operator Tools .
Related MCP server: Playwright Server
Instalación
Prerrequisitos
Google Chrome
La biblioteca Smooth Operator Agent Tools requiere que Google Chrome (o un navegador compatible basado en Chromium) esté instalado en el sistema para que las funciones de automatización del navegador funcionen.
Instalación del servidor
La biblioteca cliente Smooth Operator incluye un componente de servidor que debe instalarse en el directorio de datos de la aplicación. Los archivos de servidor se incluyen con la biblioteca y se extraerán automáticamente al usarla por primera vez.
Ejecución por primera vez
Cuando utilice la biblioteca por primera vez, automáticamente:
Cree el directorio
%APPDATA%\SmoothOperator\AgentToolsServer(o el equivalente en su sistema operativo)Extraiga los archivos del servidor del paquete
Iniciar el proceso del servidor
Tenga en cuenta que para que las funciones de automatización de Chrome funcionen, debe asegurarse de que Node.js y Playwright estén instalados como se describe en la sección Requisitos previos.
Para instaladores de aplicaciones
Si está creando un instalador de aplicaciones que incluya esta biblioteca, debería incluir los pasos para instalar Node.js y Playwright durante el proceso de instalación para una mejor experiencia de usuario. Consulte la sección "Requisitos" para conocer los pasos de instalación necesarios.
Uso
Características
Captura de pantalla y análisis : captura capturas de pantalla y analiza elementos de la interfaz de usuario.
Control del mouse : Operaciones precisas con el mouse mediante coordenadas o detección de elementos impulsada por IA
Entrada de teclado : escriba texto y envíe combinaciones de teclas
Control del navegador Chrome : navegue, interactúe con elementos y ejecute JavaScript
Automatización de Windows : interactúe con aplicaciones de Windows y elementos de la interfaz de usuario
Operaciones del sistema : abrir aplicaciones y administrar el estado del sistema
Documentación
Para obtener documentación detallada de la API, visita:
Guía de uso ejemplos detallados y explicaciones para casos de uso comunes.
Proyecto de ejemplo Descargue, siga las instrucciones paso a paso y tenga su primera automatización funcionando en minutos.
Documentación Documentación detallada de todos los puntos finales de API del servidor que realiza el trabajo internamente.
Licencia
Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.