Desaprendizaje lineal: Introducción a los agentes de IA en la empresa



Si has estado siguiendo esta serie, sabes que hemos estado explorando cómo la IA está cambiando el trabajo del conocimiento. Herramientas de productividad para desarrolladores, y ahora Agentes de IA nos están obligando a repensar nuestros patrones lineales de trabajo y actualizar nuestros modelos para la escala. Eso fue teórico; ahora es el momento de ponerse práctico. ¿Cómo comienza a usar agentes de IA dentro de una empresa?
Si has jugado con la función de investigación profunda de ChatGPT, entonces ya has usado un agente de IA. Si bien es posible que no se “sienta” diferente a la interfaz basada en chat a la que está acostumbrado, estos son agentes bajo el capó: recopilan y sintetizan datos, proporcionan resúmenes y, a menudo, hacen recomendaciones.
Del mensaje a la acción
Nuestra interfaz principal, incluso desde la perspectiva de un agente, va a comenzar con un mensaje. Cualquiera que haya trabajado con LLM en una interfaz basada en chat está familiarizado con el flujo: pones cosas, obtienes una salida y luego tomas esa salida y trabajas con ella un poco más. Luego lo estás volviendo a poner para que la IA siga funcionando y así sucesivamente. Ese bucle es lo que un agente (más específicamente, una serie de agentes) está haciendo automáticamente. También hay puntos donde el proceso agentic devuelve flujo a un humano para confirmar o rumbo correcto.
Hay una progresión para el tipo de tareas que los agentes están realizando desde más básicas y menos riesgosas (1) hasta más sofisticadas y cada vez más riesgosas (5):
- Resumiendo
- Interpretación
- Recomendación
- Delegación
- Acción
Confío en que mis herramientas de IA hagan de una a tres muy bien. El cuarto y quinto..., depende. Por ejemplo, me sentiría cómodo con un agente de IA que actuara para aprobar solicitudes de PTO en mi nombre pero no firmara un documento legal vinculante. A medida que experimentamos, mantenemos a un humano al tanto para evaluar, y el curso correcto.
Primeros pasos
Aquí hay algunas cosas que estoy haciendo hoy que absolutamente puedes comenzar a hacer hoy, también:
- Transcripción, resumen y síntesis de reuniones — Pido grabar todas las reuniones y utilizar la transcripción y el resumen de la reunión como base de conocimientos para un mayor refinamiento y síntesis. Contextualmente, los temas principales, asistentes e hilos enmarcan la estructura en la que estoy trabajando. Los meta-datos de las notas, incluyendo el tema, la fecha y los asistentes a la discusión, crean un enlace contextual sobre las dimensiones.
- Investigación de antecedentes asincrónica, sobre la marcha — Reunir un resumen sobre un individuo, empresa o proyecto solía ser una tarea en primer plano, pero ahora, es algo que se puede poner en marcha y ejecutar en segundo plano. El brief se convierte no sólo en un compresor de tiempo para los individuos, sino que también se convierte en parte de los antecedentes, y de la base del conocimiento acumulado.
- Destilación multimodal de ideas : la capacidad de los modelos para interpretar diferentes tipos de entrada es otra capacidad poderosa. La transcripción de voz no es solo para reuniones, es útil en cualquier momento que desee capturar pensamientos pero no tenga teclado manual. En caminatas o paseos, grabo notas de voz de flujo de conciencia sobre un espacio o tema problemático en particular. Las notas manuscritas, post its y sesiones de pizarra se pueden ingerir instantáneamente y agregar al cuerpo de conocimiento en lugar de algo que deba transcribirse y sintetizarse más.
- Toda esta “información de materia prima” puede entonces ser organizada, resumida, utilizada y reutilizada en una miríada de contextos. Organizar notas y temas, buscar señales en el ruido, extraer diferentes hilos y componentes reutilizables del cuerpo de conocimiento —todo esto no solo se acelera— sino que es algo a lo que puedo volver más adelante y retomar donde lo dejé.
Sigues siendo el filtro final
A medida que empieces a delegar tareas como esta, reajuste tus expectativas en lo que respecta a la velocidad. Estás paralelizando tareas, pero cada una se ejecuta de forma asincrónica. Aún obtendrá los beneficios de la compresión de tiempo, pero las tareas individuales tomarán más tiempo que sus patrones de trabajo síncrono anteriores de solicitu/respuesta.
Otra cosa a tener en cuenta: está en ti ser el control final de calidad y precisión. En el caso de usar un agente para la investigación, proporcionará enlaces al material de origen. Cuando lea, no asuma que el sistema es impecable. Juzgue qué tan correcto necesita que sea: si está citando algo como un requisito reglamentario, necesita certeza absoluta. Una forma de verificar es ejecutando una salida de vuelta a través de un modelo y preguntando: “¿Hay alguna cosa aquí que parezca incorrecta o alucinaciones?” A menudo juego modelos unos contra otros, por ejemplo voy a hacer que Claude compruebe el trabajo de los modelos Open AI y viceversa.
Otra cosa importante a abordar es la seguridad. Independientemente de la herramienta o modelo de IA que esté utilizando, asegúrese de que lo está usando de manera segura, lo que significa que ha configurado y optado por no participar en el entrenamiento sobre sus datos (la información que está ingresando). Por lo tanto, está utilizando una versión paga y, si es necesario, ha optado explícitamente por no participar. Ese proceso se ve un poco diferente para cada herramienta: ChatGPT requiere que envíes un correo electrónico para optar por no participar, mientras que Claude no entrena en tus datos, punto. Géminis, necesitas desactivar la actividad de la app.
Herramientas y conectores
Con sus bases de seguridad cubiertas, a continuación piense en herramientas y conectores. En otras palabras, cómo le da acceso a un agente a la información que necesita para hacer su trabajo. Podrías permitir que el agente haga cosas como una búsqueda web o se conecte a SharePoint, GitHub o tu repositorio de código fuente para buscar documentos. Si las políticas empresariales bloquean esas conexiones, es posible que deba cargar documentos directamente en la interfaz de chat.
En la fase de experimentación, todo esto sigue sucediendo a través de la interfaz de chat, pero el objetivo es automatizarlo. El punto de un agente es que sabe cuándo ir conseguir algo específico y traerlo. Si está creando un agente para redactar una respuesta de RFP, debería tener acceso a respuestas anteriores, idealmente en una base de datos rag. Desde una perspectiva de preparación de datos, todo debe ser legible por máquina, lo más cerca posible del texto sin formato.
El Protocolo de Contexto Modelo (MCP) actúa como un traductor entre las API y los agentes, dando a los modelos de lenguaje grandes instrucciones estructuradas sobre cómo interactuar con las herramientas. No solo ayuda a los agentes a obtener información, sino que les permite actuar. Con MCP, los agentes pueden omitir las interfaces de usuario y orquestar directamente las tareas a través de APIs. Esto permite una delegación real: en lugar de hacer clic a través de una interfaz gráfica de usuario (GUI), el agente puede manejar un ticket JIRA, modificar una configuración de Zscaler o consultar un sistema de archivos. La seguridad es clave: utilice únicamente servidores MCP de confianza de proveedores oficiales o versiones de código abierto que pueda inspeccionar. Si se hace bien, MCP optimiza el trabajo en sistemas como JIRA y SharePoint (una vez que los conectores están disponibles), cambiando las tareas de manos humanas a agentes inteligentes con una fricción mínima.
Comience en algún lugar, pero comience ahora
La IA es un gran compresor de tiempo para mí. Además, sigo encontrando que mis mejores cosas vienen de mí y de mi escritura. Constantemente estoy tomando lo que la IA me da, reconfigurándolo, ejecutándolo de nuevo y remodelando más. Casi nunca dejo que la salida de AI sea mi respuesta final. Escribo mis indicaciones en un espacio completamente separado de la interfaz de chat como parte de este proceso. No digo que esta sea la forma correcta de hacerlo, pero es la forma en que lo hago y lo que mejor me funciona.
Para resumir: ya nadie puede permitirse el lujo de sentarse al margen. Este no es el momento de interminables preguntas de “qué pasa” o de debatir si la tecnología es real. Está aquí, es útil, y se mueve rápido. La única pregunta es dónde y cómo vas a empezar a aplicarlo de una manera real y significativa. No hacer nada no es una opción.