Noticias
Modelos
API
keyboard_arrow_down
Lector
Lea las URL y busque en la web para obtener una base más sólida para su LLM.
Incrustaciones
Integraciones multilingües y multimodales de clase mundial.
reclasificador
Recuperador neuronal de clase mundial para maximizar la relevancia de la búsqueda.
Servicio de inferencia elástica
Ejecuta modelos Jina de forma nativa dentro de Elasticsearch.
MCP terminalCLIarticlellms.txtsmart_toyAgentesdata_objectEsquemamenu_bookDocumentos



Acceso
login
Agentes y Protocolo de Contexto del Modelo
Usando el Servidor MCP de Jina AI
Ejemplo 1: Resúmenes diarios de artículos de arXiv
Ejemplo 2: Agente de investigación de mercado
Ejemplo 3: Investigación sobre cumplimiento legal
Enfoques alternativos
Conclusión
Blog de tecnología
agosto 29, 2025

Flujo de trabajo agentic con el servidor MCP remoto de Jina

Jina MCP agiliza el desarrollo de agentes al conectar nuestras API a cualquier LLM, reduciendo el código personalizado y mejorando la fiabilidad del flujo de trabajo.
Alex C-G
Alex C-G • 9 minutos de lectura

En un artículo anterior, les mostramos cómo integrar las API de búsqueda y lectura de Jina AI con DeepSeek R1 para crear un agente de investigación profunda, pero requería una gran cantidad de código personalizado e ingeniería de *prompts* para que funcionara. En este artículo, haremos lo mismo utilizando el Protocolo de Contexto del Modelo (MCP), que utiliza mucho menos código personalizado y es portable a diferentes LLM, pero aún está sujeto a algunas dificultades en el camino.

Para construir nuestro agente, trabajaremos con nuestro servidor MCP recientemente lanzado, que proporciona acceso a las API de Jina Reader, *Embeddings* y *Reranker*, junto con herramientas de URL a Markdown, búsqueda web, búsqueda de imágenes y *embeddings*/*reranker*.

GitHub - jina-ai/MCP: Servidor MCP remoto oficial de Jina AI
Servidor MCP remoto oficial de Jina AI. Contribuye al desarrollo de jina-ai/MCP creando una cuenta en GitHub.
GitHubjina-ai

tagAgentes y Protocolo de Contexto del Modelo

Se ha escrito mucho sobre agentes e IA agentic últimamente, a menudo ya sea exagerándolos (como Gartner, que espera que para 2028 alrededor del 15 por ciento de las decisiones laborales diarias sean tomadas de forma autónoma por agentes de IA) o criticándolos (como Vortex, que afirma que la mayoría de las propuestas de IA agentic carecen de valor significativo o retorno de la inversión).

Pero, ¿qué son siquiera los agentes? Una de las mejores definiciones (de Chip Huyen vía Simon Willison) es:

[Los agentes son] sistemas LLM que planifican un enfoque y luego ejecutan herramientas en un bucle hasta que se alcanza un objetivo

Esa es la definición que utilizaremos para esta publicación de blog. ¿Y esas herramientas que utiliza el agente? Están conectadas con el Protocolo de Contexto del Modelo. Ese protocolo, originalmente desarrollado por Anthropic, se está convirtiendo en la *lingua franca* para conectar los LLM a herramientas y fuentes de datos externas. Esto significa que los agentes pueden encadenar múltiples herramientas en un solo flujo de trabajo. El resultado son agentes que pueden planificar, razonar y actuar orquestando un conjunto de API.

Presentamos el Protocolo de Contexto del Modelo
El Protocolo de Contexto del Modelo (MCP) es un estándar abierto para conectar asistentes de IA a los sistemas donde residen los datos, incluidos los repositorios de contenido, las herramientas empresariales y los entornos de desarrollo. Su objetivo es ayudar a los modelos de vanguardia a producir respuestas mejores y más relevantes.

Por ejemplo, podríamos construir un agente de optimización de precios que recopile los precios de los productos de la competencia para la comparación y la optimización de precios. Luego podríamos equipar al agente con el servidor MCP de Jina AI, un *prompt* y una lista de productos de la competencia, permitiéndole generar un informe procesable con datos extraídos y enlaces a las fuentes. Al usar servidores MCP adicionales, el agente podría exportar ese informe a formato PDF, enviarlo por correo electrónico a las partes interesadas, almacenarlo en una base de conocimiento interna y más.

En este artículo, construiremos tres agentes de ejemplo con nuestro servidor MCP, que proporciona las siguientes herramientas:

  • primer - Obtener información contextual actual para respuestas localizadas y conscientes del tiempo
  • read_url - Extraer contenido limpio y estructurado de páginas web como Markdown a través de la API Reader (también disponible como una versión paralela)
  • capture_screenshot_url - Capturar capturas de pantalla de alta calidad de páginas web a través de la API Reader
  • guess_datetime_url - Analizar páginas web para la última fecha de actualización/publicación con puntajes de confianza
  • search_web - Buscar en toda la web información y noticias actuales a través de la API Reader (también disponible como una versión paralela)
  • search_arxiv - Buscar artículos académicos y preimpresiones en el repositorio arXiv a través de la API Reader (también disponible como una versión paralela)
  • search_images - Buscar imágenes en toda la web (similar a Google Images) a través de la API Reader
  • expand_query - Expandir y reescribir las consultas de búsqueda web basadas en el modelo de expansión de consultas a través de la API Reader
  • sort_by_relevance - Reordenar los documentos por relevancia para una consulta a través de la API Reranker
  • deduplicate_strings - Obtener las cadenas semánticamente únicas top-k a través de la API Embeddings y la optimización submodular
  • deduplicate_images - Obtener las imágenes semánticamente únicas top-k a través de la API Embeddings y la optimización submodular

También necesitaremos un cliente MCP (VS Code con Copilot, ya que es gratuito y ampliamente utilizado), y un LLM (Claude Sonnet 4, ya que dio los mejores resultados en nuestras pruebas).

💡
En adelante, nos referiremos a la combinación de cliente MCP + LLM + servidor(es) MCP como "nuestro agente" en aras de la brevedad.

tagUsando el Servidor MCP de Jina AI

MCP ha sido descrito como un sistema de *plugins* universal, que soporta múltiples programas como Claude Code, VS Code, Google Gemini CLI y los front-ends de escritorio para Claude y ChatGPT. Conectar un servidor MCP es típicamente solo una cuestión de editar su archivo de configuración para incluir lo siguiente:

{
  "mcpServers": {
    "jina-mcp-server": {
      "url": "https://mcp.jina.ai/sse",
      "headers": {
        "Authorization": "Bearer ${JINA_API_KEY}" // optional
      }
    }
  }
}

Para probar que el servidor MCP funciona, usemos un *prompt* simple:

Dame un resumen de la última publicación en jina.ai news en la
forma de una sola estrofa de una canción marinera

Nuestro agente hace lo siguiente:

  • Llama a read_url para extraer https://jina.ai/news
  • Llama a search_web con la consulta "site:jina.ai \\"Optimizing GGUFs for Decoder-Only Embedding Models\\" August 2025"
  • Llama a read_url para extraer la publicación del blog
  • Genera una canción marinera de una estrofa a partir de los datos extraídos:
🎵 *Con la melodía de una canción marinera tradicional* 🎵

**"El cuento del marinero GGUF"**

*¡Oh, navegaron con sus *embeddings*, tres mil millones fuertes y verdaderos,*
*A través de aguas cuantificadas profundas y azules,*
*Con vientos L4 GPU a sus espaldas,*
*¡Cuatro mil *tokens* por segundo en su camino!*
*¡Iza, marineros, despojen la torre de visión,*
*¡Porque las optimizaciones GGUF son los mejores puertos de la ciudad!*
💡
Nuestro agente típicamente produce salidas muy largas. En lugar de incluirlas todas en la publicación, enlazaremos a un *gist* de GitHub para el resto de ellas.

Ahora que hemos visto que funciona en la práctica, pongámoslo realmente a prueba construyendo algunos ejemplos útiles del mundo real.

tagEjemplo 1: Resúmenes diarios de artículos de arXiv

Leer los últimos artículos académicos es parte de nuestro trabajo en Jina AI. Pero filtrar los que son realmente relevantes y extraer la información más importante de cada uno puede ser una verdadera tarea. Entonces, para nuestro primer experimento, automatizamos esa tarea creando un resumen diario de los artículos recientes más relevantes. Aquí está el *prompt* que usamos:

Usando solo las herramientas de Jina, extrae de arxiv los artículos sobre
LLM, *reranking* y *embeddings* publicados en las últimas 24
horas, luego desduplica y reordena por relevancia, mostrando
los 10 principales. Para cada uno, extrae el PDF y extrae el
abstract. Luego resúmelo y organiza la información que
recopilaste en una "actualización diaria". Incluye un enlace y fecha de publicación
para cada artículo.
💡
Especificamos "Usar solo herramientas de Jina" ya que VS Code tiene su propia funcionalidad de búsqueda y extracción incorporada. Esta frase podría omitirse en modelos que carecen de esa funcionalidad.

Nuestro agente:

  • Busca artículos relevantes en arxiv.org (usando la herramienta parallel_search_arxiv) con las cadenas de consulta large language models LLM, reranking information retrieval, embeddings vector representations, transformer neural networks y natural language processing NLP
  • Elimina duplicados (usando la herramienta deduplicate_strings)
  • Reordena los resultados (usando la herramienta sort_by_relevance), mostrando solo los diez resultados más relevantes.
  • Recupera las URLs a los PDFs para los resultados reordenados (usando parallel_read_url), divididos en dos lotes de cinco.
  • Lee cada URL (usando la herramienta read_url, llamada diez veces)
  • Genera un informe detallado, que incluye resúmenes, tendencias e ideas, implicaciones para la investigación futura, lagunas en la investigación y conclusiones.
Actualización diaria de Arxiv, generada con las herramientas del servidor MCP de Jina
Arxiv Daily Update, generado con las herramientas del servidor Jina MCP - arxiv_daily_update.md
Gist262588213843476

Ocasionalmente, nos encontramos con el problema de que el agente no limitaba sus resultados a las últimas 24 horas. Al indicarle una vez más que siguiera esa instrucción, se obtuvo el informe anterior.

tagEjemplo 2: Agente de investigación de mercado

Para nuestro próximo experimento, haremos que nuestro agente escriba un informe de inteligencia competitiva sobre una destacada empresa de videojuegos (nombre redactado). Aquí está nuestro Prompt:

Cree un informe exhaustivo de inteligencia competitiva para
$GAME_COMPANY centrándose en sus actividades recientes en juegos
indie retro. Utilice las herramientas de Jina para buscar las últimas noticias,
comunicados de prensa y anuncios, y luego extraiga contenido limpio
de sus comunicaciones oficiales. Clasifique todos los hallazgos por
relevancia comercial y elimine cualquier información duplicada.
Presente información sobre su dirección estratégica, producto
lanzamientos y cambios en el posicionamiento en el mercado durante el último
trimestre

Nuestro agente:

  • Ejecuta varios bucles de search_web y read_url para recopilar investigación.
  • Reclasifica sus hallazgos utilizando sort_by_relevance, mostrando los diez mejores resultados.
  • Genera un informe de inteligencia de mercado, que incluye un resumen ejecutivo, desarrollos comerciales críticos (clasificados por importancia estratégica), análisis de decisiones estratégicas y muchas otras secciones.
Informe de inteligencia competitiva de GAME_COMPANY: Juegos indie retro (T3 2025)
Informe de inteligencia competitiva de GAME_COMPANY: Juegos indie retro (T3 2025) - game_company_intelligence_report.md
Gist262588213843476

tagEjemplo 3: Investigación sobre cumplimiento legal

Como dijimos anteriormente, uno de los aspectos útiles de MCP es que podemos usar varios servidores para obtener resultados más complejos. En este caso, estamos usando el Servidor MCP de lector de PDF además del nuestro para crear un informe de investigación sobre el estado actual del cumplimiento legal de la IA en la UE y los EE. UU. Utilizamos el Prompt:

Desarrolle una sección de base de conocimientos centrada en las noticias
sobre cumplimiento legal de la IA y los errores comunes en la UE y los EE. UU.
en este momento. El informe debe estar dirigido a las empresas emergentes de IA en la UE.
Aplique ampliamente las herramientas Jina MCP: realice búsquedas web
paralelas y lecturas de URL para extraer de manera eficiente contenido
detallado, elimine las superposiciones semánticas y vuelva a clasificar para resaltar
la información más autorizada. Cite todas las fuentes con
URL y fechas de publicación o actualización. Organice el contenido
claramente y produzca un documento PDF formateado listo para
su uso inmediato.

Nuestro agente:

  • Realiza una operación de búsqueda paralela de información general (utilizando parallel_search) con las consultas EU AI Act 2024 compliance requirements startups legal obligations August 2025, USA AI regulation Biden executive order compliance requirements 2024 2025, AI startup legal pitfalls Europe GDPR data protection compliance 2025, AI liability insurance compliance requirements EU USA startups 2024 2025 y AI ethics governance framework startups EU USA regulatory updates 2025, devolviendo 25 resultados para cada consulta.
  • Elimina las URL duplicadas (utilizando deduplicate_strings)
  • Lee el contenido de cuatro URL (utilizando parallel_read_url)
  • Realiza una parallel_search adicional para obtener información más específica, con las consultas AI startup common compliance pitfalls mistakes EU USA 2025, AI liability insurance cybersecurity startup requirements 2025, AI bias discrimination testing requirements EU AI Act compliance startups, AI data protection GDPR violations penalties startups 2025
  • Utiliza parallel_read_url para leer otras cuatro URL
  • Genera un informe en formato Markdown y lo convierte en un PDF de 18 páginas
Informe de cumplimiento legal de IA - Demostración de Jina MCP
Informe de cumplimiento legal de IA - Demostración de Jina MCP. GitHub Gist: comparte instantáneamente código, notas y fragmentos.
Gist262588213843476

También tuvimos que solicitar un poco más para mejorar los metadatos y el formato del PDF, así como para que fuera más un informe que una lista con viñetas muy larga, pero eso es algo que integraríamos en el Prompt para futuros informes.

tagEnfoques alternativos

Antes de optar por Claude Sonnet 4, probamos una variedad de modelos de Ollama que admitían herramientas, incluidos Qwen3:30b, Qwen2.5:7b y llama3.3:70b. Para el cliente MCP, inicialmente usamos ollmcp antes de pasar a VS Code. Todos los modelos anteriores fallaron de la misma manera, sin importar cuán explícitamente los solicitamos con las herramientas y cómo usarlas: cuando se les pedía que realizaran incluso una tarea simple, como recuperar la última publicación de blog de Jina AI, cada modelo (sin importar el tamaño o el proveedor) consistentemente:

  • Entraba en un bucle de razonamiento extenso, constantemente dudando de sí mismos (y consumiendo Tokens) hasta que finalmente resolvían simplemente hacer lo que se les decía
  • Llamaba a read_url para https://jina.ai/news
  • Inspeccionaba los títulos y extractos de las publicaciones de blog
  • Alucinaba por completo que habían extraído la última publicación (sin siquiera llamar a read_url para esa página)
  • Presentaba un resumen basado en el extracto del resultado de búsqueda superior (no el contenido real de la página)
  • Cuando se les interrogaba, afirmaba que habían seguido las instrucciones exactamente y habían extraído la página según lo solicitado

Los modelos de las familias Claude, GPT y Gemini proporcionaron una salida aceptable, aunque rápidamente nos decidimos por Claude Sonnet 4, ya que hacía un uso extensivo de las herramientas (a menudo recurriendo a opciones de herramientas paralelas en lugar del enfoque en serie favorecido por GPT-4.1) y generaba una salida más larga y mejor estructurada.

tagConclusión

Todavía hay mucha imprecisión en torno al término "IA agentic", pero MCP representa un paso hacia la conversión en algo sólido y práctico. En nuestra experiencia, los agentes no están del todo listos para el horario estelar todavía, siendo el LLM generalmente el eslabón débil, pero con un poco de ayuda y experimentación, es posible obtener buenos resultados. Dicho esto, cuando obtienes la combinación correcta de Prompt, LLM y servidores MCP, puedes ver a los agentes ejecutar de manera confiable tareas de varios pasos sin necesidad de código personalizado, algo que era mucho más difícil con modelos anteriores como DeepSeek (que no admiten herramientas), lo que requería más ingeniería manual y daba como resultado una integración frágil.

A pesar de estas limitaciones actuales, la trayectoria es prometedora. El ecosistema MCP está creciendo rápidamente, trayendo más integraciones y herramientas que facilitan la combinación de API, como las de Jina, o el intercambio de nuevos LLM a medida que estén disponibles. A medida que mejoran los modelos subyacentes y madura el ecosistema de herramientas, la brecha entre los agentes experimentales y la IA agentic lista para la producción continúa reduciéndose, lo que hace que las implementaciones sólidas sean cada vez más accesibles para aplicaciones del mundo real.

Categorías:
Blog de tecnología
rss_feed

Leer más
marzo 11, 2026 • 7 minutos de lectura
Generación de embeddings de audio a partir de LLM multimodales
Han Xiao
Abstract illustration of a sound wave or heartbeat, formed by blue, orange, and gray dots on a white background.
marzo 06, 2026 • 6 minutos de lectura
Identificación de modelos de embeddings a partir de valores numéricos brutos
Han Xiao
Fingerprint illustration made from numbers, showcasing digital and high-tech design on a light background.
septiembre 09, 2025 • 11 minutos de lectura
Vectores multimodales en Llama.cpp y GGUF
Andrei Ungureanu
Alex C-G
Cartoon llama in the center of a white background, emitting laser-like beams from its eyes. The illustration creates a playfu
Fundación de búsqueda
Lector
Incrustaciones
reclasificador
Servicio de inferencia elástica
open_in_new
Obtener la clave API de Jina
Límite de velocidad
Estado de la API
Compañía
Sobre nosotros
Sala de prensa
Descargar el logotipo de Jina
open_in_new
Descargar el logotipo de Elastic
open_in_new
Términos
Seguridad
Términos y condiciones
Privacidad
Administrar cookies
Elástico © 2020-2026.