使用 Jina Remote MCP 伺服器的 Agentic Workflow

在先前的文章中，我們向您展示了如何整合 Jina AI 的搜尋和閱讀器 API 與 DeepSeek R1，以建立深度研究代理，但這需要大量的自訂程式碼和提示詞工程才能使其運作。在這篇文章中，我們將使用模型上下文協定 (MCP) 做同樣的事情，這減少了許多自訂程式碼，並且可以移植到不同的大模型，但仍然會遇到一些問題。

為了建立我們的代理，我們將使用最近發布的MCP 伺服器，該伺服器提供對 Jina Reader、向量模型和重排器 API 以及 URL 轉 Markdown、網路搜尋、圖片搜尋和向量模型／重排器工具的存取。

tag代理和模型上下文協定

最近關於代理和代理式 AI 的數位墨水 많이 쏟아졌다，通常是過度炒作它們（如 Gartner，他們預計到 2028 年左右，將有15% 的日常工作決策將由 AI 代理自主做出），或貶低它們（如 Vortex 聲稱大多數代理式 AI 主張缺乏顯著的價值或投資回報）。

但代理究竟是什麼？一個較好的定義（來自 Chip Huyen 透過 Simon Willison）是：

[代理是] 大模型系統，它規劃一個方法，然後在迴圈中執行工具，直到達成目標

這就是我們在這篇部落格文章中使用的定義。而代理使用的那些工具呢？它們透過模型上下文協定連接。該協定最初由 Anthropic 開發，正成為將大模型連接到外部工具和資料來源的通用語言。這意味著代理可以在單一工作流程中鏈接多個工具。結果是代理可以透過協調一套 API 來規劃、推理和行動。

例如，我們可以建立一個價格優化代理，收集競爭對手的產品定價以進行比較和價格優化。然後，我們可以為代理配備 Jina AI 的 MCP 伺服器、提示詞和競爭對手產品列表，讓它生成一份可操作的報告，其中包含抓取的資料和來源連結。透過使用額外的 MCP 伺服器，代理可以將該報告匯出為 PDF 格式、透過電子郵件發送給利害關係人、將其儲存在內部知識庫中，以及更多。

在這篇文章中，我們將使用我們的 MCP 伺服器建立三個範例代理，該伺服器提供以下工具：

primer - 取得本地化、時間感知回應的當前上下文資訊
read_url - 透過 Reader API 從網頁中提取乾淨、結構化的內容作為 Markdown（也提供平行版本）
capture_screenshot_url - 透過 Reader API 擷取網頁的高品質螢幕截圖
guess_datetime_url - 分析網頁以取得上次更新／發布日期時間，並具有信賴度分數
search_web - 透過 Reader API 搜尋整個網路以取得當前資訊和新聞（也提供平行版本）
search_arxiv - 透過 Reader API 在 arXiv 儲存庫上搜尋學術論文和預印本（也提供平行版本）
search_images - 搜尋整個網路上的圖片（類似於 Google 圖片）透過 Reader API
expand_query - 透過 Reader API 基於查詢擴展模型擴展和重寫網路搜尋查詢
sort_by_relevance - 透過重排器 API 依據與查詢的相關性對文件進行重排
deduplicate_strings - 透過向量模型 API 和次模組優化取得前 k 個語義上唯一的字串
deduplicate_images - 透過向量模型 API 和次模組優化取得前 k 個語義上唯一的圖片

我們還需要一個 MCP 用戶端（VS Code 搭配 Copilot，因為它是免費且廣泛使用的），以及一個大模型（Claude Sonnet 4，因為它在我們的測試中給出了最佳結果）。

💡

為了簡潔起見，接下來我們將 MCP 用戶端 + 大模型 + MCP 伺服器的組合稱為「我們的代理」。

tag使用 Jina AI MCP 伺服器

MCP 已被描述為一個通用外掛系統，支援多個程式，如 Claude Code、VS Code、Google Gemini CLI 以及 Claude 和 ChatGPT 的桌面前端。連接 MCP 伺服器通常只需要編輯您的設定檔，以包含以下內容：

{
  "mcpServers": {
    "jina-mcp-server": {
      "url": "https://mcp.jina.ai/sse",
      "headers": {
        "Authorization": "Bearer ${JINA_API_KEY}" // optional
      }
    }
  }
}

為了測試 MCP 伺服器是否運作，讓我們使用一個簡單的提示詞：

Give me a summary of the latest post on jina.ai news in the
form of a single verse sea shanty

我們的代理執行以下操作：

呼叫 read_url 以抓取 https://jina.ai/news
使用查詢 "site:jina.ai \\"Optimizing GGUFs for Decoder-Only Embedding Models\\" August 2025" 呼叫 search_web
呼叫 read_url 以抓取部落格文章
從抓取的資料生成一節海歌：

🎵 *To the tune of a traditional sea shanty* 🎵

**"The GGUF Sailor's Tale"**

*Oh, they sailed with their embeddings, three billion strong and true,*  
*Through quantized waters deep and blue,*  
*With L4 GPU winds at their back,*  
*Four thousand tokens per second on their track!*  
*Heave away, me hearties, strip the vision tower down,*  
*For GGUF optimizations are the finest ports in town!*

💡

我們的代理通常會產生非常長的輸出。我們不會將它們全部包含在文章中，而是會連結到 GitHub gist 以取得其餘的內容。

現在我們已經在實踐中看到了它的運作方式，讓我們透過建立一些有用的真實世界範例來真正地測試它。

tag範例 1：每日 arXiv 論文摘要

閱讀最新的學術論文是我們在 Jina AI 的工作的一部分。但是，篩選出真正相關的論文並從每篇論文中提取最重要的資訊可能是一件非常繁瑣的事情。因此，對於我們的第一個實驗，我們透過建立一份每日摘要來自動化該任務，其中包含最近發布的最相關論文。以下是我們使用的提示詞：

Using only Jina tools, scrape arxiv for the papers about
LLMs, reranking, and embeddings published in the past 24
hours, then deduplicate and rerank for relevance, outputting
the top 10. For each one, scrape the PDF and extract the
abstract. Then summarize it and organize the information you
gathered into a "daily update". Include a link and publication
date for each paper.

💡

我們指定「僅使用 Jina 工具」，因為 VS Code 內建了自己的搜尋和抓取功能。在缺乏該功能的模型上可以省略此措辭。

我們的代理：

搜尋相關的 arxiv.org 論文（使用 parallel_search_arxiv 工具），查詢字串為 large language models LLM、reranking information retrieval、embeddings vector representations、transformer neural networks 和 natural language processing NLP
刪除重複項（使用 deduplicate_strings 工具）
重新排列結果（使用 sort_by_relevance 工具），僅輸出十個最相關的結果。
檢索重新排列的結果的 PDF 的 URL（使用 parallel_read_url），分為兩批，每批五個。
讀取每個 URL（使用 read_url 工具，呼叫十次）
生成一份詳細的報告，包括摘要、總結、趨勢和見解、對未來研究的影響、研究差距和結論。

我們偶爾會遇到代理程式沒有將結果限制在過去 24 小時內的問題。再次**提示詞**它遵循該指示，就會產生上述報告。

tag範例 2：市場研究代理程式

在下一個實驗中，我們將讓我們的代理程式撰寫一份關於一家知名電玩遊戲公司（名稱已刪除）的競爭情報報告。以下是我們的**提示詞**：

Create a comprehensive competitive intelligence report for
$GAME_COMPANY focusing on their recent activities in retro
indie games. Use Jina tools to search for the latest news,
press releases, and announcements, then extract clean content
from their official communications. Rank all findings by
business relevance and remove any duplicate information.
Present insights on their strategic direction, product
launches, and market positioning changes over the past
quarter

我們的代理程式：

執行數個 search_web 和 read_url 迴圈來收集研究資料。
使用 sort_by_relevance **重排器**對其發現進行排序，輸出前十名的結果。
產生一份市場情報報告，包括執行摘要、關鍵業務發展（按策略重要性排序）、策略決策分析和許多其他章節。

tag範例 3：法規遵循研究

正如我們前面所說的，MCP 的一個有用之處在於，我們可以使用多個伺服器來獲得更複雜的輸出。在這種情況下，除了我們自己的伺服器之外，我們還使用PDF Reader MCP 伺服器來創建一份關於歐盟和美國人工智慧法規遵循現狀的研究報告。我們使用了以下**提示詞**：

Develop a knowledge base section focused on AI legal
compliance news and common pitfalls in the EU and USA as of
this moment. Report should be aimed at AI startups in EU.
Apply Jina MCP tools extensively: perform parallel web
searches and URL reads to efficiently extract detailed
content, deduplicate semantic overlaps, and rerank to surface
the most authoritative information. Cite all sources with
URLs and publication or update dates. Organize content
clearly and produce a formatted PDF document ready for
immediate use.

我們的代理程式：

使用查詢 EU AI Act 2024 compliance requirements startups legal obligations August 2025、USA AI regulation Biden executive order compliance requirements 2024 2025、AI startup legal pitfalls Europe GDPR data protection compliance 2025、AI liability insurance compliance requirements EU USA startups 2024 2025 和 AI ethics governance framework startups EU USA regulatory updates 2025，對一般資訊執行平行搜尋操作（使用 parallel_search），每個查詢返回 25 個結果。
對返回的 URL 進行重複資料刪除（使用 deduplicate_strings）
讀取四個 URL 的內容（使用 parallel_read_url）
使用查詢 AI startup common compliance pitfalls mistakes EU USA 2025、AI liability insurance cybersecurity startup requirements 2025、AI bias discrimination testing requirements EU AI Act compliance startups、AI data protection GDPR violations penalties startups 2025，執行進一步的 parallel_search 以獲取更具體的資訊
使用 parallel_read_url 讀取另外四個 URL
以 Markdown 格式產生一份報告，並將其轉換為 18 頁的 PDF

我們還必須做一些額外的**提示詞**來改進 PDF 元資料和格式，並使其更像一份報告，而不是一個很長的項目符號清單，但這是我們將整合到未來報告的**提示詞**中。

tag替代方法

在使用 Claude Sonnet 4 之前，我們嘗試了一系列支援工具的 Ollama 模型，包括 Qwen3:30b、Qwen2.5:7b 和 llama3.3:70b。對於 MCP 客戶端，我們最初使用 ollmcp，然後跳到 VS Code。無論我們如何明確地**提示詞**它們使用這些工具以及如何使用它們，上述所有模型都以相同的方式失敗：當被要求執行甚至一項簡單的任務（例如從 Jina AI 檢索最新的部落格文章）時，每個模型（無論大小或供應商）都會始終：

進入一個冗長的推理迴圈，不斷地自我懷疑（並耗盡**詞元**），直到它們最終決定按照指示去做
呼叫 https://jina.ai/news 的 read_url
檢查部落格文章的標題和摘要
完全虛構它們抓取了最新的文章（甚至沒有呼叫該頁面的 read_url）
根據頂部搜尋結果的摘要呈現摘要（而不是實際頁面內容）
當受到質疑時，聲稱它們完全按照指示進行操作並抓取了所請求的頁面

Claude、GPT 和 Gemini 系列中的模型提供了可接受的輸出，但我們很快就選擇了 Claude Sonnet 4，因為它廣泛使用了工具（通常會使用平行工具選項，而不是 GPT-4.1 偏愛的序列方法），並產生了更長、結構更好的輸出。

tag結論

關於「代理式人工智慧」這個術語仍然有很多模糊之處，但 MCP 代表了使其變得具體和實用的一步。根據我們的經驗，代理程式還沒有完全準備好迎接黃金時段，通常 **大模型** 是薄弱環節，但通過一些幫助和實驗，可以獲得良好的結果。也就是說，當您確實獲得了正確的**提示詞**、**大模型**和 MCP 伺服器組合時，您可以看到代理程式可靠地執行多步驟任務，而無需自定義程式碼——這對於以前的模型（例如不支援工具的 DeepSeek）來說要困難得多，這些模型需要更多手動工程，並導致脆弱的整合。

儘管存在這些當前的限制，但發展軌跡是很有希望的。MCP 生態系統正在快速增長，帶來了更多的整合和工具，使其更容易混合和匹配 API（例如 Jina 的 API），或者在新的**大模型**可用時替換它們。隨著底層模型的改進和工具生態系統的成熟，實驗性代理程式和可投入生產的代理式人工智慧之間的差距繼續縮小，使穩健的實現在實際應用中越來越容易實現。