新聞
模型
產品
keyboard_arrow_down
讀取器
讀取URL或搜索為大模型提供更好的依據。
向量模型
世界一流的多模態多語言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相關性。
深度搜索
搜索、讀取並推理直到找到最佳答案。
更多的
keyboard_arrow_down
分類器
圖片和文本的零樣本和少樣本分類。
切分器
將長文本切分成塊或詞元。

API 文檔
為您的AI 編程助手 IDE 或大模型自動生成代碼
open_in_new


公司
keyboard_arrow_down
關於我們
聯繫銷售
實習生計劃
加入我們
open_in_new
下載Logo
open_in_new
條款及條件


登錄
login
warning
此模型已被較新的模型棄用。

jina-reranker-v1-tiny-en

最快的重排器,適合對大量文檔進行可靠的排序
發行説明arrow_forward
許可證
license
Apache-2.0
發佈日期
calendar_month
2024-04-18
輸入
abc
文本(查詢)
abc
文本(文檔)
arrow_forward
輸出
format_list_numbered
排名
模型詳細信息
參數: 33M
輸入詞元長度: 8K
語言支持
🇺🇸 英語
相關模型
link
jina-reranker-v1-base-en
link
jina-reranker-v1-turbo-en
標籤
reranker
english
long-context
memory-efficient
high-throughput
edge-optimized
bert-based
production-ready
lightweight
fast-inference
可通過以下方式獲取
Jina API亞馬遜雲微軟雲抱抱臉
選擇要比較的模型

概述

Jina Reranker v1 Tiny English 代表了高效搜索優化的突破,專為需要在資源受限環境中進行高性能重排的組織而設計。該模型解決了保持搜索質量的關鍵挑戰,同時顯著降低了計算開銷和部署成本。它僅使用 33M 個參數(典型重排器大小的一小部分),通過創新的知識提煉技術提供了極具競爭力的性能。該模型最令人驚訝的功能是它能夠以比基礎模型快近五倍的速度處理文檔,同時保持 92% 以上的準確率,使企業級搜索優化可供計算資源非常寶貴的應用程序使用。

方法

該模型採用基於 JinaBERT 的精簡四層架構,具有對稱雙向 ALiBi(具有線性偏差的注意力機制),可高效處理長序列。其開發利用了一種先進的知識蒸餾方法,其中更大的高性能教師模型 (jina-reranker-v1-base-en) 指導訓練過程,使較小的模型無需大量現實世界的訓練數據即可學習最佳排名行為。這種創新的訓練方法與減少隱藏層和高效注意力機制等架構優化相結合,使模型能夠保持高質量的排名,同時顯著降低計算要求。結果是模型實現了卓越的效率,同時又不損害其理解複雜文檔關係的能力。

性能

在綜合基準評估中,該模型展現出卓越的能力,挑戰了傳統的大小與性能之間的權衡。在 BEIR 基準測試中,該模型的 NDCG-10 得分為 48.54,保留了基礎模型 92.5% 的性能,而尺寸僅為其四分之一。更令人印象深刻的是,在 LlamaIndex RAG 基準測試中,它保持了 83.16% 的命中率,幾乎與更大的模型相匹配,同時處理文檔的速度明顯更快。該模型在吞吐量方面尤其出色,處理文檔的速度幾乎是基礎模型的五倍,而使用的內存甚至比 turbo 版本還要少 13%。這些指標轉化為實際性能,可與 mxbai-rerank-base-v1(184M 個參數)和 bge-reranker-base(278M 個參數)等更大的模型相媲美或超過它們。

最佳實踐

為了有效部署此模型,組織應優先考慮處理速度和資源效率是關鍵考慮因素的場景。該模型特別適合邊緣計算部署、移動應用程序和對延遲要求嚴格的高吞吐量搜索系統。雖然它在大多數重排任務中表現非常出色,但需要注意的是,對於需要絕對最高排名精度的應用程序,基本模型可能仍然是首選。該模型需要具有 CUDA 功能的 GPU 基礎設施才能獲得最佳性能,但其高效的架構意味着它可以在功能較弱的硬件上有效運行,而其大型同類產品則不然。對於部署,該模型與主要的矢量數據庫和 RAG 框架無縫集成,並且可通過 Reranker API 和 AWS SageMaker 獲得。在針對特定域進行微調時,用户應仔細平衡訓練數據質量和模型的緊湊架構,以保持其性能特徵。
提及此模型的博客
四月 18, 2024 • 7 分鐘的讀取量
更小、更快、更便宜:介紹 Jina Rerankers Turbo 與 Tiny 版本
Jina AI 發布新的重排序模型:Jina Rerankers Turbo(jina-reranker-v1-turbo-en)和 Tiny(jina-reranker-v1-tiny-en),現已在 AWS Sagemaker 和 Hugging Face 上線,提供更快速、記憶體效率更高的高性能重排序功能。
Yuting Zhang
Scott Martens
Four interconnected white wireframe spheres on a deep blue background, symbolizing global networking and technological connec
五月 07, 2024 • 12 分鐘的讀取量
當 AI 製造 AI:合成資料、模型蒸餾與模型崩塌
AI 創造 AI!是世界末日嗎?還是只是另一個讓模型創造價值的工具?讓我們來探討看看!
Scott Martens
Abstract depiction of a brain in purple and pink hues with a fluid, futuristic design against a blue and purple background.
四月 29, 2024 • 7 分鐘的讀取量
Jina Embeddings 和 Reranker 在 Azure 上的應用:可擴展的企業級 AI 解決方案
Jina Embeddings 和 Rerankers 現已在 Azure Marketplace 上架。重視隱私和安全的企業現在可以輕鬆地將 Jina AI 的最先進模型整合到其現有的 Azure 生態系統中。
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
辦公室
location_on
加利福尼亞州桑尼維爾
710 Lakeway Dr, Ste 200, 桑尼維爾, CA 94085, 美國
location_on
德國柏林(總部)
Prinzessinnenstraße 19-20,10969 柏林,德國
location_on
中國北京
中國北京市海淀區西大街48號6號樓5層
location_on
中國深圳
中國深圳市賦安科技大廈4樓402
搜索底座
讀取器
向量模型
重排器
深度搜索
分類器
切分器
API 文檔
獲取 Jina API 密鑰
速率限制
API 狀態
公司
關於我們
聯繫銷售
新聞
實習生計劃
加入我們
open_in_new
下載Logo
open_in_new
條款
安全
條款及條件
隱私
管理 Cookie
email
Jina AI © 2020-2025.