新闻
模型
产品
keyboard_arrow_down
读取器
读取URL或搜索为大模型提供更好的依据。
向量模型
世界一流的多模态多语言向量模型。
重排器
世界一流的重排器,最大限度地提高搜索相关性。
深度搜索
搜索、读取并推理直到找到最佳答案。
更多的
keyboard_arrow_down
分类器
图片和文本的零样本和少样本分类。
切分器
将长文本切分成块或词元。

API 文档
为您的AI 编程助手 IDE 或大模型自动生成代码
open_in_new


公司
keyboard_arrow_down
关于我们
联系销售
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款及条件


登录
login
warning
此模型已被较新的模型弃用。

jina-reranker-v1-tiny-en

最快的重排器,适合对大量文档进行可靠的排序
发行说明arrow_forward
许可证
license
Apache-2.0
发布日期
calendar_month
2024-04-18
输入
abc
文本(查询)
abc
文本(文档)
arrow_forward
输出
format_list_numbered
排名
模型详细信息
参数: 33M
输入词元长度: 8K
语言支持
🇺🇸 英语
相关模型
link
jina-reranker-v1-base-en
link
jina-reranker-v1-turbo-en
标签
reranker
english
long-context
memory-efficient
high-throughput
edge-optimized
bert-based
production-ready
lightweight
fast-inference
可通过以下方式获取
Jina API亚马逊云微软云抱抱脸
选择要比较的模型

概述

Jina Reranker v1 Tiny English 代表了高效搜索优化的突破,专为需要在资源受限环境中进行高性能重排的组织而设计。该模型解决了保持搜索质量的关键挑战,同时显著降低了计算开销和部署成本。它仅使用 33M 个参数(典型重排器大小的一小部分),通过创新的知识提炼技术提供了极具竞争力的性能。该模型最令人惊讶的功能是它能够以比基础模型快近五倍的速度处理文档,同时保持 92% 以上的准确率,使企业级搜索优化可供计算资源非常宝贵的应用程序使用。

方法

该模型采用基于 JinaBERT 的精简四层架构,具有对称双向 ALiBi(具有线性偏差的注意力机制),可高效处理长序列。其开发利用了一种先进的知识蒸馏方法,其中更大的高性能教师模型 (jina-reranker-v1-base-en) 指导训练过程,使较小的模型无需大量现实世界的训练数据即可学习最佳排名行为。这种创新的训练方法与减少隐藏层和高效注意力机制等架构优化相结合,使模型能够保持高质量的排名,同时显著降低计算要求。结果是模型实现了卓越的效率,同时又不损害其理解复杂文档关系的能力。

性能

在综合基准评估中,该模型展现出卓越的能力,挑战了传统的大小与性能之间的权衡。在 BEIR 基准测试中,该模型的 NDCG-10 得分为 48.54,保留了基础模型 92.5% 的性能,而尺寸仅为其四分之一。更令人印象深刻的是,在 LlamaIndex RAG 基准测试中,它保持了 83.16% 的命中率,几乎与更大的模型相匹配,同时处理文档的速度明显更快。该模型在吞吐量方面尤其出色,处理文档的速度几乎是基础模型的五倍,而使用的内存甚至比 turbo 版本还要少 13%。这些指标转化为实际性能,可与 mxbai-rerank-base-v1(184M 个参数)和 bge-reranker-base(278M 个参数)等更大的模型相媲美或超过它们。

最佳实践

为了有效部署此模型,组织应优先考虑处理速度和资源效率是关键考虑因素的场景。该模型特别适合边缘计算部署、移动应用程序和对延迟要求严格的高吞吐量搜索系统。虽然它在大多数重排任务中表现非常出色,但需要注意的是,对于需要绝对最高排名精度的应用程序,基本模型可能仍然是首选。该模型需要具有 CUDA 功能的 GPU 基础设施才能获得最佳性能,但其高效的架构意味着它可以在功能较弱的硬件上有效运行,而其大型同类产品则不然。对于部署,该模型与主要的矢量数据库和 RAG 框架无缝集成,并且可通过 Reranker API 和 AWS SageMaker 获得。在针对特定域进行微调时,用户应仔细平衡训练数据质量和模型的紧凑架构,以保持其性能特征。
提及此模型的博客
四月 18, 2024 • 7 分钟的读取量
更小、更快、更便宜:介绍 Jina Rerankers Turbo 和 Tiny 版本
Jina AI 推出新的重排序模型:Jina Rerankers Turbo(jina-reranker-v1-turbo-en)和 Tiny(jina-reranker-v1-tiny-en),现已在 AWS Sagemaker 和 Hugging Face 上线,提供更快速、内存高效的高性能重排序功能。
Yuting Zhang
Scott Martens
Four interconnected white wireframe spheres on a deep blue background, symbolizing global networking and technological connec
五月 07, 2024 • 12 分钟的读取量
当 AI 创造 AI:合成数据、模型蒸馏与模型崩塌
AI 创造 AI!这是世界末日的来临吗?还是仅仅是另一种让模型创造价值的工具?让我们一起来探索!
Scott Martens
Abstract depiction of a brain in purple and pink hues with a fluid, futuristic design against a blue and purple background.
四月 29, 2024 • 7 分钟的读取量
Jina Embeddings 和 Reranker 在 Azure 上:可扩展的企业级 AI 解决方案
Jina Embeddings 和 Rerankers 现已在 Azure Marketplace 上线。重视隐私和安全的企业现在可以在其现有的 Azure 生态系统中轻松集成 Jina AI 的最先进模型。
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
办公室
location_on
加利福尼亚州桑尼维尔
710 Lakeway Dr, Ste 200, 桑尼维尔, CA 94085, 美国
location_on
德国柏林(总部)
Prinzessinnenstraße 19-20,10969 柏林,德国
location_on
中国北京
中国北京市海淀区西大街48号6号楼5层
location_on
中国深圳
中国深圳市赋安科技大厦4楼402
搜索底座
读取器
向量模型
重排器
深度搜索
分类器
切分器
API 文档
获取 Jina API 密钥
速率限制
API 状态
公司
关于我们
联系销售
新闻
实习生计划
加入我们
open_in_new
下载Logo
open_in_new
条款
安全
条款及条件
隐私
管理 Cookie
email
Jina AI © 2020-2025.