Pressemitteilungen
Modelle
Produkte
keyboard_arrow_down
Leser
Lesen Sie URLs und suchen Sie im Internet nach fundierteren LLMs.
Einbettungen
Multimodale und mehrsprachige Einbettungen von Weltklasse.
Reranker
Neural Retriever der Weltklasse zur Maximierung der Suchrelevanz.
DeepSearch
Suchen, lesen und überlegen, bis die beste Antwort gefunden ist.
Mehr
keyboard_arrow_down
Klassifikator
Zero-Shot- und Few-Shot-Klassifizierung für Bild und Text.
Segmentierer
Schneiden Sie langen Text in Abschnitte und führen Sie eine Tokenisierung durch.

MCP-Server
Fügen Sie mcp.jina.ai als Ihren MCP-Server hinzu, um in LLMs auf unsere API zuzugreifen
open_in_new
API-Dokumente
Automatische Codegenerierung für Ihre Copilot-IDE oder LLM
open_in_new


Unternehmen
keyboard_arrow_down
Über uns
Kontaktieren Sie unseren Vertrieb
Praktikantenprogramm
Begleiten Sie uns
open_in_new
Logo herunterladen
open_in_new
Terms & amp; Bedingungen


Einloggen
login
warning
Dieses Modell wird durch neuere Modelle ersetzt.

jina-reranker-v1-base-en

Unser erstes Reranker-Modell maximiert die Such- und RAG-Relevanz
Beitrag veröffentlichenarrow_forward
Lizenz
license
Apache-2.0
Veröffentlichungsdatum
calendar_month
2024-02-29
Eingang
abc
Text (Abfrage)
abc
Text (Dokument)
arrow_forward
Ausgabe
format_list_numbered
Ranglisten
Modelldetails
Parameter: 137M
Länge des Eingabetokens: 8K
Sprachunterstützung
🇺🇸 Englisch
Ähnliche Modelle
link
jina-reranker-v1-turbo-en
link
jina-reranker-v1-tiny-en
Schlagwörter
reranker
english
base-model
high-precision
long-context
search-refinement
document-ranking
Erhältlich über
Jina-APIAWS SageMakerMicrosoft AzureUmarmendes Gesicht
Wählen Sie Modelle zum Vergleichen aus

Überblick

Jina Reranker v1 Base English revolutioniert die Verfeinerung von Suchergebnissen, indem es eine kritische Einschränkung herkömmlicher Vektorsuchsysteme behebt: die Unfähigkeit, nuancierte Beziehungen zwischen Abfragen und Dokumenten zu erfassen. Während die Vektorsuche mit Kosinusähnlichkeit schnelle erste Ergebnisse liefert, übersieht sie häufig subtile Relevanzsignale, die menschliche Benutzer intuitiv verstehen. Dieser Reranker schließt diese Lücke, indem er eine anspruchsvolle Analyse auf Token-Ebene sowohl von Abfragen als auch von Dokumenten durchführt und so eine bemerkenswerte Verbesserung der Suchgenauigkeit um 20 % erzielt. Für Organisationen, die mit der Suchgenauigkeit zu kämpfen haben oder RAG-Systeme implementieren, bietet dieses Modell eine leistungsstarke Lösung, die die Ergebnisqualität erheblich verbessert, ohne dass eine vollständige Überholung der vorhandenen Suchinfrastruktur erforderlich ist.

Methoden

Das Modell verwendet eine BERT-basierte Cross-Attention-Architektur, die sich grundlegend von traditionellen, auf Einbettung basierenden Ansätzen unterscheidet. Anstatt vorab berechnete Dokument-Einbettungen zu vergleichen, führt es dynamische Interaktionen auf Token-Ebene zwischen Abfragen und Dokumenten durch, wodurch es kontextuelle Nuancen erfassen kann, die einfache Ähnlichkeitsmetriken übersehen. Die 137 Millionen Parameter der Architektur sind sorgfältig strukturiert, um ein tiefes semantisches Verständnis zu ermöglichen und gleichzeitig die Rechenleistung aufrechtzuerhalten. Eine herausragende Innovation ist die Fähigkeit, Sequenzen mit bis zu 262.144 Token zu verarbeiten – weit über die typischen Modellbeschränkungen hinaus –, was durch ausgefeilte Optimierungstechniken erreicht wird, die trotz des vergrößerten Kontextfensters schnelle Inferenzgeschwindigkeiten aufrechterhalten.

Leistung

In umfassenden Benchmarks zeigt das Modell außergewöhnliche Verbesserungen in allen wichtigen Kennzahlen und erreicht eine 8 % höhere Trefferquote und eine 33 % höhere mittlere reziproke Rangfolge im Vergleich zur Basisvektorsuche. Im BEIR-Benchmark erreicht es einen Durchschnittswert von 0,5588 und übertrifft damit andere Reranker von BGE (0,5032), BCE (0,4969) und Cohere (0,5141). Besonders beeindruckend ist seine Leistung im LoCo-Benchmark, wo es im Durchschnitt 0,873 Punkte erreicht und damit die Konkurrenz beim Verständnis lokaler Kohärenz und kontextabhängiger Rangfolge deutlich übertrifft. Das Modell zeigt besondere Stärken bei der Bewertung technischer Inhalte und erreicht Werte von 0,996 bei qasper_abstract-Aufgaben und 0,962 bei der Analyse von Regierungsberichten, zeigt jedoch eine relativ geringere Leistung (0,466) bei Aufgaben zur Besprechungszusammenfassung.

Anleitung

Das Modell erfordert CUDA-fähige Hardware für optimale Leistung und ist sowohl über API-Endpunkte als auch über AWS SageMaker-Bereitstellungsoptionen zugänglich. Obwohl es extrem lange Sequenzen verarbeiten kann, sollten Benutzer den Kompromiss zwischen Kontextlänge und Verarbeitungszeit berücksichtigen – die Latenz des Modells erhöht sich bei längeren Dokumenten erheblich, von 156 ms für 256 Token auf 7068 ms für 4096 Token bei einer 512-Token-Abfrage. Für Produktionsbereitstellungen wird empfohlen, eine zweistufige Pipeline zu implementieren, bei der die Vektorsuche erste Kandidaten für die Neubewertung liefert. Das Modell ist speziell für englische Inhalte optimiert und funktioniert bei mehrsprachigen oder codelastigen Dokumenten möglicherweise nicht optimal. Bei der Integration mit RAG-Systemen sollten Benutzer die Anzahl der zur Neubewertung gesendeten Dokumente basierend auf ihren Latenzanforderungen sorgfältig anpassen, wobei 100–200 Dokumente normalerweise ein gutes Gleichgewicht zwischen Qualität und Leistung bieten.
Blogs, die dieses Modell erwähnen
Juni 25, 2024 • 15 Minuten gelesen
Jina Reranker v2 für agenten-basiertes RAG: Ultraschnell, mehrsprachig, mit Function-Calling & Code-Suche
Jina Reranker v2 ist der erstklassige Reranker, der für Agentic RAG entwickelt wurde. Er bietet Function-Calling-Unterstützung, mehrsprachige Suche in über 100 Sprachen, Code-Such-Funktionen und ist 6-mal schneller als v1.
Saahil Ognawala
Jie Fu
Yuting Zhang
Scott Martens
Black background with word 'RERANKER' in white at left and a stylized white question mark design at the right.
Juni 03, 2024 • 6 Minuten gelesen
Implementierung eines Chat-Verlaufs-RAG mit Jina AI und Milvus Lite
Verbessern Sie Ihre Suchanwendungen in Python mit Jina Embeddings und Reranker und dem leichtgewichtigen, einfach zu implementierenden Milvus Lite.
Francesco Kruk
Saahil Ognawala
Black background with vivid geometric shapes on the sides and central logos "Embeddings," "Reranker," and "Milvus."
Mai 13, 2024 • 5 Minuten gelesen
Albus von Springworks: Mitarbeiter durch Enterprise Search stärken
Erfahren Sie, wie ein führendes HR-Tech-Startup die Modelle von Jina AI nutzt, um mit strukturierten und unstrukturierten Daten zu kommunizieren.
Francesco Kruk
Saahil Ognawala
Albus logo in white on a dark blue background, surrounded by abstract blue shapes and symbols.
Mai 07, 2024 • 12 Minuten gelesen
Wenn KI KI erschafft: Synthetische Daten, Model Distillation und Model Collapse
KI erschafft KI! Ist es das Ende der Welt? Oder nur ein weiteres Werkzeug, mit dem Modelle wertschöpfende Arbeit leisten können? Finden wir es heraus!
Scott Martens
Abstract depiction of a brain in purple and pink hues with a fluid, futuristic design against a blue and purple background.
April 29, 2024 • 7 Minuten gelesen
Jina Embeddings und Reranker auf Azure: Skalierbare KI-Lösungen für Unternehmensanwendungen
Jina Embeddings und Reranker sind jetzt im Azure Marketplace verfügbar. Unternehmen, die Datenschutz und Sicherheit priorisieren, können Jina AIs hochmoderne Modelle nun problemlos direkt in ihr bestehendes Azure-Ökosystem integrieren.
Susana Guzmán
Futuristic black background with a purple 3D grid, featuring the "Embeddings" and "Reranker" logos with a stylized "A".
Büros
location_on
Sunnyvale, Kalifornien
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, USA
location_on
Berlin, Deutschland (Hauptsitz)
Prinzessinnenstraße 19-20, 10969 Berlin, Deutschland
location_on
Peking, China
Ebene 5, Gebäude 6, Nr. 48 Haidian West St. Peking, China
location_on
Shenzhen, China
402 Etage 4, Fu'an Technology Building, Shenzhen, China
Stiftung durchsuchen
Leser
Einbettungen
Reranker
DeepSearch
Klassifikator
Segmentierer
API-Dokumentation
Jina API-Schlüssel abrufen
Ratenbegrenzung
API-Status
Unternehmen
Über uns
Kontaktieren Sie unseren Vertrieb
Pressemitteilungen
Praktikantenprogramm
Begleiten Sie uns
open_in_new
Logo herunterladen
open_in_new
Bedingungen
Sicherheit
Terms & amp; Bedingungen
Privatsphäre
Cookie-Einstellungen
email
Jina AI © 2020-2025.