Pressemitteilungen
Modelle
Produkte
keyboard_arrow_down
Leser
Lesen Sie URLs und suchen Sie im Internet nach fundierteren LLMs.
Einbettungen
Multimodale und mehrsprachige Einbettungen von Weltklasse.
Reranker
Neural Retriever der Weltklasse zur Maximierung der Suchrelevanz.
DeepSearch
Suchen, lesen und überlegen, bis die beste Antwort gefunden ist.
Mehr
keyboard_arrow_down
Klassifikator
Zero-Shot- und Few-Shot-Klassifizierung für Bild und Text.
Segmentierer
Schneiden Sie langen Text in Abschnitte und führen Sie eine Tokenisierung durch.

API-Dokumente
Automatische Codegenerierung für Ihre Copilot-IDE oder LLM
open_in_new


Unternehmen
keyboard_arrow_down
Über uns
Kontaktieren Sie unseren Vertrieb
Praktikantenprogramm
Begleiten Sie uns
open_in_new
Logo herunterladen
open_in_new
Terms & amp; Bedingungen


Einloggen
login
warning
Dieses Modell wird durch neuere Modelle ersetzt.

jina-embeddings-v2-base-en

Auf Augenhöhe mit text-embedding-ada002 von OpenAI
Beitrag veröffentlichenarrow_forward
Lizenz
license
Apache-2.0
Veröffentlichungsdatum
calendar_month
2023-10-28
Eingang
abc
Text
arrow_forward
Ausgabe
more_horiz
Vektor
Modelldetails
Parameter: 137M
Länge des Eingabetokens: 8K
Ausgabedimension: 768
Sprachunterstützung
🇺🇸 Englisch
Ähnliche Modelle
link
jina-embedding-b-en-v1
link
jina-embeddings-v3
Schlagwörter
text-embeddings
english
long-context
production-ready
multi-task-learning
semantic-search
document-retrieval
high-performance
bert-based
fine-tunable
rag-optimized
8k-context
Erhältlich über
Jina-APIAWS SageMakerMicrosoft AzureUmarmendes Gesicht
Wählen Sie Modelle zum Vergleichen aus
Publikationen (3)
SIGIR 2025
September 07, 2024
Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models
arXiv
Februar 26, 2024
Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings
arXiv
Oktober 30, 2023
Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

Überblick

Jina Embeddings v2 Base English ist ein bahnbrechendes Open-Source-Text-Embedding-Modell, das die kritische Herausforderung der Verarbeitung langer Dokumente bei gleichzeitig hoher Genauigkeit löst. Organisationen, die mit der Analyse umfangreicher juristischer Dokumente, Forschungsarbeiten oder Finanzberichte zu kämpfen haben, werden dieses Modell besonders wertvoll finden. Es zeichnet sich dadurch aus, dass es Dokumente mit einer Länge von bis zu 8.192 Token verarbeiten kann – 16-mal länger als herkömmliche Modelle – und dabei die gleiche Leistung wie die proprietären Lösungen von OpenAI bietet. Mit einer kompakten Größe von 0,27 GB und effizienter Ressourcennutzung bietet es eine zugängliche Lösung für Teams, die erweiterte Dokumentanalysen ohne übermäßigen Rechenaufwand implementieren möchten.

Methoden

Die Architektur des Modells kombiniert ein BERT Small-Backbone mit einem innovativen symmetrischen bidirektionalen ALiBi-Mechanismus (Attention with Linear Biases), wodurch die Notwendigkeit herkömmlicher Positionseinbettungen entfällt. Diese architektonische Wahl ermöglicht es dem Modell, weit über seine Trainingslänge von 512 Token hinaus zu extrapolieren und Sequenzen von bis zu 8.192 Token ohne Leistungseinbußen zu verarbeiten. Der Trainingsprozess umfasste zwei Schlüsselphasen: anfängliches Vortraining auf dem C4-Datensatz, gefolgt von einer Verfeinerung auf der kuratierten Sammlung von über 40 spezialisierten Datensätzen von Jina AI. Diese vielfältigen Trainingsdaten, darunter anspruchsvolle Negativbeispiele und abwechslungsreiche Satzpaare, gewährleisten eine robuste Leistung in verschiedenen Bereichen und Anwendungsfällen. Das Modell erzeugt 768-dimensionale dichte Vektoren, die nuancierte semantische Beziehungen erfassen, was mit relativ bescheidenen 137 Millionen Parametern erreicht wird.

Leistung

In Tests unter realen Bedingungen zeigt Jina Embeddings v2 Base English außergewöhnliche Fähigkeiten in mehreren Benchmarks. Es übertrifft OpenAIs text-embedding-ada-002 in mehreren wichtigen Metriken: Klassifizierung (73,45 % vs. 70,93 %), Neubewertung (85,38 % vs. 84,89 %), Abruf (56,98 % vs. 56,32 %) und Zusammenfassung (31,6 % vs. 30,8 %). Diese Zahlen bedeuten praktische Vorteile bei Aufgaben wie der Dokumentklassifizierung, bei der das Modell eine überlegene Fähigkeit zur Kategorisierung komplexer Texte zeigt, und bei Suchanwendungen, bei denen es Benutzeranfragen besser versteht und relevante Dokumente findet. Benutzer sollten jedoch beachten, dass die Leistung bei der Verarbeitung hochspezialisierter domänenspezifischer Inhalte, die nicht in den Trainingsdaten enthalten sind, variieren kann.

Anleitung

Um Jina Embeddings v2 Base English effektiv einzusetzen, sollten Teams verschiedene praktische Aspekte berücksichtigen. Das Modell benötigt CUDA-fähige Hardware für optimale Leistung, ist dank seiner effizienten Architektur jedoch auch auf handelsüblichen GPUs lauffähig. Es ist über verschiedene Kanäle verfügbar: Direkter Download von Hugging Face, Bereitstellung im AWS Marketplace oder die Jina AI API mit 10 Millionen kostenlosen Token. Für Produktionsbereitstellungen bietet AWS SageMaker in der Region us-east-1 die skalierbarste Lösung. Das Modell eignet sich hervorragend für allgemeine Textanalysen, ist aber ohne Feinabstimmung möglicherweise nicht die beste Wahl für hochspezialisierte wissenschaftliche Terminologie oder fachspezifischen Jargon. Bei der Verarbeitung langer Dokumente sollten Sie diese in sinnvolle semantische Abschnitte zerlegen, anstatt sie willkürlich aufzuteilen, um die Kontextintegrität zu wahren. Für optimale Ergebnisse implementieren Sie eine geeignete Textvorverarbeitung und stellen Sie saubere, gut formatierte Eingabedaten sicher.
Blogs, die dieses Modell erwähnen
Dezember 17, 2024 • 12 Minuten gelesen
Texteinbettungen erfassen die Wortreihenfolge nicht - und wie man das beheben kann
Texteinbettungsmodelle haben Schwierigkeiten damit, subtile sprachliche Nuancen wie Wortstellung, direktionale Beziehungen, zeitliche Abfolgen, kausale Zusammenhänge, Vergleiche und Verneinungen zu erfassen. Das Verständnis dieser Herausforderungen ist der Schlüssel zur Verbesserung der Modellleistung.
Bo Wang
Alex C-G
Three abstract figures in white, gray, and pink on matching cubes placed on a colorful checkered surface against a green back
Oktober 25, 2024 • 19 Minuten gelesen
Optimale Umbruchpunkte in langen Dokumenten mit Small Language Models finden
Wir haben drei kleine Language Models trainiert, um lange Dokumente besser in Teilstücke zu segmentieren, und hier sind die wichtigsten Erkenntnisse, die wir dabei gewonnen haben.
Andrei Ungureanu
Alex C-G
A pattern of yellow file icons on a blue background with one icon displaying a smiley face creating an emotive contrast.
Oktober 15, 2024 • 9 Minuten gelesen
Faktenprüfung mit der neuen Grounding API in Jina Reader
Mit dem neuen g.jina.ai können Sie ganz einfach Aussagen verifizieren, um LLM-Halluzinationen zu reduzieren oder die Integrität von menschlich verfasstem Content zu verbessern.
Jina AI
Jina developer interface showing "Jina AI was founded in 2020" with controls labeled true and false, and web address on top.
September 27, 2024 • 15 Minuten gelesen
Migration von Jina Embeddings v2 zu v3
Wir haben einige Tipps zusammengestellt, die Ihnen bei der Migration von Jina Embeddings v2 auf v3 helfen.
Alex C-G
Scott Martens
A digital upgrade theme with "V3" and a white "2", set against a green and black binary code background, with "Upgrade" centr
September 18, 2024 • 10 Minuten gelesen
Jina Embeddings v3: Ein wegweisendes mehrsprachiges Embedding-Modell
jina-embeddings-v3 ist ein wegweisendes mehrsprachiges Text-Embedding-Modell mit 570M Parametern und einer Token-Länge von 8192, das die neuesten proprietären Embeddings von OpenAI und Cohere bei MTEB übertrifft.
Jina AI
Dynamic image showing the characters "V3" formed by bright green dots varying in size on a black background.
Büros
location_on
Sunnyvale, Kalifornien
710 Lakeway Dr, Ste 200, Sunnyvale, CA 94085, USA
location_on
Berlin, Deutschland (Hauptsitz)
Prinzessinnenstraße 19-20, 10969 Berlin, Deutschland
location_on
Peking, China
Ebene 5, Gebäude 6, Nr. 48 Haidian West St. Peking, China
location_on
Shenzhen, China
402 Etage 4, Fu'an Technology Building, Shenzhen, China
Stiftung durchsuchen
Leser
Einbettungen
Reranker
DeepSearch
Klassifikator
Segmentierer
API-Dokumentation
Jina API-Schlüssel abrufen
Ratenbegrenzung
API-Status
Unternehmen
Über uns
Kontaktieren Sie unseren Vertrieb
Pressemitteilungen
Praktikantenprogramm
Begleiten Sie uns
open_in_new
Logo herunterladen
open_in_new
Bedingungen
Sicherheit
Terms & amp; Bedingungen
Privatsphäre
Cookie-Einstellungen
email
Jina AI © 2020-2025.