Einbettungen

Leistungsstarke multimodale, mehrsprachige Langkontext-Einbettungen für Such-, RAG- und Agentenanwendungen.

Einbettungs-API

Probieren Sie unsere erstklassigen Einbettungsmodelle aus, um Ihre Such- und RAG-Systeme zu verbessern. Beginnen Sie mit einer kostenlosen Testversion!

Ratenbegrenzung

Problem melden

FAQ

Status

Wählen Sie Einbettungen aus

L2-Normalisierung

Skaliere die Einbettungen auf Einheitslänge (L2-Norm = 1). Erforderlich für die Kosinusähnlichkeit mittels Skalarprodukt.

Ausgabedatentyp

embedding_type

encoding_format

output_dtype

embedding_types

Wählen Sie das Ausgabeformat: float (Standard), binary (kompakte Speicherung) oder base64 (effiziente Übertragung).

Standard (als Float)

Beispieleingaben

Ändern Sie sie und sehen Sie, wie sich die Reaktion ändert!

Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.

Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.

Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.

针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。

新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。

Anfrage

Bash

Sprache

curl https://api.jina.ai/v1/embeddings \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer " \
  -d @- <<EOFEOF
  {
    "normalized": true,
    "embedding_type": "float",
    "input": [
        "Organic skincare for sensitive skin with aloe vera and chamomile: Imagine the soothing embrace of nature with our organic skincare range, crafted specifically for sensitive skin. Infused with the calming properties of aloe vera and chamomile, each product provides gentle nourishment and protection. Say goodbye to irritation and hello to a glowing, healthy complexion.",
        "Bio-Hautpflege für empfindliche Haut mit Aloe Vera und Kamille: Erleben Sie die wohltuende Wirkung unserer Bio-Hautpflege, speziell für empfindliche Haut entwickelt. Mit den beruhigenden Eigenschaften von Aloe Vera und Kamille pflegen und schützen unsere Produkte Ihre Haut auf natürliche Weise. Verabschieden Sie sich von Hautirritationen und genießen Sie einen strahlenden Teint.",
        "Cuidado de la piel orgánico para piel sensible con aloe vera y manzanilla: Descubre el poder de la naturaleza con nuestra línea de cuidado de la piel orgánico, diseñada especialmente para pieles sensibles. Enriquecidos con aloe vera y manzanilla, estos productos ofrecen una hidratación y protección suave. Despídete de las irritaciones y saluda a una piel radiante y saludable.",
        "针对敏感肌专门设计的天然有机护肤产品：体验由芦荟和洋甘菊提取物带来的自然呵护。我们的护肤产品特别为敏感肌设计，温和滋润，保护您的肌肤不受刺激。让您的肌肤告别不适，迎来健康光彩。",
        "新しいメイクのトレンドは鮮やかな色と革新的な技術に焦点を当てています: 今シーズンのメイクアップトレンドは、大胆な色彩と革新的な技術に注目しています。ネオンアイライナーからホログラフィックハイライターまで、クリエイティビティを解き放ち、毎回ユニークなルックを演出しましょう。"
    ]
  }
EOFEOF

API-Schlüssel

Verfügbare Token

Dies ist Ihr einzigartiger Schlüssel. Bewahren Sie ihn sicher auf!

v5-Text: Neue SOTA kleine mehrsprachige Einbettungen

jina-embeddings-v5-text bietet Einbettungsqualität der fünften Generation in zwei effizienten Größen – einem kleinen Modell mit 677 Millionen und einem Nano-Modell mit 239 Millionen – mit aufgabenspezifischen LoRA-Adaptern, Matryoshka-Dimensionen, 32K Kontext und GGUF/MLX-Quantisierung für den Einsatz am Edge und setzt damit neue Maßstäbe für MMTEB, MTEB English und Retrieval-Aufgaben.

v4: Universelle Einbettungen für multimodale mehrsprachige Abfrage

jina-embeddings-v4 ist unser bisher bedeutendster Sprung – ein 3,8-B-Modell, das Text und Bilder über einen einheitlichen Pfad einbettet und sowohl dichtes als auch spätes Interaktionsabrufen unterstützt. Dabei übertrifft es proprietäre Modelle von Google, OpenAI und Voyage AI, insbesondere beim Abrufen visuell ansprechender Dokumente.

Zwei Kaufmöglichkeiten

Abonnieren Sie unsere API oder kaufen Sie über Cloud-Anbieter.

Mit 3 Cloud-Service-Anbietern

Verwendet Ihr Unternehmen AWS oder Azure? Dann setzen Sie unsere Suchgrundlagenmodelle direkt auf diesen Plattformen in Ihrem Unternehmen ein, damit Ihre Daten sicher und konform bleiben.

Mit Jina Search Foundation API

Der einfachste Weg, auf alle unsere Produkte zuzugreifen. Laden Sie Tokens unterwegs auf.

Geben Sie den API-Schlüssel ein, den Sie aufladen möchten

Laden Sie diesen API-Schlüssel mit weiteren Token auf

Abhängig von Ihrem Standort werden Ihnen möglicherweise USD, EUR oder andere Währungen in Rechnung gestellt. Es können Steuern anfallen.

Bitte geben Sie zum Aufladen den richtigen API-Schlüssel ein

Verstehen Sie die Ratenbegrenzung

Ratenbegrenzungen sind die maximale Anzahl von Anfragen, die pro Minute pro IP-Adresse/API-Schlüssel (RPM) an eine API gestellt werden können. Nachfolgend erfahren Sie mehr über die Ratenbegrenzungen für jedes Produkt und jede Stufe.

Ratenbegrenzung

Ratenbegrenzungen werden auf drei Arten verfolgt: RPM (Anfragen pro Minute) und TPM (Token pro Minute). Die Begrenzungen werden pro IP/API-Schlüssel erzwungen und ausgelöst, wenn zuerst der RPM- oder TPM-Schwellenwert erreicht wird. Wenn Sie im Anforderungsheader einen API-Schlüssel angeben, verfolgen wir die Ratenbegrenzungen nach Schlüssel und nicht nach IP-Adresse.

Spalten

Produkt	API-Endpunkt	Beschreibung	ohne API-Schlüssel	mit kostenlosem API-Schlüssel	mit kostenpflichtigem API-Schlüssel	mit Premium-API-Schlüssel	Durchschnittliche Latenz	Zählung der Token-Nutzung	Zulässige Anfrage
Leser-API	`https://r.jina.ai`	URL in LLM-freundlichen Text konvertieren	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Zählen Sie die Anzahl der Token in der Ausgabeantwort.	GET/POST
Leser-API	`https://s.jina.ai`	Durchsuchen Sie das Web und konvertieren Sie die Ergebnisse in LLM-freundlichen Text		100 RPM	100 RPM	1000 RPM	2.5s	Jede Anfrage kostet eine feste Anzahl an Token, beginnend bei 10000 Token	GET/POST
Einbettungs-API	`https://api.jina.ai/v1/embeddings`	Konvertieren Sie Text/Bilder in Vektoren mit fester Länge		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Reranker-API	`https://api.jina.ai/v1/rerank`	Ordnen Sie Dokumente nach Abfrage		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Klassifizierer-API	`https://api.jina.ai/v1/train`	Trainieren eines Klassifikators anhand gekennzeichneter Beispiele		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens × num_iters	POST
Klassifizierer-API (Nullschuss)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mithilfe der Zero-Shot-Klassifizierung		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens + label_tokens	POST
Klassifizierer-API (Wenige Schüsse)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mit einem trainierten Few-Shot-Klassifikator		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens	POST
Segmenter-API	`https://api.jina.ai/v1/segment`	Tokenisieren und Segmentieren von Langtext	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Token werden nicht als Nutzung gezählt.	GET/POST
DeepSearch	`https://deepsearch.jina.ai/v1/chat/completions`	Überlegen, suchen und iterieren, um die beste Antwort zu finden		50 RPM	50 RPM	500 RPM	56.7s	Zählen Sie die Gesamtzahl der Token im gesamten Vorgang.	POST

Automatisches Aufladen bei niedrigem Token-Guthaben

Empfohlen für einen unterbrechungsfreien Betrieb in der Produktion. Wenn Ihr Token-Guthaben unter den festgelegten Schwellenwert fällt, belasten wir Ihre gespeicherte Zahlungsmethode automatisch für das zuletzt gekaufte Paket, bis der Schwellenwert erreicht ist.

Am 6. Mai 2025 haben wir ein neues Preismodell eingeführt. Wenn Sie die automatische Aufladung vor diesem Datum aktiviert haben, zahlen Sie weiterhin den alten Preis (den zum Zeitpunkt des Kaufs). Die neuen Preise gelten nur, wenn Sie Ihre Einstellungen für die automatische Aufladung ändern oder einen neuen API-Schlüssel erwerben.

< 1M Token

Aufladen, wenn

Bereitstellung vor Ort

Stellen Sie Jina Embeddings-Modelle in AWS Sagemaker und Microsoft Azure und bald auch in Google Cloud Services bereit, oder wenden Sie sich an unser Vertriebsteam, um angepasste Kubernetes-Bereitstellungen für Ihre Virtual Private Cloud und Ihre lokalen Server zu erhalten.

AWS SageMaker

Einbettungen

Neubewerter

Microsoft Azure

Einbettungen

Neubewerter

Google Cloud

Einbettungen

API-Integrationen

Unsere Einbettungs-API ist nativ in verschiedene renommierte Datenbanken, Vektorspeicher, RAG- und LLMOps-Frameworks integriert. Kopieren Sie zunächst einfach Ihren API-Schlüssel und fügen Sie ihn in eine der aufgeführten Integrationen ein, um einen schnellen und reibungslosen Start zu ermöglichen.

Vector Store

LLMOps

LAPPEN

Beobachtbarkeit

MongoDB

DataStax

Qdrant

Pinecone

Chroma

Weaviate

Milvus

Epsilla

MyScale

LlamaIndex

Haystack

Langchain

Dify

SuperDuperDB

DashVector

Portkey

Baseten

TiDB

LanceDB

Carbon

Unsere Veröffentlichungen

Erfahren Sie, wie unsere bahnbrechenden Suchmodelle von Grund auf trainiert wurden, und sehen Sie sich unsere neuesten Veröffentlichungen an. Lernen Sie unser Team bei EMNLP, SIGIR, ICLR, NeurIPS und ICML kennen!

arXiv

Februar 17, 2026

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

arXiv

Februar 11, 2026

Embedding Inversion via Conditional Masked Diffusion Language Models

ICLR 2026

Januar 22, 2026

Embedding Compression via Spherical Coordinates

arXiv

Dezember 29, 2025

Vision Encoders in Vision-Language Models: A Survey

ICLR 2026

Dezember 04, 2025

Jina-VLM: Small Multilingual Vision Language Model

AAAI 2026

Oktober 01, 2025

jina-reranker-v3: Last but Not Late Interaction for Document Reranking

NeurIPS 2025

August 31, 2025

Efficient Code Embeddings from Code Generation Models

EMNLP 2025

Juni 24, 2025

jina-embeddings-v4: Universal Embeddings for Multimodal Multilingual Retrieval

ICLR 2025

März 04, 2025

ReaderLM-v2: Small Language Model for HTML to Markdown and JSON

ACL 2025

Dezember 17, 2024

AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark

ICLR 2025

Dezember 12, 2024

jina-clip-v2: Multilingual Multimodal Embeddings for Text and Images

ECIR 2025

September 18, 2024

jina-embeddings-v3: Multilingual Embeddings With Task LoRA

SIGIR 2025

September 07, 2024

Late Chunking: Contextual Chunk Embeddings Using Long-Context Embedding Models

EMNLP 2024

August 30, 2024

Jina-ColBERT-v2: A General-Purpose Multilingual Late Interaction Retriever

WWW 2025

Juni 21, 2024

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

ICML 2024

Mai 30, 2024

Jina CLIP: Your CLIP Model Is Also Your Text Retriever

arXiv

Februar 26, 2024

Multi-Task Contrastive Learning for 8192-Token Bilingual Text Embeddings

arXiv

Oktober 30, 2023

Jina Embeddings 2: 8192-Token General-Purpose Text Embeddings for Long Documents

EMNLP 2023

Juli 20, 2023

Jina Embeddings: A Novel Set of High-Performance Sentence Embedding Models

19 Veröffentlichungen insgesamt.

Erfahren Sie mehr über Einbettungen

Wo soll man mit Einbettungen anfangen? Wir geben dir Deckung. Erfahren Sie mehr über Einbettungen von Grund auf mit unserem umfassenden Leitfaden.

Vergleich von Reranker, Vector Search und BM25

Die folgende Tabelle bietet einen umfassenden Vergleich von Reranker, Vector/Embeddings Search und BM25 und hebt deren Stärken und Schwächen in verschiedenen Kategorien hervor.

	Reranker	Vektorsuche	BM25
Beste für	Verbesserte Suchpräzision und Relevanz	Erste, schnelle Filterung	Allgemeine Textsuche für weitreichende Abfragen
Die Granularität	Detailliert: Unterdokument und Abfragesegment	Breit: Ganze Dokumente	Mittelstufe: Verschiedene Textsegmente
Komplexität der Abfragezeit	Hoch	Mittel	Niedrig
Zeitkomplexität indizieren	Nicht benötigt	Hoch	Niedrig, nutzt vorgefertigten Index
Komplexität der Trainingszeit	Hoch	Hoch	Nicht benötigt
Suchqualität	Hervorragend für differenzierte Abfragen	Ausgewogen zwischen Effizienz und Genauigkeit	Konsistent und zuverlässig für eine breite Palette von Abfragen
Stärken	Sehr präzise mit tiefem Kontextverständnis	Schnell und effizient, mit mäßiger Genauigkeit	Hoch skalierbar, mit nachgewiesener Wirksamkeit
	Testen Sie die Reranker-API kostenlos	Probieren Sie die Einbettungs-API kostenlos aus

Die Evolution des Einbettungsplakats

Entdecken Sie das ideale Poster für Ihren Raum mit fesselnden Infografiken oder atemberaubenden Bildern, die die Entwicklung der Texteinbettungsmodelle seit 1950 nachzeichnen.

Erfahren Sie, wie wir es gemacht haben

Kaufen Sie eine gedruckte Kopie

FAQ

Wie wurden die Jina-Einbettungsmodelle trainiert?

Welche multimodalen Einbettungsmodelle verwenden Sie?

Welche Sprachen unterstützen Ihre Modelle?

Was ist die maximale Länge für die Eingabe eines einzelnen Satzes?

Wie viele Sätze kann ich maximal in eine einzelne Anfrage einfügen?

Wie sende ich Bilder an multimodale Einbettungsmodelle?

Wie schneiden Jina-Embeddings-Modelle im Vergleich zu den neuesten Embeddings von OpenAI und Cohere ab?

Wie nahtlos ist der Übergang von OpenAIs Text-Embedding-3-Large zu Ihrer Lösung?

Wie werden Token bei der Verwendung von Jina-Clip-Modellen berechnet?

Bieten Sie Modelle zum Einbetten von Bildern oder Audio an?

Können Jina Embedding-Modelle mit privaten oder Unternehmensdaten verfeinert werden?

Können Ihre Endpunkte privat auf AWS, Azure oder GCP gehostet werden?

Was ist der Parameter „task“ und wann sollte ich ihn verwenden?

Was versteht man unter „Late-Interaction Retrieval“ und welche Modelle unterstützen es?

Was ist Late Chunking und wann sollte ich es anwenden?

Warum unterstützt die API eine andere Kontextlänge als die maximale Kapazität des Modells?

Warum ist jina-embeddings-v4 kostenlos und warum ist es langsam?

Welche Ratenbegrenzungen gelten für die Embeddings API?

Welche Beschränkungen gelten für die Kontextlänge der einzelnen Einbettungsmodelle?

Welche Dateigrößenbeschränkungen gelten für Bilder und PDFs?

Wie erhalte ich meinen API-Schlüssel?

Wie hoch ist die Ratenbegrenzung?

Ratenbegrenzung

Spalten

Produkt	API-Endpunkt	Beschreibung	ohne API-Schlüssel	mit kostenlosem API-Schlüssel	mit kostenpflichtigem API-Schlüssel	mit Premium-API-Schlüssel	Durchschnittliche Latenz	Zählung der Token-Nutzung	Zulässige Anfrage
Leser-API	`https://r.jina.ai`	URL in LLM-freundlichen Text konvertieren	20 RPM	500 RPM	500 RPM	5000 RPM	7.9s	Zählen Sie die Anzahl der Token in der Ausgabeantwort.	GET/POST
Leser-API	`https://s.jina.ai`	Durchsuchen Sie das Web und konvertieren Sie die Ergebnisse in LLM-freundlichen Text		100 RPM	100 RPM	1000 RPM	2.5s	Jede Anfrage kostet eine feste Anzahl an Token, beginnend bei 10000 Token	GET/POST
Einbettungs-API	`https://api.jina.ai/v1/embeddings`	Konvertieren Sie Text/Bilder in Vektoren mit fester Länge		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Reranker-API	`https://api.jina.ai/v1/rerank`	Ordnen Sie Dokumente nach Abfrage		100 RPM & 100,000 TPM	500 RPM & 2,000,000 TPM	5,000 RPM & 50,000,000 TPM	hängt von der Eingangsgröße ab	Zählen Sie die Anzahl der Token in der Eingabeanforderung.	POST
Klassifizierer-API	`https://api.jina.ai/v1/train`	Trainieren eines Klassifikators anhand gekennzeichneter Beispiele		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens × num_iters	POST
Klassifizierer-API (Nullschuss)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mithilfe der Zero-Shot-Klassifizierung		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens + label_tokens	POST
Klassifizierer-API (Wenige Schüsse)	`https://api.jina.ai/v1/classify`	Klassifizieren Sie Eingaben mit einem trainierten Few-Shot-Klassifikator		25 RPM & 25,000 TPM	125 RPM & 500,000 TPM	1,250 RPM & 12,000,000 TPM	hängt von der Eingangsgröße ab	Token werden wie folgt gezählt: input_tokens	POST
Segmenter-API	`https://api.jina.ai/v1/segment`	Tokenisieren und Segmentieren von Langtext	20 RPM	200 RPM	200 RPM	1,000 RPM	0.3s	Token werden nicht als Nutzung gezählt.	GET/POST
DeepSearch	`https://deepsearch.jina.ai/v1/chat/completions`	Überlegen, suchen und iterieren, um die beste Antwort zu finden		50 RPM	50 RPM	500 RPM	56.7s	Zählen Sie die Gesamtzahl der Token im gesamten Vorgang.	POST

Benötige ich eine gewerbliche Lizenz?

CC BY-NC Lizenz Selbstcheck

Nutzen Sie unsere offizielle API oder offizielle Images auf Azure, AWS oder GCP?

NEIN

Kann ich denselben API-Schlüssel für Reader-, Einbettungs-, Neurang-, Klassifizierungs- und Feinabstimmungs-APIs verwenden?

Kann ich die Token-Nutzung meines API-Schlüssels überwachen?

Was soll ich tun, wenn ich meinen API-Schlüssel vergesse?

Laufen API-Schlüssel ab?

Kann ich Token zwischen API-Schlüsseln übertragen?

Kann ich meinen API-Schlüssel widerrufen?

Warum ist die erste Anfrage für einige Modelle langsam?

Werden meine API-Daten zum Trainieren Ihrer Modelle verwendet?

Welche Ratenbegrenzungen gelten für Jina-APIs?

Gibt es Beschränkungen hinsichtlich der Batchgröße für die APIs?

Erfolgt die Abrechnung nach der Anzahl der Sätze bzw. Anfragen?

Gibt es eine kostenlose Testversion für neue Benutzer?

Werden für fehlgeschlagene Anfragen Token berechnet?

Welche Zahlungsmethoden werden akzeptiert?

Ist eine Rechnungsstellung für Token-Käufe verfügbar?