Доставляет события по мере их возникновения через отправленные сервером события, включая шаги обоснования и окончательные ответы. Мы настоятельно рекомендуем оставить эту опцию включенной, поскольку запросы DeepSearch могут занять значительное время для завершения. Отключение потоковой передачи может привести к ошибкам «524 timeout».
Ограничивает усилия по рассуждению для моделей рассуждений. В настоящее время поддерживаются значения low, medium и high. Уменьшение усилий по рассуждению может привести к более быстрым ответам и меньшему количеству токенов, используемых для рассуждений в ответе.
medium
arrow_drop_down
Бюджетные жетоны
Это определяет максимальное количество токенов, разрешенных для использования в процессе DeepSearch. Большие бюджеты могут улучшить качество ответа, позволяя выполнять более полный поиск для сложных запросов, хотя DeepSearch может не использовать весь выделенный бюджет. Это переопределяет параметр reasoning_effort.
Макс. количество попыток
Максимальное количество повторных попыток решения проблемы (и всех подзадач) в процессе DeepSearch. Большее значение позволяет DeepSearch повторить попытку решения проблемы, используя различные подходы к рассуждениям и стратегии решения. Этот параметр переопределяет параметр reasoning_effort.
Прямого ответа нет
Заставляет модель предпринимать дальнейшие шаги по обдумыванию/поиску, даже если запрос кажется тривиальным. Это полезно, если вы используете DeepSearch в сценариях, где вы уверены, что запрос всегда нуждается в DeepSearch, а не для тривиальных вопросов, таких как «1+1=?»
Максимальное количество возвращенных URL-адресов
Максимальное количество URL-адресов для включения в окончательный ответ/фрагмент. URL-адреса сортируются по релевантности и другим важным факторам.
Оптимизированный поиск Arxiv
Экспериментальный
Оптимизированная поисковая система для исследовательских статей arXiv. Это ограничит весь поиск только arXiv.
Структурированный вывод
Это позволяет использовать структурированные выходные данные, которые гарантируют, что окончательный ответ модели будет соответствовать предоставленной вами схеме JSON.
Язык поискового запроса
Принудительно указать язык для поискового запроса. Полезно, когда ресурсы с большей вероятностью будут на определенном языке. По умолчанию он автоматически определяется системой.
Язык ответов и размышлений
Задайте язык ответа и думайте с заданным кодом языка. По умолчанию он автоматически определяется из основного языка входных сообщений. Качество ответа может быть слегка затронуто языком.
Хорошие Домены
Список доменов, которым дан более высокий приоритет для поиска контента. Полезно для доменно-специфичных, высококачественных источников, которые предоставляют ценный контент.
Плохие домены
Список доменов, которые следует строго исключить из поиска контента. Обычно используется для фильтрации известного спама, некачественных или нерелевантных веб-сайтов.
Только домены
Список доменов, которые будут включены исключительно в поиск контента. Все остальные домены будут игнорироваться. Полезно для поиска по домену.
Сообщения
Список сообщений между пользователем и помощником, составляющих беседу на данный момент.
person
Пользователь
smart_toy
Помощник
person
Пользователь
Прикрепить изображение/документ
Поддерживаются различные типы сообщений (модальности), такие как текст (.txt, .pdf), изображения (.png, .webp, .jpeg). Поддерживаются файлы размером до 10 МБ, и их необходимо предварительно закодировать в URI данных.
Простое текстовое сообщение
arrow_drop_down
{"role":"user","content":"hi"}
upload
Запрос
Bash
Язык
arrow_drop_down
curl https://deepsearch.jina.ai/v1/chat/completions \-H"Content-Type: application/json"\-H"Authorization: Bearer "\-d @- <<EOFEOF
{
"model": "jina-deepsearch-v1",
"messages": [
{
"role": "user",
"content": "Hi!"
},
{
"role": "assistant",
"content": "Hi, how can I help you?"
},
{
"role": "user",
"content": "what's the latest blog post from jina ai?"
}
],
"stream": true,
"reasoning_effort": "medium",
"max_attempts": 1,
"no_direct_answer": false
}
EOFEOF
info
Это последний фрагмент потока, который содержит окончательный ответ, посещенные URL и использование токенов. Нажмите кнопку выше, чтобы получить ответ в реальном времени.
download
Ответ
fiber_manual_record 200 OK
timer
0.0 s
straighten
196,526 Токены
{"id":"1742181758589","object":"chat.completion.chunk","created":1742181758,"model":"jina-deepsearch-v1","system_fingerprint":"fp_1742181758589","choices":[{"index":0,"delta":{"content":"The latest blog post from Jina AI is titled \"Snippet Selection and URL Ranking in DeepSearch/DeepResearch,\" published on March 12, 2025 [^1]. This post discusses how to improve the quality of DeepSearch by using late-chunking embeddings for snippet selection and rerankers to prioritize URLs before crawling. You can read the full post here: https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch\n\n[^1]: Since our DeepSearch release on February 2nd 2025 we ve discovered two implementation details that greatly improved quality In both cases multilingual embeddings and rerankers are used in an in context manner operating at a much smaller scale than the traditional pre computed indices these models typically require [jina.ai](https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch)","type":"text","annotations":[{"type":"url_citation","url_citation":{"title":"Snippet Selection and URL Ranking in DeepSearch/DeepResearch","exactQuote":"Since our DeepSearch release on February 2nd 2025, we've discovered two implementation details that greatly improved quality. In both cases, multilingual embeddings and rerankers are used in an _\"in-context\"_ manner - operating at a much smaller scale than the traditional pre-computed indices these models typically require.","url":"https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch","dateTime":"2025-03-13 06:48:01"}}]},"logprobs":null,"finish_reason":"stop"}],"usage":{"prompt_tokens":169670,"completion_tokens":27285,"total_tokens":196526},"visitedURLs":["https://github.com/jina-ai/node-DeepResearch/blob/main/src/utils/url-tools.ts","https://huggingface.co/jinaai/jina-embeddings-v3","https://github.com/jina-ai/reader","https://zilliz.com/blog/training-text-embeddings-with-jina-ai","https://threads.net/@unwind_ai/post/DGmhWCVswbe/media","https://twitter.com/JinaAI_/status/1899840196507820173","https://jina.ai/news?tag=tech-blog","https://docs.llamaindex.ai/en/stable/examples/embeddings/jinaai_embeddings","https://x.com/jinaai_","https://x.com/JinaAI_/status/1899840202358784170","https://tracxn.com/d/companies/jina-ai/__IQ81fOnU0FsDpagFjG-LrG0DMWHELqI6znTumZBQF-A/funding-and-investors","https://jina.ai/models","https://linkedin.com/posts/imohitmayank_jinaai-has-unveiled-the-ultimate-developer-activity-7300401711242711040-VD64","https://medium.com/@tossy21/trying-out-jina-ais-node-deepresearch-c5b55d630ea6","https://huggingface.co/jinaai/jina-clip-v2","https://arxiv.org/abs/2409.10173","https://milvus.io/docs/embed-with-jina.md","https://seedtable.com/best-startups-in-china","https://threads.net/@sung.kim.mw/post/DGhG-J_vREu/jina-ais-a-practical-guide-to-implementing-deepsearchdeepresearchthey-cover-desi","https://elastic.co/search-labs/blog/jina-ai-embeddings-rerank-model-open-inference-api","http://status.jina.ai/","https://apidog.com/blog/recreate-openai-deep-research","https://youtube.com/watch?v=QxHE4af5BQE","https://sdxcentral.com/articles/news/cisco-engages-businesses-on-ai-strategies-at-greater-bay-area-2025/2025/02","https://aws.amazon.com/blogs/machine-learning/build-rag-applications-using-jina-embeddings-v2-on-amazon-sagemaker-jumpstart","https://reddit.com/r/perplexity_ai/comments/1ejbdqa/fastest_open_source_ai_search_engine","https://search.jina.ai/","https://sebastian-petrus.medium.com/build-openais-deep-research-open-source-alternative-4f21aed6d9f0","https://medium.com/@elmo92/jina-reader-transforming-web-content-to-feed-llms-d238e827cc27","https://openai.com/index/introducing-deep-research","https://python.langchain.com/docs/integrations/tools/jina_search","https://varindia.com/news/meta-is-in-talks-for-usd200-billion-ai-data-center-project","https://varindia.com/news/Mira-Murati%E2%80%99s-new-AI-venture-eyes-$9-billion-valuation","https://53ai.com/news/RAG/2025031401342.html","https://arxiv.org/abs/2409.04701","https://bigdatawire.com/this-just-in/together-ai-raises-305m-series-b-to-power-ai-model-training-and-inference","https://github.blog/","https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/MvwT9enRT7gOESHA_tpRj.jpeg","https://cdn-uploads.huggingface.co/production/uploads/660c3c5c8eec126bfc7aa326/JNs_DrpFbr6ok_pSRUK4j.jpeg","https://app.dealroom.co/lists/33530","https://api-docs.deepseek.com/news/news250120","https://sdxcentral.com/articles/news/ninjaone-raises-500-million-valued-at-5-billion/2025/02","https://linkedin.com/sharing/share-offsite?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F","https://twitter.com/intent/tweet?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F","https://platform.openai.com/docs/api-reference/chat/create","https://mp.weixin.qq.com/s/-pPhHDi2nz8hp5R3Lm_mww","https://huggingface.us17.list-manage.com/subscribe?id=9ed45a3ef6&u=7f57e683fa28b51bfc493d048","https://automatio.ai/","https://sdk.vercel.ai/docs/introduction","https://app.eu.vanta.com/jinaai/trust/vz7f4mohp0847aho84lmva","https://apply.workable.com/huggingface/j/AF1D4E3FEB","https://facebook.com/sharer/sharer.php?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F","https://facebook.com/sharer/sharer.php?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F","https://reddit.com/submit?url=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F","https://apply.workable.com/huggingface","https://news.ycombinator.com/submitlink?u=https%3A%2F%2Fjina.ai%2Fnews%2Fa-practical-guide-to-implementing-deepsearch-deepresearch%2F","https://news.ycombinator.com/submitlink?u=http%3A%2F%2F127.0.0.1%3A3000%2Fen-US%2Fnews%2Fsnippet-selection-and-url-ranking-in-deepsearch-deepresearch%2F","https://docs.github.com/site-policy/privacy-policies/github-privacy-statement","https://discord.jina.ai/","https://docs.github.com/site-policy/github-terms/github-terms-of-service","https://bigdatawire.com/this-just-in/qumulo-announces-30-million-funding","https://x.ai/blog/grok-3","https://m-ric-open-deep-research.hf.space/","https://youtu.be/sal78ACtGTc?feature=shared&t=52","https://mp.weixin.qq.com/s/apnorBj4TZs3-Mo23xUReQ","https://perplexity.ai/hub/blog/introducing-perplexity-deep-research","https://githubstatus.com/","https://github.blog/changelog/2021-09-30-footnotes-now-supported-in-markdown-fields","https://openai.com/index/introducing-operator","mailto:[email protected]","https://resources.github.com/learn/pathways","https://status.jina.ai/","https://reuters.com/technology/artificial-intelligence/tencents-messaging-app-weixin-launches-beta-testing-with-deepseek-2025-02-16","https://scmp.com/tech/big-tech/article/3298981/baidu-adopts-deepseek-ai-models-chasing-tencent-race-embrace-hot-start","https://microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks","javascript:UC_UI.showSecondLayer();","https://resources.github.com/","https://storm-project.stanford.edu/research/storm","https://blog.google/products/gemini/google-gemini-deep-research","https://youtu.be/vrpraFiPUyA","https://chat.baidu.com/search?extParamsJson=%7B%22enter_type%22%3A%22ai_explore_home%22%7D&isShowHello=1&pd=csaitab&setype=csaitab&usedModel=%7B%22modelName%22%3A%22DeepSeek-R1%22%7D","https://app.dover.com/jobs/jinaai","http://localhost:3000/","https://docs.cherry-ai.com/","https://en.wikipedia.org/wiki/Delayed_gratification","https://support.github.com/?tags=dotcom-footer","https://docs.jina.ai/","https://skills.github.com/","https://partner.github.com/","https://help.x.com/resources/accessibility","https://business.twitter.com/en/help/troubleshooting/how-twitter-ads-work.html","https://business.x.com/en/help/troubleshooting/how-twitter-ads-work.html","https://support.twitter.com/articles/20170514","https://support.x.com/articles/20170514","https://t.co/jnxcxPzndy","https://t.co/6EtEMa9P05","https://help.x.com/using-x/x-supported-browsers","https://legal.twitter.com/imprint.html"],"readURLs":["https://jina.ai/news/a-practical-guide-to-implementing-deepsearch-deepresearch","https://github.com/jina-ai/node-DeepResearch","https://huggingface.co/blog/open-deep-research","https://jina.ai/news/snippet-selection-and-url-ranking-in-deepsearch-deepresearch","https://x.com/jinaai_?lang=en","https://jina.ai/news","https://x.com/joedevon/status/1896984525210837081","https://github.com/jina-ai/node-DeepResearch/blob/main/src/tools/jina-latechunk.ts"],"numURLs":98}
key
API-ключ
visibility_off
Доступные токены
0
Это ваш уникальный ключ. Храните его в надежном месте!
Проверка Vibe с помощью простого пользовательского интерфейса чата. DeepSearch лучше всего подходит для сложных вопросов, требующих итеративного рассуждения, знания мира или актуальной информации.
Мы только что запустили новый пользовательский интерфейс DeepSearch, который молниеносно быстр, минималистичен и БЕСПЛАТЕН. Проверьте его на https://search.jina.ai или нажмите кнопку ниже, чтобы попробовать!open_in_newПосетите новый пользовательский интерфейс
Для лучшего опыта мы рекомендуем использовать профессиональные клиенты чата. DeepSearch полностью совместим со схемой API чата OpenAI, что делает его простым в использовании с любым совместимым с OpenAI клиентом.
DeepSearch объединяет веб-поиск, чтение и рассуждения для всестороннего исследования. Представьте себе, что это агент, которому вы даете исследовательское задание — он проводит обширный поиск и проходит через несколько итераций, прежде чем предоставить ответ.
Стандартные LLM
attach_money
около 1000 токенов
access_time
около 1с
check
Быстрые ответы на вопросы общего уровня знаний
close
Невозможно получить доступ к информации в режиме реального времени или после обучения
Ответы генерируются исключительно на основе предварительно обученных знаний с фиксированной датой окончания.
RAG и обоснованные LLM
attach_money
около 10 000 токенов
access_time
около 3с
check
Вопросы, требующие актуальной или специфической для предметной области информации
close
Проблемы со сложными вопросами, требующими многоэтапного рассуждения
Ответы, полученные путем суммирования результатов однократного поиска
Может получить доступ к текущей информации после окончания обучения
Глубокий поиск
attach_money
около 500 000 токенов
access_time
около 50-х
check
Сложные вопросы, требующие тщательного исследования и рассуждения
info
Занимает больше времени, чем простые подходы LLM или RAG
Автономный агент, который итеративно ищет, читает и рассуждает
Динамично принимает решения о следующих шагах на основе текущих результатов
Самостоятельно оценивает качество ответа перед возвращением результатов
Может выполнять глубокое погружение в темы посредством множественных циклов поиска и рассуждений.
Цены на API основаны на использовании токена. Один ключ API дает вам доступ ко всем продуктам Search Foundation.
С API Jina Search Foundation
Самый простой способ получить доступ ко всем нашим продуктам. Пополняйте токены по мере использования.
Введите ключ API, который вы хотите пополнить.
error
visibility_off
Пополните этот ключ API дополнительными токенами
В зависимости от вашего местоположения с вас может взиматься плата в долларах США, евро или других валютах. Могут взиматься налоги.
Пожалуйста, введите правильный ключ API для пополнения счета.
Понять ограничение скорости
Ограничения скорости — это максимальное количество запросов, которые можно сделать к API в течение минуты на IP-адрес/ключ API (RPM). Узнайте больше об ограничениях скорости для каждого продукта и уровня ниже.
keyboard_arrow_down
Ограничение скорости
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
Колонки
arrow_drop_down
Продукт
Конечная точка API
Описаниеarrow_upward
без API-ключаkey_off
с API-ключомkey
с премиум-ключом APIkey
Средняя задержка
Подсчет использования токенов
Разрешенный запрос
API-интерфейс читателя
https://r.jina.ai
Преобразовать URL в текст, понятный LLM
20 RPM
500 RPM
trending_up5000 RPM
7.9s
Подсчитайте количество токенов в выходном ответе.
GET/POST
API-интерфейс читателя
https://s.jina.ai
Поиск в Интернете и преобразование результатов в текст, понятный LLM
block
100 RPM
trending_up1000 RPM
2.5s
Каждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.
GET/POST
Глубокий поиск
https://deepsearch.jina.ai/v1/chat/completions
Рассуждайте, ищите и повторяйте, чтобы найти лучший ответ.
block
50 RPM
500 RPM
56.7s
Подсчитайте общее количество токенов за весь процесс.
POST
API реранкера
https://api.jina.ai/v1/rerank
Ранжировать документы по запросу
block
500 RPM & 1,000,000 TPM
trending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.
POST
Встраивание API
https://api.jina.ai/v1/embeddings
Преобразование текста/изображений в векторы фиксированной длины
block
500 RPM & 1,000,000 TPM
trending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.
POST
API классификатора
https://api.jina.ai/v1/train
Обучить классификатор с использованием маркированных примеров
Классифицируйте входные данные с помощью обученного классификатора с несколькими попытками
block
20 RPM & 200,000 TPM
60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokens
POST
API классификатора (Нулевой выстрел)
https://api.jina.ai/v1/classify
Классифицируйте входные данные, используя классификацию с нулевым результатом
block
200 RPM & 500,000 TPM
1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokens
POST
API сегментатора
https://api.jina.ai/v1/segment
Токенизация и сегментация длинного текста
20 RPM
200 RPM
1,000 RPM
0.3s
Токен не считается использованием.
GET/POST
Автоматическое пополнение при низком балансе токенов
Рекомендуется для бесперебойной работы в производстве. Когда баланс вашего токена опустится ниже установленного порога, мы автоматически пополним ваш сохраненный способ оплаты за последний приобретенный пакет, пока порог не будет достигнут.
info Мы ввели новую модель ценообразования 6 мая 2025 года. Если вы включили автоматическое пополнение счета до этой даты, вы продолжите платить старую цену (ту, которую вы приобрели). Новая цена применяется только в том случае, если вы измените настройки автоматического пополнения счета или приобретете новый ключ API.
DeepSearch — это API LLM, который выполняет итеративный поиск, чтение и рассуждения до тех пор, пока не найдет точный ответ на запрос или не достигнет лимита бюджета токенов.
Чем DeepSearch отличается от возможностей глубоких исследований OpenAI и Gemini?
keyboard_arrow_down
В отличие от OpenAI и Gemini, DeepSearch специально фокусируется на предоставлении точных ответов посредством итерации, а не на создании длинных статей. Он оптимизирован для быстрых, точных ответов из глубокого веб-поиска, а не для создания всесторонних отчетов.
Какой ключ API мне нужен для использования DeepSearch?
keyboard_arrow_down
Вам нужен ключ API Jina. Мы предлагаем 10M бесплатных токенов для новых ключей API.
Что происходит, когда DeepSearch достигает своего бюджета токенов? Возвращает ли он неполный ответ?
keyboard_arrow_down
Он генерирует окончательный ответ на основе всех накопленных знаний, а не просто отказывается от ответа или возвращает неполный ответ.
Гарантирует ли DeepSearch точные ответы?
keyboard_arrow_down
Нет. Хотя для повышения точности используется итеративный процесс поиска, оценка показывает, что он достигает 75%-ного процента успешных ответов на тестовых вопросах, что значительно лучше базового показателя в 0% (gemini-2.0-flash), но не идеально.
Сколько времени занимает типичный запрос DeepSearch?
keyboard_arrow_down
Он значительно варьируется - запросы могут занимать от 1 до 42 шагов, в среднем 4 шага на основе данных оценки. Это 20 секунд. Простые запросы могут быть решены быстро, в то время как сложные исследовательские вопросы могут включать много итераций и до 120 секунд.
Может ли DeepSearch работать с любым совместимым с OpenAI клиентом, таким как Chatwise, CherryStudio или ChatBox?
keyboard_arrow_down
Да, официальный API DeepSearch по адресу deepsearch.jina.ai/v1/chat/completions полностью совместим со схемой API OpenAI, используя 'jina-deepsearch-v1' в качестве имени модели. Поэтому очень легко переключиться с OpenAI на DeepSearch и использовать с локальными клиентами или любым клиентом, совместимым с OpenAI. Мы настоятельно рекомендуем Chatwise для бесперебойного опыта.
Каковы ограничения скорости для API?
keyboard_arrow_down
Ограничения скорости зависят от уровня ключа API и составляют от 10 RPM до 30 RPM. Это важно учитывать для приложений с большим объемом запросов.
Каково содержимое тега <think>?
keyboard_arrow_down
DeepSearch оборачивает шаги мышления в теги XML ... и затем предоставляет окончательный ответ, следуя формату потоковой передачи OpenAI, но с этими специальными маркерами для цепочки мыслей.
Использует ли DeepSearch Jina Reader для веб-поиска и чтения?
keyboard_arrow_down
Да. Jina Reader используется для веб-поиска и чтения, предоставляя системе возможность эффективного доступа и обработки веб-контента.
Почему DeepSearch использует так много токенов для моих запросов?
keyboard_arrow_down
Да, использование токенов DeepSearch в сложных запросах, возможно, высоко — в среднем 70 000 токенов по сравнению с 500 для базовых ответов LLM. Это показывает глубину исследования, но также имеет финансовые последствия.
Есть ли способ контролировать или ограничивать количество шагов?
keyboard_arrow_down
Система в первую очередь контролируется бюджетом токенов, а не количеством шагов. После превышения бюджета токенов она переходит в режим Beast Mode для генерации окончательного ответа. Проверьте reasoning_effort для получения более подробной информации.
Насколько надежны ссылки в ответах?
keyboard_arrow_down
Ссылки считаются настолько важными, что если ответ считается окончательным, но не имеет ссылок, система продолжает поиск, а не принимает ответ.
Может ли DeepSearch обрабатывать вопросы о будущих событиях?
keyboard_arrow_down
Да, но с обширными этапами исследования. Пример «кто будет президентом в 2028 году» показывает, что он может обрабатывать спекулятивные вопросы посредством нескольких итераций исследования, хотя точность таких прогнозов не гарантируется.
Ограничения скорости отслеживаются тремя способами: RPM (запросы в минуту) и TPM (токены в минуту). Ограничения применяются для каждого IP/API-ключа и срабатывают при достижении порогового значения RPM или TPM. Когда вы указываете ключ API в заголовке запроса, мы отслеживаем ограничения скорости по ключу, а не по IP-адресу.
Колонки
arrow_drop_down
Продукт
Конечная точка API
Описаниеarrow_upward
без API-ключаkey_off
с API-ключомkey
с премиум-ключом APIkey
Средняя задержка
Подсчет использования токенов
Разрешенный запрос
API-интерфейс читателя
https://r.jina.ai
Преобразовать URL в текст, понятный LLM
20 RPM
500 RPM
trending_up5000 RPM
7.9s
Подсчитайте количество токенов в выходном ответе.
GET/POST
API-интерфейс читателя
https://s.jina.ai
Поиск в Интернете и преобразование результатов в текст, понятный LLM
block
100 RPM
trending_up1000 RPM
2.5s
Каждый запрос стоит фиксированное количество токенов, начиная с 10000 токенов.
GET/POST
Глубокий поиск
https://deepsearch.jina.ai/v1/chat/completions
Рассуждайте, ищите и повторяйте, чтобы найти лучший ответ.
block
50 RPM
500 RPM
56.7s
Подсчитайте общее количество токенов за весь процесс.
POST
API реранкера
https://api.jina.ai/v1/rerank
Ранжировать документы по запросу
block
500 RPM & 1,000,000 TPM
trending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.
POST
Встраивание API
https://api.jina.ai/v1/embeddings
Преобразование текста/изображений в векторы фиксированной длины
block
500 RPM & 1,000,000 TPM
trending_up2,000 RPM & 5,000,000 TPM
ssid_chart
зависит от размера входных данных
help
Подсчитайте количество токенов во входном запросе.
POST
API классификатора
https://api.jina.ai/v1/train
Обучить классификатор с использованием маркированных примеров
Классифицируйте входные данные с помощью обученного классификатора с несколькими попытками
block
20 RPM & 200,000 TPM
60 RPM & 1,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены учитываются как: input_tokens
POST
API классификатора (Нулевой выстрел)
https://api.jina.ai/v1/classify
Классифицируйте входные данные, используя классификацию с нулевым результатом
block
200 RPM & 500,000 TPM
1,000 RPM & 3,000,000 TPM
ssid_chart
зависит от размера входных данных
Токены считаются как: input_tokens + label_tokens
POST
API сегментатора
https://api.jina.ai/v1/segment
Токенизация и сегментация длинного текста
20 RPM
200 RPM
1,000 RPM
0.3s
Токен не считается использованием.
GET/POST
Общие вопросы, связанные с API
code
Могу ли я использовать один и тот же ключ API для чтения, встраивания, переранжирования, классификации и тонкой настройки API?
keyboard_arrow_down
Да, тот же ключ API действителен для всех продуктов search foundation от Jina AI. Это включает в себя API считывателя, встраивания, переранжирования, классификации и тонкой настройки, с общими токенами для всех сервисов.
code
Могу ли я отслеживать использование токена моего ключа API?
keyboard_arrow_down
Да, использование токенов можно отслеживать на вкладке «API Key & Billing», введя свой API-ключ, что позволит вам просматривать недавнюю историю использования и оставшиеся токены. Если вы вошли в панель управления API, эти данные также можно просмотреть на вкладке «Manage API Key».
code
Что мне делать, если я забуду свой ключ API?
keyboard_arrow_down
Если вы потеряли пополненный ключ и хотите его восстановить, обратитесь в службу поддержки AT jina.ai, указав зарегистрированный адрес электронной почты, чтобы получить помощь. Рекомендуется войти в систему, чтобы ваш ключ API был надежно сохранен и легко доступен.
Нет, наши ключи API не имеют срока действия. Однако, если вы подозреваете, что ваш ключ был скомпрометирован, и хотите его удалить, обратитесь в нашу службу поддержки за помощью. Вы также можете отозвать свой ключ в панели управления ключами API.
Да, вы можете перенести токены с одного премиум-ключа на другой. После входа в свою учетную запись на панели управления ключами API используйте настройки ключа, который вы хотите перенести, чтобы переместить все оставшиеся оплаченные токены.
code
Могу ли я отозвать свой ключ API?
keyboard_arrow_down
Да, вы можете отозвать свой ключ API, если считаете, что он был скомпрометирован. Отзыв ключа немедленно отключит его для всех пользователей, которые его сохранили, а весь оставшийся баланс и связанные с ним свойства станут навсегда непригодными для использования. Если ключ является премиум-ключом, у вас есть возможность перевести оставшийся оплаченный баланс на другой ключ перед отзывом. Обратите внимание, что это действие нельзя отменить. Чтобы отозвать ключ, перейдите к настройкам ключа на панели управления ключами API.
code
Почему первый запрос для некоторых моделей выполняется медленно?
keyboard_arrow_down
Это происходит потому, что наша архитектура Serverless выгружает определенные модели в периоды низкого использования. Первоначальный запрос активирует или «разогревает» модель, что может занять несколько секунд. После этой первоначальной активации последующие запросы обрабатываются гораздо быстрее.
code
Используются ли входные данные пользователя для обучения ваших моделей?
keyboard_arrow_down
Мы придерживаемся строгой политики конфиденциальности и не используем данные пользовательского ввода для обучения наших моделей. Мы также соответствуем требованиям SOC 2 Type I и Type II, обеспечивая высокие стандарты безопасности и конфиденциальности.
Общие вопросы, связанные с выставлением счетов
attach_money
Выставление счетов зависит от количества предложений или запросов?
keyboard_arrow_down
Наша модель ценообразования основана на общем количестве обработанных токенов, что позволяет пользователям гибко распределять эти токены по любому количеству предложений, предлагая экономически эффективное решение для разнообразных требований к анализу текста.
attach_money
Доступна ли бесплатная пробная версия для новых пользователей?
keyboard_arrow_down
Мы предлагаем приветственную бесплатную пробную версию для новых пользователей, которая включает десять миллионов токенов для использования с любой из наших моделей, с помощью автоматически сгенерированного ключа API. После того, как будет достигнут лимит бесплатных токенов, пользователи могут легко приобрести дополнительные токены для своих ключей API через вкладку «Купить токены».
attach_money
Взимаются ли токены за неудачные запросы?
keyboard_arrow_down
Нет, токены не снимаются за неудачные запросы.
attach_money
Какие способы оплаты принимаются?
keyboard_arrow_down
Платежи обрабатываются через Stripe, поддерживающий для вашего удобства различные способы оплаты, включая кредитные карты, Google Pay и PayPal.
attach_money
Доступно ли выставление счетов за покупку токенов?
keyboard_arrow_down
Да, после покупки токенов на адрес электронной почты, связанный с вашей учетной записью Stripe, будет выставлен счет.
Офисы
location_on
Саннивейл, Калифорния
710 Lakeway Dr, Ste 200, Саннивейл, Калифорния 94085, США
location_on
Берлин, Германия (штаб-квартира)
Prinzessinnenstraße 19-20, 10969 Берлин, Германия
location_on
Пекин, Китай
Уровень 5, здание 6, ул. Хайдянь Вест, д. 48, Пекин, Китай
location_on
Шэньчжэнь, Китай
402, этаж 4, здание Fu'an Technology, Шэньчжэнь, Китай