Skip to content

Эмбеддинги

Эндпоинт POST /v1/embeddings совместим с OpenAI Embeddings API.

Пример

python
from openai import OpenAI

client = OpenAI(base_url="https://api.example.com/v1", api_key="sk-llmgw-...")

resp = client.embeddings.create(
    model="openai/text-embedding-3-large",
    input=["Привет, мир", "llmgw шлюз"],
)
for item in resp.data:
    print(len(item.embedding), item.embedding[:4])

Доступные модели

  • openai/text-embedding-3-large — 3072 dim, лучший mAP.
  • openai/text-embedding-3-small — 1536 dim, дешёвая опция.
  • cohere/embed-multilingual-v3 — мультиязычные эмбеддинги.
  • voyage/voyage-3 — оптимизирована под код и документы.

Полный список с актуальными ценами доступен в каталоге моделей кабинета.

Батчи

Передавайте input массивом — шлюз отправит один запрос провайдеру и сэкономит сетевые накладные. Лимит upstream обычно 2048 элементов на запрос.

© llmgw