E5 Mistral 7B Instruct
O modelo E5 Mistral 7B Instruct é otimizado para tarefas de embedding de texto em inglês, com capacidades para processamento multilíngue, customização flexível e manipulação de sequências de entrada longas, tornando-o adequado para aplicações complexas de processamento de linguagem natural.
Detalhes do modelo
Categoria | Detalhes |
---|---|
Nome do modelo | E5 Mistral 7B Instruct |
Versão | Original |
Categoria do modelo | Embedding |
Tamanho | 7B parâmetros |
Modelo HuggingFace | e5-mistral-7b-instruct |
Endpoint Compatível com a OpenAI | Embeddings |
Licença | MIT |
Capacidades
Recurso | Detalhes |
---|---|
Suporte a Longo Prazo da Azion (LTS) | ❌ |
Comprimento do contexto | 32k tokens |
Suporta LoRA | ✅ |
Dados de entrada | Texto |
Uso
Embedding
Este é um exemplo de como usar este modelo para gerar embeddings para entrada de texto:
const modelResponse = await Azion.AI.run("intfloat-e5-mistral-7b-instruct", { "input": "The food was delicious and the waiter...", "encoding_format": "float"})
Propriedade | Tipo | Descrição |
---|---|---|
input | string | A entrada de texto para a qual os embeddings serão gerados. |
encoding_format | string | O formato da saída do embedding. |
Exemplo de resposta:
{ "id": "embd-84a83438abff420e9c785c1659ae8ad6", "object": "list", "created": 1746821207, "model": "intfloat-e5-mistral-7b-instruct", "data": [ { "index": 0, "object": "embedding", "embedding": [0.01, ..., 0.005] } ], "usage": { "prompt_tokens": 11, "total_tokens": 11, "completion_tokens": 0, "prompt_tokens_details": null }}
Propriedade | Tipo | Descrição |
---|---|---|
id | string | Identificador único para a requisição de embedding. |
object | string | O tipo do objeto retornado. |
created | number | Carimbo de data/hora Unix que indica quando a requisição foi criada. |
model | string | O nome do modelo usado para gerar embeddings. |
data | array | Um array de objetos de resultado de embedding. |
data[].index | number | O índice do item incorporado na entrada. |
data[].object | string | O tipo de objeto no array de dados. |
data[].embedding | array | O array de números de ponto flutuante que representam o vetor de embedding. |
usage.prompt_tokens | number | Número de tokens no prompt de entrada. |
usage.total_tokens | number | Total de tokens usados na requisição. |
usage.completion_tokens | number | Tokens usados na saída do modelo. |
usage.prompt_tokens_details | string | Dados adicionais de detalhes do token. |
JSON schema
{ "$schema": "http://json-schema.org/draft-07/schema#", "type": "object", "required": [ "input" ], "properties": { "encoding_format": { "type": "string", "enum": [ "float", "base64" ] }, "dimensions": { "type": "integer" }, "input": { "oneOf": [ { "type": "string" }, { "type": "array", "items": { "oneOf": [ { "type": "string" }, { "type": "integer" }, { "type": "array", "items": { "type": "integer" } } ] } } ] } }}