Qwen3 Embedding 4b
Qwen3 Embedding 4B é um modelo de embedding multilíngue com 4 bilhões de parâmetros (36 camadas, 32K de contexto) que gera vetores de 2560 dimensões para recuperação de texto/código, classificação, agrupamento e mineração de bitexto. Ele suporta embeddings condicionados por instrução e é otimizado para aprendizado de representação eficiente e multilíngue.
Detalhes do modelo
Categoria | Detalhes |
---|---|
Nome do modelo | Qwen/Qwen3-Embedding-4B |
Versão | Original |
Categoria do modelo | Embedding |
Tamanho | 4 bilhões de parâmetros |
Modelo HuggingFace | Qwen/Qwen3-Embedding-4B |
Endpoint compatível com OpenAI | Embeddings |
Licença | Apache 2.0 |
Capacidades
Recurso | Status |
---|---|
Tamanho do contexto | 32k tokens |
Dados de entrada | Texto |
Dimensões de saída | 256, 512, 1024, 2048, 4096 |
Uso
Embedding
const modelResponse = await Azion.AI.run("Qwen/Qwen3-Embedding-4B", { "input": "A comida estava deliciosa e o garçom...", "encoding_format": "float"})
Exemplo de resposta:
{"id":"embd-84a83438abff420e9c785c1659ae8ad6","object":"list","created":1746821207,"model":"Qwen/Qwen3-Embedding-4B","data":[{"index":0,"object":"embedding","embedding":[0.01,...,0.005]}],"usage":{"prompt_tokens":11,"total_tokens":11,"completion_tokens":0,"prompt_tokens_details":null}}
Diferentes dimensões podem ser selecionadas definindo o parâmetro dimensions
:
const modelResponse = await Azion.AI.run("qwen-qwen3-embedding-4b", { "input": "A comida estava deliciosa e o garçom...", "encoding_format": "float", "dimensions": 256})
Esquema JSON
{ "$schema": "http://json-schema.org/draft-07/schema#", "type": "object", "required": [ "input" ], "properties": { "encoding_format": { "type": "string", "enum": [ "float", "base64" ] }, "dimensions": { "enum": [ 256, 512, 1024, 2048, 4096 ] }, "input": { "oneOf": [ { "type": "string" }, { "type": "array", "items": { "oneOf": [ { "type": "string" }, { "type": "integer" }, { "type": "array", "items": { "type": "integer" } } ] } } ] } }}