Qwen3 Embedding 4b

Qwen3 Embedding 4B é um modelo de embedding multilíngue com 4 bilhões de parâmetros (36 camadas, 32K de contexto) que gera vetores de 2560 dimensões para recuperação de texto/código, classificação, agrupamento e mineração de bitexto. Ele suporta embeddings condicionados por instrução e é otimizado para aprendizado de representação eficiente e multilíngue.

Detalhes do modelo

CategoriaDetalhes
Nome do modeloQwen/Qwen3-Embedding-4B
VersãoOriginal
Categoria do modeloEmbedding
Tamanho4 bilhões de parâmetros
Modelo HuggingFaceQwen/Qwen3-Embedding-4B
Endpoint compatível com OpenAIEmbeddings
LicençaApache 2.0

Capacidades

RecursoStatus
Tamanho do contexto32k tokens
Dados de entradaTexto
Dimensões de saída256, 512, 1024, 2048, 4096

Uso

Embedding

const modelResponse = await Azion.AI.run("Qwen/Qwen3-Embedding-4B", {
"input": "A comida estava deliciosa e o garçom...",
"encoding_format": "float"
})

Exemplo de resposta:

{"id":"embd-84a83438abff420e9c785c1659ae8ad6","object":"list","created":1746821207,"model":"Qwen/Qwen3-Embedding-4B","data":[{"index":0,"object":"embedding","embedding":[0.01,...,0.005]}],"usage":{"prompt_tokens":11,"total_tokens":11,"completion_tokens":0,"prompt_tokens_details":null}}

Diferentes dimensões podem ser selecionadas definindo o parâmetro dimensions:

const modelResponse = await Azion.AI.run("qwen-qwen3-embedding-4b", {
"input": "A comida estava deliciosa e o garçom...",
"encoding_format": "float",
"dimensions": 256
})

Esquema JSON

{
"$schema": "http://json-schema.org/draft-07/schema#",
"type": "object",
"required": [
"input"
],
"properties": {
"encoding_format": {
"type": "string",
"enum": [
"float",
"base64"
]
},
"dimensions": {
"enum": [
256,
512,
1024,
2048,
4096
]
},
"input": {
"oneOf": [
{
"type": "string"
},
{
"type": "array",
"items": {
"oneOf": [
{
"type": "string"
},
{
"type": "integer"
},
{
"type": "array",
"items": {
"type": "integer"
}
}
]
}
}
]
}
}
}