Qwen3 Embedding 4b
Qwen3 Embedding 4B é um modelo de embedding multilíngue com 4 bilhões de parâmetros (36 camadas, 32K de contexto) que gera vetores de 2560 dimensões para recuperação de texto/código, classificação, agrupamento e mineração de bitexto. Ele suporta embeddings condicionados por instrução e é otimizado para aprendizado de representação eficiente e multilíngue.
Detalhes do modelo
| Categoria | Detalhes |
|---|---|
| Nome do modelo | Qwen/Qwen3-Embedding-4B |
| Versão | Original |
| Categoria do modelo | Embedding |
| Tamanho | 4 bilhões de parâmetros |
| Modelo HuggingFace | Qwen/Qwen3-Embedding-4B |
| Endpoint compatível com OpenAI | Embeddings |
| Licença | Apache 2.0 |
Capacidades
| Recurso | Status |
|---|---|
| Tamanho do contexto | 32k tokens |
| Dados de entrada | Texto |
| Dimensões de saída | 256, 512, 1024, 2048, 4096 |
Uso
Embedding
const modelResponse = await Azion.AI.run("Qwen/Qwen3-Embedding-4B", { "input": "A comida estava deliciosa e o garçom...", "encoding_format": "float"})Exemplo de resposta:
{"id":"embd-84a83438abff420e9c785c1659ae8ad6","object":"list","created":1746821207,"model":"Qwen/Qwen3-Embedding-4B","data":[{"index":0,"object":"embedding","embedding":[0.01,...,0.005]}],"usage":{"prompt_tokens":11,"total_tokens":11,"completion_tokens":0,"prompt_tokens_details":null}}Diferentes dimensões podem ser selecionadas definindo o parâmetro dimensions:
const modelResponse = await Azion.AI.run("qwen-qwen3-embedding-4b", { "input": "A comida estava deliciosa e o garçom...", "encoding_format": "float", "dimensions": 256})Esquema JSON
{ "$schema": "http://json-schema.org/draft-07/schema#", "type": "object", "required": [ "input" ], "properties": { "encoding_format": { "type": "string", "enum": [ "float", "base64" ] }, "dimensions": { "enum": [ 256, 512, 1024, 2048, 4096 ] }, "input": { "oneOf": [ { "type": "string" }, { "type": "array", "items": { "oneOf": [ { "type": "string" }, { "type": "integer" }, { "type": "array", "items": { "type": "integer" } } ] } } ] } }}