Modelos do Edge AI da Azion

Os modelos otimizados para o edge da Azion abrangem múltiplos domínios de AI, incluindo geração de texto, análise de imagem, embeddings e mais. Cada modelo é projetado para equilibrar o desempenho e a eficiência de recursos para implementação no edge.

Esta página fornece uma lista de modelos disponíveis para uso no Edge AI. Para saber mais, visite a página de referência do Edge AI.

Modelos disponíveis

E5 Mistral 7B Instruct

O modelo E5 Mistral 7B Instruct é otimizado para tarefas de embedding de texto em inglês, com capacidades para processamento multilíngue, customização flexível e manipulação de sequências de entrada longas, tornando-o adequado para aplicações complexas de processamento de linguagem natural.

Ver detalhes

Mistral 3 Small (24B AWQ)

Este é um modelo de linguagem que, embora compacto, oferece capacidades comparáveis às de modelos maiores. É ideal para agentes conversacionais, function calling, ajuste fino e inferência local com dados sensíveis.

Ver detalhes

Gemma 3

Gemma 3 é um modelo projetado para implementação rápida em dispositivos, oferecendo capacidades avançadas como suporte multilíngue, raciocínio textual e visual, janelas de contexto expandidas, chamada de função e modelos quantizados para alto desempenho.

Ver detalhes

BAAI/bge-reranker-v2-m3

Um modelo de reranking leve com fortes capacidades multilíngues. Ele é fácil de implementar, com inferência rápida.

Ver detalhes

InternVL3

InternVL3 é um Multimodal Large Language Model avançado (MLLM) com capacidades para abranger tool calling, agentes GUI, análise de imagem industrial, percepção de visão 3D e mais.

Ver detalhes

Qwen2.5 VL AWQ 3B

Um Vision Languagem Model (VLM) que oferece capacidades avançadas como análise visual, raciocínio de agente, compreensão de vídeos longos, localização visual e geração de saída estruturada. Suporta 3 bilhões de parâmetros.

Ver detalhes

Qwen2.5 VL AWQ 7B

Um Vision Languagem Model (VLM) que suporta 7 bilhões de parâmetros, oferecendo capacidades avançadas como análise visual, raciocínio de agente, compreensão de vídeo longo, localização visual e geração de saída estruturada.

Ver detalhes