Modelos do Edge AI da Azion
Os modelos otimizados para o edge da Azion abrangem múltiplos domínios de AI, incluindo geração de texto, análise de imagem, embeddings e mais. Cada modelo é projetado para equilibrar o desempenho e a eficiência de recursos para implantação no edge.
Esta página fornece uma lista de modelos disponíveis para uso no Edge AI. Para saber mais, visite a página de referência do Edge AI.
Modelos disponíveis
E5 Mistral 7B Instruct
O modelo E5 Mistral 7B Instruct é otimizado para tarefas de embedding de texto em inglês, com capacidades para processamento multilíngue, customização flexível e manipulação de sequências de entrada longas, tornando-o adequado para aplicações complexas de processamento de linguagem natural.
Ver detalhesMistral 3 Small (24B AWQ)
Este é um modelo de linguagem que, embora compacto, oferece capacidades comparáveis às de modelos maiores. É ideal para agentes conversacionais, function calling, ajuste fino e inferência local com dados sensíveis.
Ver detalhesGemma 3
Gemma 3 é um modelo projetado para implantação rápida em dispositivos, oferecendo capacidades avançadas como suporte multilíngue, raciocínio textual e visual, janelas de contexto expandidas, chamada de função e modelos quantizados para alto desempenho.
Ver detalhesBAAI/bge-reranker-v2-m3
Um modelo de reranking leve com fortes capacidades multilíngues. Ele é fácil de implantar, com inferência rápida.
Ver detalhesFlorence 2 Large
Florence 2 é um modelo fundacional de visão avançado que utiliza uma abordagem baseada em prompts e um conjunto de dados massivo para se destacar em várias tarefas de visão e linguagem de visão.
Ver detalhesQwen2.5 VL AWQ 3B
Um Vision Languagem Model (VLM) que oferece capacidades avançadas como análise visual, raciocínio de agente, compreensão de vídeos longos, localização visual e geração de saída estruturada. Suporta 3 bilhões de parâmetros.
Ver detalhesQwen2.5 VL AWQ 7B
Um Vision Languagem Model (VLM) que suporta 7 bilhões de parâmetros, oferecendo capacidades avançadas como análise visual, raciocínio de agente, compreensão de vídeo longo, localização visual e geração de saída estruturada.
Ver detalhes