Nova IA de código aberto Hermes 3 promete avanços significativos no processamento de linguagem natural
O Hermes 3 é um novo modelo de linguagem de inteligência artificial lançado recentemente pela Nous Research em parceria com a Lambda Labs. Aqui estão os principais pontos sobre o Hermes 3:
Características principais
- É baseado no modelo Llama 3.1 da Meta, sendo uma versão de código aberto e otimizada deste[1].
- Disponível em três tamanhos: 8 bilhões, 70 bilhões e 405 bilhões de parâmetros[5].
- Foca em capacidades avançadas de raciocínio, criatividade e processamento de linguagem natural[1].
Capacidades
- Retenção de contexto de longo prazo e habilidade em conversas de múltiplos turnos[1].
- Habilidades complexas de interpretação de papéis e monólogo interno[1].
- Capacidades aprimoradas de função-calling e geração de saídas estruturadas[4].
- Geração de código com alta proficiência, incluindo explicações detalhadas e documentação[5].
Diferenciais
- Utiliza o formato de prompt ChatML, permitindo maior controle e direcionamento do modelo[4].
- Pesos abertos e não censurados, oferecendo maior flexibilidade de customização[5].
- Demonstra desempenho competitivo ou superior ao Llama 3.1 em benchmarks gerais[4].
Acesso e uso
- Disponível gratuitamente através da API da Lambda Labs[5].
- Pode ser instalado e executado localmente em máquinas com GPU adequada[6].
- Acessível via interface Discord para testes e experimentações[3].
O Hermes 3 representa um avanço significativo em modelos de IA de código aberto, oferecendo capacidades avançadas de processamento de linguagem natural e resolução de problemas complexos, com foco em alinhamento com o usuário e controle aprimorado.
Citations:
[1] https://nousresearch.com/hermes3/
[2] https://github.com/bendudson/hermes-3
[3] https://www.aixploria.com/en/hermes-3-llm-model/
[4] https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B-GGUF
[5] https://siliconangle.com/2024/08/15/hermes-3-super-creative-version-open-source-llama-3-1-llm-struggles-inner-conflict/
[6] https://www.youtube.com/watch?v=8K9CflWOK2g
[7] https://www.youtube.com/watch?v=ODEQ-pnP4F4
[8] https://blog.saninternet.com/inteligencia-artificial