O Google lançou nesta quarta-feira (6) o Gemini, um conjunto de ferramentas de inteligência artificial (IA) multimídia pode ser utilizado tanto por consumidores quanto por empresas. A nova tecnologia apresenta três versões: Nano, Pro e Ultra, cada uma com diferentes recursos e capacidades.
A versão mais avançada, Gemini Ultra, é a mais notável. Essa versou apresentou ótimos resultados em vários testes populares e em benchmarks, igualando ou superando o desempenho humano em alguns casos.
O Gemini se destaca pelo seu treinamento “nativamente multimodal”, que possibilita a combinação de várias formas de dados, como texto, imagens e até áudio. Dessa forma, ele se aproxima de outros modelos de inteligência artificial atuais, como o GPT-4 Vision, que permite processar imagens e um módulo de codificação especial para cálculos.
O conjunto de ferramentas já está disponível para ser utilizado com o Bard a partir dessa quarta-feira, mas a versão Ultra será lançada somente em 2024. A estimativa da empresa é lançar Gemini em mais de 170 idiomas diferentes.