Nature & SpaceNature & Space

Maritaca AI é uma empresa brasileira que desenvolve inteligências artificiais, equivalente ao Gemini do Google, e ao ChatGPT, especializadas em domínios e idiomas, com ênfase ao processamento de linguagem natural em português.

​​

Criadora do primeiro chatbot 100% brasileiro, a Empresa foi lançada em abril de 2023, um mês antes do chatbot da OpenAI chegar ao mercado oficialmente; plataforma está disponível em chat.maritaca.ai

Uma equipe de pesquisadores da Universidade Estadual de Campinas (Unicamp) atuou no desenvolvimento, com apoio do governo federal no plano nacional de IA.

Alem de falar e “pensar” em português, O chatbot brasileiro é especialista em questões sobre o Brasil. O jeito brasileiro representa uma vantagem sobre o concorrente de outros países.

Ela foi treinada na língua portuguesa e com base de dados da cultura brasileira.

Nature & SpaceNature & Space

Os criadores do MariTalk perceberam que, ao ser treinado com base de dados da língua na qual quer se especializar, o modelo apresentava melhora robusta, enquanto o ChatGPT é alimentado em inglês, embora possa responder em português.

Os criadores do MariTalk perceberam que são mais robustos os modelos treinados na língua em que querem se especializar—ainda que responda em português, o ChatGPT foi alimentado em inglês.

Símbolo da Maritaca IA, modelo de linguagem brasileiro Imagem: Divulgação/Maritaca IA

Da pesquisa básica ao desenvolvimento de uma IA de alto desempenho

O projeto surgiu durante um doutorado realizado por Rodrigo Nogueira, CEO e fundador da Maritaca, de 2014 a 2019, em Nova York (EUA), quando foi orientado por uns dos desenvolvedores dos algoritmos utilizados nos chatbots de hoje.

De volta ao Brasil, ele notou que os chatbots performam melhor em sua língua nativa.

Da esquerda para direita: Thales, Ramon, Rodrigo, Thiago e Hugo são pesquisadores da Unicamp que formam a startup Maritaca AI Imagem: Arquivo Pessoal do pesquisador

Foi, então, que ele teve a ideia de criar um sistema nacional como publicação científica e lançou a Maritaca em outubro de 2022 – um mês antes do lançamento comercial do ChatGPT. O modelo, chamado de Sabiá, se tornou interface em 2023, quando ganhou o nome de MariTalk.

“Alfabetizado” em português, Nogueira explica que o chatbot brasileiro tem mais facilidade para entender gírias e contextos do país, mas também pode trazer pontos de vista específicos da região, os chamados vieses:

MariTalk é o chatbot da Maritaca AI, alimentando com os modelos de linguagem Sabiá (Imagem: Maritaca AI

Com o sucesso do chatbot, a Maritaca recebeu recentemente um aporte na ordem de milhões (Nogueira não revela o valor), para expandir seus serviços em APIs.

O pesquisador acredita que existe espaço no mercado público e privado do Brasil para contratação de serviços personalizados de inteligência artificial com especificardes culturais, mercado e saberes locais.

Como MariTalk foi treinada para ser especialista no Brasil

O CEO da Maritaca AI lembrou que há uma mudança de paradigma importante no mundo da IA que norteia essa especialização. Antes, a tecnologia era usada para obter informações para que cada usuário tome as melhores decisões. Agora, a IA toma decisões por nós.

Nesse caso, uma ferramenta internacional, como o ChatGPT, pode até saber de tudo, mas não tem o conhecimento específico do cenário nacional, não sendo tão proveitosa para uma empresa brasileira, por exemplo.

Interface do MariTalk — Foto: Maritalk IA

Segundo a empresa, o treinamento é feito com dados públicos da internet, como documentos brasileiros, e acontece em duas etapas:

  • Na primeira, os modelos são treinados de maneira auto-supervisionada em grandes quantidades de texto. Ou seja, a IA aprende a prever a próxima palavra e, assim, formar contexto;
  • Na segunda, os modelos são ensinados a compreender e seguir instruções específicas e a produzir respostas confiáveis e seguras.

Para chegar ao estágio atual — gratuito para qualquer usuário-, a Maritaca AI recebeu R$ 20 milhões de investimentos do Google. O dinheiro foi oferecido em crédito para uso em uma rede de supercomputadores do Google especializados em treinamento de redes neurais de IAs. Seis meses custam US$ 1 milhão.

Avaliação de Custo e desempenho comprovada da Maritalk

O preço é outra vantagem da IA brasileira. Veja uma comparação do valor e desempenho do MariTalk vs os modelos de linguagem que alimentam o ChatGPT e o Claude.

Desempenho da MariTalk em comparação a outras IAs generativas, divulgado no site da Maritaca AI Imagem: Reprodução/ Maritaca AI

O desempenho do MariTalk com o modelo de linguagem mais avançado da startup, o Sabiá-3, foi comprovado usando vestibulares brasileiros, como o Enem, as provas da Unicamp e da USP, o Enade e a OAB.

A Maritaca AI admite que perde para a IA da OpenAI apenas quando o assunto são temas genéricos, como matemática, já que a ferramenta ‘gringa’ foi treinada justamente com dados generalistas.

Conhecimento em Geografia e História do Brasil O ChatGPT, em média, acerta de 45% a 50% das questões. O MariTalk é uns 20% maior. Perguntas de conhecimento do Brasil a Maritalk sabe mais. Grafico: Maritalk IA

Rodrigo Nogueira deu exemplo de algumas das aplicações do MariTalk e falou sobre o que espera do futuro da IA brasileira:

Hoje, o modelo realiza tarefas como auxílio na escrita de texto, tradução, escrita de programas de computador e sugestão de ideias para negócios.

Política de Uso 

A reprodução de matérias é livre mediante a citação do título do texto com link apontando para este texto. Crédito do site Nature & Space  

MARITACA: IA CRIADA NA UNICAMP, BRASIL, TEM ALTO DESEMPENHO​

Bibliografia

Maritaca AI Inteligência Artificial  para o Brasil

Olhar Digital

ChatGPT brasileiro: conheça MariTalk, IA gratuita e especialista no país

Tilt

Chatbot ‘alfabetizado’ no Brasil supera ChatGPT, mas perde em matemática

Época Negócios

Conheça o MariTalk, ChatGPT brasileiro criado por pesquisadores da Unicamp

2 COMMENTS

  1. Só falta criar uma mídia social como o Facebook, evitando que aquele Zuckfascista libere somente as notícias de seu interesse (apoiando a direita, igual o musk)

    • De fato Élio, o Brasil, e todos países precisam cuidar da Soberania Digital. Isso faz parte também da independência politica. è importante ter empresas externas no país na área, mas é igualmente ter as próprias empresas nacionais atuando no setor, para que todos tenham opção, e seja evitado abusos de interferências externas na vida política. Nenhuma tecnologia é neutra. cada tecnologia tem escolhas e dilemas por trás. Outro fator não menos importante é a proteção da Economia de dados e da Economia Digital. A Economia digital já é maior que a economia tradicional em muitos países. Dados são o ouro moderno. Países estão sendo explorados com a mineração de dados sem receber nada em troca. E os serviços e a indústria digital estão potencializando tudo, multiplicando a produtividade, acelerando processos, melhorando, inovando, viabilizando. No caso dessa IA brasileira, o Governo federal criou um Programa de apoio a esse tipo de inovação. Tudo é muito recente e veloz. Bem vindo a Nature & Space. Nosso conteúdo é multidisciplinar

LEAVE A REPLY

Please enter your comment!
Please enter your name here