Pesquisadores da DeepMind, a divisão de inteligência artificial (IA) do Google, publicaram uma nova pesquisa revolucionária apresentando a JEST (Joint Example Selection Technique). Trata-se de um método que acelera drasticamente o treinamento de modelos de IA, ao mesmo tempo em que reduz significativamente a necessidade de poder computacional.
PUBLICIDADE
Como funciona a JEST?
- A técnica utiliza dois modelos de IA: um modelo de referência pré-treinado e um modelo “aprendiz” que está sendo treinado para identificar os exemplos de dados mais valiosos.
- A JEST seleciona inteligentemente os lotes de dados mais instrutivos, tornando o treinamento de IA até 13 vezes mais rápido e 10 vezes mais eficiente do que os métodos de ponta atuais.
- Em testes comparativos, a JEST alcançou desempenho de alto nível usando apenas 10% dos dados de treinamento necessários pelos modelos líderes anteriores.
- O método permite o ” bootstrapping de qualidade de dados”, usando conjuntos de dados pequenos e bem selecionados para orientar o aprendizado em conjuntos maiores e não estruturados.
Porque isso é importante?
- O consumo massivo de energia pela IA está sob crescente escrutínio. A capacidade da JEST de reduzir drasticamente os requisitos computacionais pode ser um divisor de águas para treinar modelos de forma mais eficiente em termos de energia.
- Além disso, a capacidade de treinamento mais rápido significa que a aceleração do lançamento de modelos avançados está apenas começando.
Com a JEST, o treinamento de IA pode se tornar mais rápido, mais eficiente e muito mais ecológico. Essa inovação abre caminho para o desenvolvimento de modelos de IA ainda mais poderosos, sem sobrecarregar o meio ambiente.
Leia também: