Tendo já treinado os seus modelos de inteligência artificial (IA) em toda a Internet, a OpenAI está procurando dados específicos de domínio para aprimorar ainda mais o conhecimento destes sistemas – e está pedindo ajuda do público.
A criadora do ChatGPT disse que trabalhará com organizações para produzir conjuntos de dados públicos e privados sob um novo programa – o OpenAI Data Partnerships – para treinar modelos como o GPT-4 e o novo GPT-4 Turbo .
A OpenAI está interessada em ajudar a organizar conjuntos de dados em grande escala que “reflitam a sociedade humana e que ainda não sejam facilmente acessíveis online ao público hoje”.
A empresa afirmou que pode trabalhar com “qualquer” modalidade ou forma de conteúdo, incluindo texto, imagens, áudio e vídeo. A OpenAI revelou que gostaria de dados que “expressassem a intenção humana” – como textos ou conversas longas, em vez de trechos desconectados.
No entanto, a OpenAI não deseja trabalhar com conjuntos de dados com informações confidenciais ou pessoais ou que pertençam a terceiros.
Em vez disso, a empresa deseja construir um conjunto de dados de código aberto para modelos de treinamento que qualquer pessoa possa usar. A OpenAI também está interessada em preparar conjuntos de dados privados para treinar modelos proprietários de IA.
Para se inscrever, clique aqui .
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 18:22
O mais recente modelo experimental Gemini da Google (1121) acabou de recuperar o primeiro lugar…
A OpenAI está considerando desenvolver um navegador web que se integraria ao ChatGPT e aos…
O Google DeepMind acaba de apresentar o AlphaQubit, um sistema de inteligência artificial (IA) que…
Um código recém-descoberto na última versão beta do ChatGPT sugere que a OpenAI pode estar…
A empresa chinesa de pesquisa em inteligência artificial (IA), DeepSeek, acaba de lançar o R1-Lite-Preview,…
A OpenAI e a parceira sem fins lucrativos Common Sense Media lançaram um curso de…