No mundo das redes sociais, aquilo que você compartilha em plataformas como Instagram ou Facebook sempre foi considerado pessoal, destinado a amigos e familiares. No entanto, uma recente revelação de Mark Zuckerberg lança luz sobre uma realidade diferente. Cada postagem, vídeo e comentário que você já fez não é apenas compartilhado com seu círculo interno; é também um ativo valioso no treinamento da avançada inteligência artificial (IA) do Meta.
Estratégia do Meta para Desenvolver Modelos de Inteligência Artificial
Zuckerberg orgulhosamente exibiu a vasta biblioteca de conteúdo gerado pelo usuário durante a recente chamada de ganhos do Meta, enfatizando o volume impressionante de dados à disposição da empresa. Seus perfis em redes sociais, antes vistos como expressões pessoais, agora são fundamentais para um dos conjuntos de dados mais valorizados da Terra, de acordo com as alegações do Meta.
“No Facebook e no Instagram, existem centenas de bilhões de imagens compartilhadas publicamente e dezenas de bilhões de vídeos públicos. Estimamos que [isso] seja maior do que o conjunto de dados do Common Crawl, e as pessoas compartilham grandes números de postagens de texto público em comentários em todos os nossos serviços também.”
Mark Zuckerberg, CEO do Meta
Essa mudança marca a virada estratégica do Meta para aproveitar a extensa história de seus usuários no Instagram e no Facebook para impulsionar o desenvolvimento de ferramentas de IA bilionárias. Enquanto o Meta manteve uma posição forte no engajamento do usuário e na monetização por meio de publicidade nas últimas duas décadas, o foco agora se voltou para a reimaginação do passado – suas antigas postagens, momentos significativos da vida e atualizações são todos essenciais para a criação de IA poderosas.
A audaciosa afirmação de Zuckerberg sobre o colossal conjunto de dados do Meta coincide com um recente processo no qual o The New York Times processou a OpenAI por preocupações com propriedade intelectual. No entanto, o Meta parece estar seguindo um manual familiar, extraindo o máximo valor do vasto reservatório de conteúdo gerado pelo usuário no Instagram e no Facebook, efetivamente reivindicando a propriedade de sua identidade online.
Quem Realmente Possui o Conteúdo Gerado por Usuários nas Redes Sociais?
Surge a pergunta: O Instagram automaticamente deveria ter os direitos sobre seus dados para o desenvolvimento da IA do Meta? O debate em torno das empresas de mídia social e seus usuários no contexto da IA está apenas começando. Notavelmente, Sarah Silverman e outros editores de livros já estão tomando medidas legais contra o Meta por supostamente apropriar-se de suas ideias. Enquanto o Meta lucrou com dados do usuário por anos, a extensão com que agora está sendo utilizada é sem precedentes. Elon Musk adota uma estratégia semelhante com a X, utilizando dados do Twitter para treinar o Grok da xAI.
O Meta havia divulgado em setembro que as postagens públicas do Facebook e do Instagram estavam sendo usadas para treinar seu novo assistente de IA. Para colocar as coisas em perspectiva, o conjunto de dados do Common Crawl mencionado por Zuckerberg é composto por mais de 250 bilhões de páginas da web coletadas ao longo de 17 anos e é considerado um padrão de referência para treinamento de grandes modelos de linguagem. No entanto, o conjunto de dados do Meta tem uma vantagem – é superior, mais extenso e indiscutivelmente mais pessoal.
Essencialmente, o Meta tropeçou em uma mina de ouro dentro de seus próprios arquivos. O repositório de postagens do Facebook e do Instagram de duas décadas se tornou um dos ativos mais valiosos da empresa. Sem alarde ou notificação aos usuários, o Meta, essencialmente, reivindicou o perfil público de suas mídias sociais, pretendendo transformá-lo em um gerador de bilhões de dólares.
O Grande Modelo de Linguagem do Facebook ‘Llama’
O grande modelo de linguagem do Meta, conhecido como Llama, é aclamado como um dos melhores do cenário de IA. Este modelo está sendo utilizado para treinar diversos produtos, incluindo Meta AI e Imagine, com o objetivo de integrar essas capacidades de IA ao Facebook, Instagram e ao crescente Metaverso nos próximos anos.
Aliás, o Code Llama é de Código Aberto e acabou de anunciar a versão 70b, saiba mais aqui.Para mais informações e documentação, os usuários interessados podem explorar o GitHub e o Hugging Face.