Uma matéria do The New York Times trouxe à tona um polêmico método adotado por gigantes da tecnologia como Google e OpenAI: o uso de vídeos do YouTube para treinar seus modelos de inteligência artificial, como o Gemini e o GPT-4. O YouTube, propriedade do Google, proíbe expressamente essa prática, levantando questões éticas e legais sobre a coleta de dados.
Coleta Irregular de Dados
A OpenAI desenvolveu a ferramenta Whisper, capaz de transcrever áudio, e a utilizou para coletar materiais do YouTube a partir de 2021. Em vez de usar os vídeos diretamente, a empresa usou as transcrições em texto de mais de um milhão de horas de conteúdo da plataforma. Essa prática, embora os vídeos sejam públicos, viola as políticas do YouTube e os direitos dos criadores de conteúdo.
Corrida pelos Dados
A matéria destaca a corrida das grandes empresas de tecnologia pela obtenção dos maiores bancos de dados disponíveis para treinar seus modelos de IA. A busca desesperada por dados digitais essenciais para o avanço da tecnologia levou essas empresas a tomar atalhos, ignorar políticas corporativas e até debater violações legais.
Segundo o The New York Times, essas atividades refletem como todas as informações publicadas na web estão sendo utilizadas pela indústria de IA. Esse uso sem regulamentação levanta questões sobre a privacidade dos dados dos usuários e a proteção da propriedade intelectual dos criadores de conteúdo.
Impacto nas Pessoas
Sem uma regulamentação clara, as pessoas ficam vulneráveis às práticas das grandes empresas de tecnologia, que utilizam seus dados sem a devida contrapartida. O Google, por exemplo, modificou os termos de serviço de seus produtos para permitir a coleta de dados em documentos públicos no Drive e avaliações de estabelecimentos no Maps.
Diante desse cenário, surge a necessidade urgente de regulamentação para proteger os dados dos usuários e garantir que o treinamento de modelos de IA seja feito de maneira ética e legal, respeitando os direitos e a privacidade das pessoas e dos criadores de conteúdo.
Imagem: Reprodução/Freepik