O processo de criação de uma definição oficial de IA de código aberto vem progredindo, e agora a Open Source Initiative (OSI) — o grupo que lidera esse esforço — anunciou o Release Candidate 1 para a definição. O OSI iniciou o processo de criação desta definição em 2022 e, no ano passado, viajou pelo mundo para coletar feedback e mais contribuições sobre o rascunho da definição.
O Lançamento do Release Candidate 1
O grupo escreveu em seu anúncio que este lançamento foi o resultado de "muito feedback da comunidade: 5 reuniões públicas, vários comentários no fórum e no rascunho, e conversas pessoais em eventos na Áustria, China, Índia, Gana e Argentina". Agora que este primeiro candidato a lançamento está disponível, quaisquer atualizações futuras serão apenas correções de bugs, não novos recursos reais.
Os Critérios da Definição de IA de Código Aberto
Geralmente, a Definição de IA de Código Aberto especifica que um sistema de IA é de código aberto se atender aos seguintes critérios:
- Qualquer pessoa pode usá-lo para qualquer propósito sem precisar pedir permissão
- Qualquer pessoa pode estudar como o sistema funciona ou inspecionar seus componentes
- Qualquer pessoa pode modificar o sistema para qualquer propósito
- Qualquer pessoa pode compartilhar o sistema com ou sem modificações, para qualquer finalidade
As Principais Mudanças
De acordo com o OSI, houve três mudanças desde o último lançamento, todas relacionadas à "forma preferida de fazer modificações em um sistema de aprendizado de máquina".
Informações de Dados
A primeira e mais notável é que há uma nova linguagem em torno das Informações de Dados para esclarecer que os dados de treinamento devem ser compartilhados e divulgados.
Código de Treinamento
Segundo, agora especifica que o código deve ser completo o suficiente para que os destinatários downstream possam entender como o treinamento foi feito. "O treinamento é onde a inovação está acontecendo no momento e é por isso que você não vê corporações divulgando seu código de treinamento e processamento de dados. Acreditamos, dado o status atual do conhecimento e da prática, que isso é necessário para bifurcar (estudar e modificar) significativamente os sistemas de IA", escreveu o OSI.
Licenciamento Copyleft
Terceiro, o novo texto especifica que "é admissível exigir termos do tipo copyleft para qualquer um dos Códigos, Informações de Dados e Parâmetros, individualmente ou como combinações agrupadas". Por exemplo, um consórcio que detém os direitos do código de treinamento e do conjunto de dados poderia distribuí-los de uma forma que os agrupe com disposições do tipo copyleft.
O Objetivo da Definição
Em seu anúncio, o OSI reforçou ainda mais a ideia de que o objetivo do código aberto (e também da IA de código aberto) não é permitir software reproduzível, mas sim dar a qualquer um a capacidade de bifurcar um sistema.
"É por isso que o OSD #2 exige que o "código-fonte" seja fornecido no formato preferido para fazer modificações", escreveu a organização. "Dessa forma, todos têm os mesmos direitos e capacidade de melhorar o sistema que os desenvolvedores originais, iniciando um ciclo virtuoso de inovação. Bifurcação no contexto de aprendizado de máquina tem o mesmo significado que com software: ter a capacidade e os direitos de construir um sistema que se comporta de forma diferente de seu status original. As coisas que uma bifurcação pode alcançar são: corrigir problemas de segurança, melhorar o comportamento, remover viés. Tudo isso é possível graças aos requisitos da Definição de IA de Código Aberto."
Próximos Passos
Daqui para frente, o OSI se concentrará na criação da documentação, Checklist e FAQ do Open Source AI Definition. O lançamento oficial 1.0 é esperado para 28 de outubro.