Plano de Governança de Dados para Sistemas de IA

Organização: [Nome da organização]

Departamento responsável: [Departamento]

Versão: [1.0]

Data: [DD/MM/AAAA]

Próxima revisão: [DD/MM/AAAA]

Base legal: Artigo 10.º (Dados e governança de dados) do Regulamento (UE) 2024/1689 (AI Act). Requisito obrigatório para todos os sistemas de IA de alto risco. Deve ser lido em conjunto com o RGPD (Regulamento (UE) 2016/679) e a Lei n.º 58/2019.

1. Objetivo e âmbito

Este plano estabelece as práticas de governança de dados aplicáveis aos conjuntos de dados utilizados para treino, validação e teste de sistemas de IA de alto risco, conforme exigido pelo Artigo 10.º do AI Act.

Abrange todo o ciclo de vida dos dados: recolha, anotação, armazenamento, processamento, utilização nos sistemas de IA e eliminação.

1.1 Sistemas de IA abrangidos

ID SistemaNomeClassificação de riscoDados utilizadosVolume aproximado
[ID][Nome][Alto risco - Anexo III, área X][Tipo de dados][Volume]
[ID][Nome][Alto risco - Anexo III, área X][Tipo de dados][Volume]

2. Práticas de governança de dados (Art. 10.º, n.º 2)

2.1 Decisões de conceção dos dados

[Documentar as decisões de conceção relevantes, incluindo a escolha dos conjuntos de dados, a seleção de fontes de dados e a justificação para as opções tomadas]

2.2 Recolha de dados

AspetoDescrição
Fontes de dados[Listar todas as fontes: bases de dados internas, datasets públicos, fornecedores terceiros, dados recolhidos diretamente]
Base legal para recolha[RGPD: consentimento, interesse legítimo, execução de contrato, obrigação legal, etc.]
Procedimentos de recolha[Descrever métodos de recolha, frequência e responsáveis]
Avaliação ética[Descrever processo de avaliação ética da recolha de dados]

2.3 Preparação dos dados (pré-processamento)

2.4 Formulação de pressupostos (Art. 10.º, n.º 2, al. c)

[Documentar os pressupostos relativos à informação que os dados devem medir e representar. Incluir limitações conhecidas dos dados e potenciais lacunas]

2.5 Avaliação de disponibilidade, quantidade e adequação

[Avaliar se os dados disponíveis são suficientes em quantidade e adequados em qualidade para a finalidade prevista do sistema de IA]

3. Propriedades dos conjuntos de dados (Art. 10.º, n.º 3)

3.1 Relevância e representatividade

RequisitoComo é asseguradoMétricas
Relevância para a finalidade prevista[Descrever][Métricas]
Representatividade geográfica[Descrever][Métricas]
Representatividade demográfica[Descrever][Métricas]
Cobertura de cenários de utilização[Descrever][Métricas]

3.2 Ausência de erros e completude

VerificaçãoMétodoFrequênciaResponsável
Validação de integridade[Checksums, validação de schema, etc.][Frequência][Responsável]
Deteção de anomalias[Métodos estatísticos, regras de negócio][Frequência][Responsável]
Verificação de completude[Análise de missing values, cobertura][Frequência][Responsável]

4. Deteção e mitigação de viés (Art. 10.º, n.º 2, al. f-g)

4.1 Identificação de possíveis vieses

Tipo de viésDescriçãoRisco identificadoMedida de mitigação
Viés de seleçãoDados não representam adequadamente a população-alvo[Avaliação][Medida]
Viés de mediçãoErros sistemáticos na recolha ou medição dos dados[Avaliação][Medida]
Viés de confirmaçãoDados refletem preconceitos existentes na sociedade[Avaliação][Medida]
Viés de sobrevivênciaDados apenas de casos bem-sucedidos ou visíveis[Avaliação][Medida]

4.2 Categorias especiais de dados pessoais (Art. 10.º, n.º 5)

Artigo 10.º, n.º 5: O tratamento de categorias especiais de dados pessoais (Art. 9.º RGPD) para deteção e correção de viés é permitido na medida do estritamente necessário, sujeito a garantias adequadas incluindo limitações técnicas de reutilização, medidas de segurança avançadas e pseudonimização.
Categoria especialUtilizada?JustificaçãoSalvaguardas
Origem racial ou étnica[Sim/Não][Justificação][Salvaguardas]
Género[Sim/Não][Justificação][Salvaguardas]
Idade[Sim/Não][Justificação][Salvaguardas]
Deficiência[Sim/Não][Justificação][Salvaguardas]

5. Separação de conjuntos de dados

ConjuntoProporçãoFinalidadeMétodo de separação
Treino[ex: 70%]Treino do modelo de IA[Random split, stratified, temporal, etc.]
Validação[ex: 15%]Ajuste de hiperparâmetros e seleção de modelo[Método]
Teste[ex: 15%]Avaliação final de desempenho[Método]

6. Armazenamento e segurança dos dados

AspetoDescrição
Localização do armazenamento[On-premise, cloud (qual provider), híbrido - localização geográfica]
Encriptação em repouso[Algoritmo, gestão de chaves]
Encriptação em trânsito[TLS versão, certificados]
Controlo de acesso[RBAC, princípio do menor privilégio, MFA]
Backup e recuperação[Frequência, RPO, RTO]

6.1 Rastreabilidade e linhagem dos dados

7. Retenção e eliminação

Tipo de dadosPeríodo de retençãoMétodo de eliminaçãoBase legal
Dados de treino[Período][Eliminação segura][Base legal]
Dados de validação/teste[Período][Eliminação segura][Base legal]
Metadados e logs[Período][Eliminação segura][Base legal]
Documentação de governançaMínimo 10 anos após retirada do sistemaArquivoAI Act

8. Responsabilidades

PapelResponsabilidades de governança de dados
Data OwnerResponsável pelos conjuntos de dados, aprovação de utilizações, qualidade dos dados
Data StewardGestão operacional dos dados, controlo de qualidade, manutenção de metadados
Engenheiro de dadosImplementação de pipelines, transformações, armazenamento e segurança técnica
Cientista de dados/ML EngineerPreparação de dados para modelos, deteção de viés, validação de representatividade
DPOConformidade RGPD, avaliação de impacto, supervisão de dados pessoais
Responsável de conformidade IAVerificar cumprimento do Art. 10.º, documentação para avaliação de conformidade

9. Aprovação

Elaborado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura

Aprovado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura