Plano de Governança de Dados para Sistemas de IA

Organização: [Nome da organização]

Departamento responsável: [Departamento]

Versão: [1.0]

Data: [DD/MM/AAAA]

Próxima revisão: [DD/MM/AAAA]

Base legal: Artigo 10.º (Dados e governança de dados) do Regulamento (UE) 2024/1689 (AI Act). Requisito obrigatório para todos os sistemas de IA de alto risco. Deve ser lido em conjunto com o RGPD (Regulamento (UE) 2016/679) e a Lei n.º 58/2019.

1. Objetivo e âmbito

Este plano estabelece as práticas de governança de dados aplicáveis aos conjuntos de dados utilizados para treino, validação e teste de sistemas de IA de alto risco, conforme exigido pelo Artigo 10.º do AI Act.

Abrange todo o ciclo de vida dos dados: recolha, anotação, armazenamento, processamento, utilização nos sistemas de IA e eliminação.

1.1 Sistemas de IA abrangidos

ID Sistema	Nome	Classificação de risco	Dados utilizados	Volume aproximado
[ID]	[Nome]	[Alto risco - Anexo III, área X]	[Tipo de dados]	[Volume]
[ID]	[Nome]	[Alto risco - Anexo III, área X]	[Tipo de dados]	[Volume]

2. Práticas de governança de dados (Art. 10.º, n.º 2)

2.1 Decisões de conceção dos dados

[Documentar as decisões de conceção relevantes, incluindo a escolha dos conjuntos de dados, a seleção de fontes de dados e a justificação para as opções tomadas]

2.2 Recolha de dados

Aspeto	Descrição
Fontes de dados	[Listar todas as fontes: bases de dados internas, datasets públicos, fornecedores terceiros, dados recolhidos diretamente]
Base legal para recolha	[RGPD: consentimento, interesse legítimo, execução de contrato, obrigação legal, etc.]
Procedimentos de recolha	[Descrever métodos de recolha, frequência e responsáveis]
Avaliação ética	[Descrever processo de avaliação ética da recolha de dados]

2.3 Preparação dos dados (pré-processamento)

Anotação: procedimentos de rotulagem documentados, controlo de qualidade das anotações
Limpeza: identificação e tratamento de dados em falta, erros e inconsistências
Normalização: padronização de formatos, escalas e unidades
Deduplicação: remoção de registos duplicados
Transformação: engenharia de features, agregações e derivações documentadas
Anonimização/pseudonimização: técnicas aplicadas para proteção de dados pessoais

2.4 Formulação de pressupostos (Art. 10.º, n.º 2, al. c)

[Documentar os pressupostos relativos à informação que os dados devem medir e representar. Incluir limitações conhecidas dos dados e potenciais lacunas]

2.5 Avaliação de disponibilidade, quantidade e adequação

[Avaliar se os dados disponíveis são suficientes em quantidade e adequados em qualidade para a finalidade prevista do sistema de IA]

3. Propriedades dos conjuntos de dados (Art. 10.º, n.º 3)

3.1 Relevância e representatividade

Requisito	Como é assegurado	Métricas
Relevância para a finalidade prevista	[Descrever]	[Métricas]
Representatividade geográfica	[Descrever]	[Métricas]
Representatividade demográfica	[Descrever]	[Métricas]
Cobertura de cenários de utilização	[Descrever]	[Métricas]

3.2 Ausência de erros e completude

Verificação	Método	Frequência	Responsável
Validação de integridade	[Checksums, validação de schema, etc.]	[Frequência]	[Responsável]
Deteção de anomalias	[Métodos estatísticos, regras de negócio]	[Frequência]	[Responsável]
Verificação de completude	[Análise de missing values, cobertura]	[Frequência]	[Responsável]

4. Deteção e mitigação de viés (Art. 10.º, n.º 2, al. f-g)

4.1 Identificação de possíveis vieses

Tipo de viés	Descrição	Risco identificado	Medida de mitigação
Viés de seleção	Dados não representam adequadamente a população-alvo	[Avaliação]	[Medida]
Viés de medição	Erros sistemáticos na recolha ou medição dos dados	[Avaliação]	[Medida]
Viés de confirmação	Dados refletem preconceitos existentes na sociedade	[Avaliação]	[Medida]
Viés de sobrevivência	Dados apenas de casos bem-sucedidos ou visíveis	[Avaliação]	[Medida]

4.2 Categorias especiais de dados pessoais (Art. 10.º, n.º 5)

Artigo 10.º, n.º 5: O tratamento de categorias especiais de dados pessoais (Art. 9.º RGPD) para deteção e correção de viés é permitido na medida do estritamente necessário, sujeito a garantias adequadas incluindo limitações técnicas de reutilização, medidas de segurança avançadas e pseudonimização.

Categoria especial	Utilizada?	Justificação	Salvaguardas
Origem racial ou étnica	[Sim/Não]	[Justificação]	[Salvaguardas]
Género	[Sim/Não]	[Justificação]	[Salvaguardas]
Idade	[Sim/Não]	[Justificação]	[Salvaguardas]
Deficiência	[Sim/Não]	[Justificação]	[Salvaguardas]

5. Separação de conjuntos de dados

Conjunto	Proporção	Finalidade	Método de separação
Treino	[ex: 70%]	Treino do modelo de IA	[Random split, stratified, temporal, etc.]
Validação	[ex: 15%]	Ajuste de hiperparâmetros e seleção de modelo	[Método]
Teste	[ex: 15%]	Avaliação final de desempenho	[Método]

6. Armazenamento e segurança dos dados

Aspeto	Descrição
Localização do armazenamento	[On-premise, cloud (qual provider), híbrido - localização geográfica]
Encriptação em repouso	[Algoritmo, gestão de chaves]
Encriptação em trânsito	[TLS versão, certificados]
Controlo de acesso	[RBAC, princípio do menor privilégio, MFA]
Backup e recuperação	[Frequência, RPO, RTO]

6.1 Rastreabilidade e linhagem dos dados

Sistema de linhagem de dados implementado para rastrear origem, transformações e utilização
Versionamento de conjuntos de dados com identificadores únicos
Logs de acesso e modificação dos dados mantidos
Documentação de todas as transformações e pipelines de dados

7. Retenção e eliminação

Tipo de dados	Período de retenção	Método de eliminação	Base legal
Dados de treino	[Período]	[Eliminação segura]	[Base legal]
Dados de validação/teste	[Período]	[Eliminação segura]	[Base legal]
Metadados e logs	[Período]	[Eliminação segura]	[Base legal]
Documentação de governança	Mínimo 10 anos após retirada do sistema	Arquivo	AI Act

8. Responsabilidades

Papel	Responsabilidades de governança de dados
Data Owner	Responsável pelos conjuntos de dados, aprovação de utilizações, qualidade dos dados
Data Steward	Gestão operacional dos dados, controlo de qualidade, manutenção de metadados
Engenheiro de dados	Implementação de pipelines, transformações, armazenamento e segurança técnica
Cientista de dados/ML Engineer	Preparação de dados para modelos, deteção de viés, validação de representatividade
DPO	Conformidade RGPD, avaliação de impacto, supervisão de dados pessoais
Responsável de conformidade IA	Verificar cumprimento do Art. 10.º, documentação para avaliação de conformidade

9. Aprovação

Elaborado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura

Aprovado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura