Organização: [Nome da organização]
Departamento responsável: [Departamento]
Versão: [1.0]
Data: [DD/MM/AAAA]
Próxima revisão: [DD/MM/AAAA]
Este plano estabelece as práticas de governança de dados aplicáveis aos conjuntos de dados utilizados para treino, validação e teste de sistemas de IA de alto risco, conforme exigido pelo Artigo 10.º do AI Act.
Abrange todo o ciclo de vida dos dados: recolha, anotação, armazenamento, processamento, utilização nos sistemas de IA e eliminação.
| ID Sistema | Nome | Classificação de risco | Dados utilizados | Volume aproximado |
|---|---|---|---|---|
| [ID] | [Nome] | [Alto risco - Anexo III, área X] | [Tipo de dados] | [Volume] |
| [ID] | [Nome] | [Alto risco - Anexo III, área X] | [Tipo de dados] | [Volume] |
| Aspeto | Descrição |
|---|---|
| Fontes de dados | [Listar todas as fontes: bases de dados internas, datasets públicos, fornecedores terceiros, dados recolhidos diretamente] |
| Base legal para recolha | [RGPD: consentimento, interesse legítimo, execução de contrato, obrigação legal, etc.] |
| Procedimentos de recolha | [Descrever métodos de recolha, frequência e responsáveis] |
| Avaliação ética | [Descrever processo de avaliação ética da recolha de dados] |
| Requisito | Como é assegurado | Métricas |
|---|---|---|
| Relevância para a finalidade prevista | [Descrever] | [Métricas] |
| Representatividade geográfica | [Descrever] | [Métricas] |
| Representatividade demográfica | [Descrever] | [Métricas] |
| Cobertura de cenários de utilização | [Descrever] | [Métricas] |
| Verificação | Método | Frequência | Responsável |
|---|---|---|---|
| Validação de integridade | [Checksums, validação de schema, etc.] | [Frequência] | [Responsável] |
| Deteção de anomalias | [Métodos estatísticos, regras de negócio] | [Frequência] | [Responsável] |
| Verificação de completude | [Análise de missing values, cobertura] | [Frequência] | [Responsável] |
| Tipo de viés | Descrição | Risco identificado | Medida de mitigação |
|---|---|---|---|
| Viés de seleção | Dados não representam adequadamente a população-alvo | [Avaliação] | [Medida] |
| Viés de medição | Erros sistemáticos na recolha ou medição dos dados | [Avaliação] | [Medida] |
| Viés de confirmação | Dados refletem preconceitos existentes na sociedade | [Avaliação] | [Medida] |
| Viés de sobrevivência | Dados apenas de casos bem-sucedidos ou visíveis | [Avaliação] | [Medida] |
| Categoria especial | Utilizada? | Justificação | Salvaguardas |
|---|---|---|---|
| Origem racial ou étnica | [Sim/Não] | [Justificação] | [Salvaguardas] |
| Género | [Sim/Não] | [Justificação] | [Salvaguardas] |
| Idade | [Sim/Não] | [Justificação] | [Salvaguardas] |
| Deficiência | [Sim/Não] | [Justificação] | [Salvaguardas] |
| Conjunto | Proporção | Finalidade | Método de separação |
|---|---|---|---|
| Treino | [ex: 70%] | Treino do modelo de IA | [Random split, stratified, temporal, etc.] |
| Validação | [ex: 15%] | Ajuste de hiperparâmetros e seleção de modelo | [Método] |
| Teste | [ex: 15%] | Avaliação final de desempenho | [Método] |
| Aspeto | Descrição |
|---|---|
| Localização do armazenamento | [On-premise, cloud (qual provider), híbrido - localização geográfica] |
| Encriptação em repouso | [Algoritmo, gestão de chaves] |
| Encriptação em trânsito | [TLS versão, certificados] |
| Controlo de acesso | [RBAC, princípio do menor privilégio, MFA] |
| Backup e recuperação | [Frequência, RPO, RTO] |
| Tipo de dados | Período de retenção | Método de eliminação | Base legal |
|---|---|---|---|
| Dados de treino | [Período] | [Eliminação segura] | [Base legal] |
| Dados de validação/teste | [Período] | [Eliminação segura] | [Base legal] |
| Metadados e logs | [Período] | [Eliminação segura] | [Base legal] |
| Documentação de governança | Mínimo 10 anos após retirada do sistema | Arquivo | AI Act |
| Papel | Responsabilidades de governança de dados |
|---|---|
| Data Owner | Responsável pelos conjuntos de dados, aprovação de utilizações, qualidade dos dados |
| Data Steward | Gestão operacional dos dados, controlo de qualidade, manutenção de metadados |
| Engenheiro de dados | Implementação de pipelines, transformações, armazenamento e segurança técnica |
| Cientista de dados/ML Engineer | Preparação de dados para modelos, deteção de viés, validação de representatividade |
| DPO | Conformidade RGPD, avaliação de impacto, supervisão de dados pessoais |
| Responsável de conformidade IA | Verificar cumprimento do Art. 10.º, documentação para avaliação de conformidade |
Elaborado por:
Nome: [Nome]
Função: [Função]
Data: [DD/MM/AAAA]
Aprovado por:
Nome: [Nome]
Função: [Função]
Data: [DD/MM/AAAA]