Política de Teste de Sistemas de IA de Alto Risco

Organização: [Nome da organização]

Departamento responsável: [Departamento]

Versão: [1.0]

Data: [DD/MM/AAAA]

Classificação: Confidencial

Base legal: Artigo 9.º (Sistema de gestão de risco), Artigo 15.º (Exatidão, robustez e cibersegurança) e Artigo 43.º (Avaliação de conformidade) do Regulamento (UE) 2024/1689 (AI Act).

1. Objetivo e âmbito

Esta política estabelece os procedimentos e requisitos para teste e validação de sistemas de IA classificados como alto risco nos termos do Artigo 6.º do AI Act, assegurando que cumprem os requisitos de exatidão, robustez e cibersegurança antes da colocação no mercado e durante todo o ciclo de vida.

1.1 Âmbito de aplicação

1.2 Sistemas abrangidos

ID SistemaNome do sistemaCategoria (Anexo III)Papel da organizaçãoNível de criticidade
[ID][Nome][Categoria][Provider/Deployer][Alto/Crítico]
[ID][Nome][Categoria][Provider/Deployer][Alto/Crítico]

2. Tipos de teste obrigatórios

2.1 Testes de exatidão (Art. 15.º, n.º 1)

Os sistemas devem atingir níveis adequados de exatidão para a sua finalidade prevista.

Tipo de testeMétricasLimiar mínimoFrequência
Precisão do modeloAccuracy, Precision, Recall, F1-Score[Definir]Antes de cada release + mensal
Teste de viés e equidadeDisparate Impact, Equal Opportunity Difference[Definir]Trimestral
Teste de representatividadeCobertura demográfica, distribuição dos dados[Definir]A cada atualização de dados
Teste de calibraçãoBrier Score, Calibration Error[Definir]Mensal

2.2 Testes de robustez (Art. 15.º, n.º 4)

Os sistemas devem ser resilientes face a erros, falhas e inconsistências nos inputs.

Tipo de testeDescriçãoCritério de aceitação
Teste adversarialVerificar resiliência a ataques adversariais (data poisoning, evasion, model extraction)[Definir]
Teste de stressComportamento sob carga extrema, inputs inesperados, dados corrompidos[Definir]
Teste de degradaçãoDesempenho com dados parciais, ruidosos ou fora da distribuição[Definir]
Teste de failoverComportamento em caso de falha de componentes (fallback, graceful degradation)[Definir]

2.3 Testes de cibersegurança (Art. 15.º, n.º 5)

Tipo de testeDescriçãoFrequência
Teste de penetraçãoAvaliação de vulnerabilidades na infraestrutura e APIs do sistemaAnual + após alterações significativas
Data poisoningVerificação de integridade dos dados de treino e pipelinesA cada re-treino
Model extractionTestes de proteção contra extração ou replicação do modeloSemestral
Prompt injectionPara sistemas com interface de linguagem naturalMensal

2.4 Testes funcionais

3. Fases de teste

3.1 Teste em ambiente de desenvolvimento

[Descrever procedimentos de teste unitário e de integração durante o desenvolvimento, incluindo ferramentas utilizadas, cobertura mínima de código e critérios de aprovação]

3.2 Teste em ambiente de pré-produção (staging)

[Descrever procedimentos de teste em ambiente controlado que replica produção, incluindo testes de performance, segurança e compatibilidade]

3.3 Teste em condições reais (Art. 57.º)

Atenção: Testes em condições reais de sistemas de alto risco devem cumprir o Artigo 57.º do AI Act, incluindo plano de teste aprovado, consentimento informado dos participantes, supervisão adequada e registo na sandbox regulatória quando aplicável.
[Descrever condições e procedimentos para testes em ambiente real, incluindo salvaguardas para proteção dos direitos fundamentais dos sujeitos de teste]

3.4 Monitorização contínua em produção

[Descrever procedimentos de monitorização contínua, incluindo métricas monitorizadas, alertas configurados, frequência de revisão e critérios para intervenção]

4. Gestão de dados de teste

4.1 Requisitos dos conjuntos de dados de teste

5. Critérios de aprovação e rejeição

ResultadoCritérioAção
APROVADOTodos os limiares atingidos, sem vulnerabilidades críticasAprovação para produção/colocação no mercado
APROVAÇÃO CONDICIONALLimiares atingidos com observações menoresAprovação com plano de ação e prazo para resolução
REJEITADOLimiares não atingidos ou vulnerabilidades críticas identificadasRetorno ao desenvolvimento, resolução obrigatória

6. Documentação e rastreabilidade

Cada ciclo de teste deve produzir documentação incluindo:

Toda a documentação deve ser retida por um período mínimo de [10 anos] após a retirada do sistema do mercado.

7. Responsabilidades

PapelResponsabilidades
Responsável de testes IAPlanear, executar e documentar testes; reportar resultados; recomendar aprovação/rejeição
Equipa de desenvolvimentoCorrigir problemas identificados; implementar testes automatizados; manter ambientes de teste
Responsável de conformidadeValidar cobertura dos requisitos AI Act; aprovar planos de teste; supervisionar documentação
DPOVerificar conformidade RGPD nos dados de teste; aprovar utilização de dados pessoais
CISOValidar testes de cibersegurança; aprovar resultados de pentesting

8. Aprovação da política

Elaborado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura

Aprovado por:

Nome: [Nome]

Função: [Função]

Data: [DD/MM/AAAA]

Assinatura