Alinhamento como problema epistêmico
A maior parte do debate sobre AI alignment trata a questão como ética: como garantir que o sistema "queira" o que queremos. Eu defendo um framing anterior — epistêmico.
O argumento
Antes de o sistema poder "querer" coisas certas, ele precisa não mentir sobre o que sabe. Não no sentido moral, mas no sentido formal: precisa manter calibração entre confiança reportada e estado real do conhecimento.
Essa é a propriedade que sistemas atuais quebram com mais facilidade. Um LLM produz uma resposta com a mesma fluência confiante seja ela apoiada por evidência ou alucinada. O alinhamento ético depois — o que fazer com a resposta — pressupõe que conheçamos sua origem.
É essa propriedade que o Gnostikon implementa de forma rude: nenhuma resposta sem origem, nenhuma confiança sem origem rastreável, nenhum agente sem ethos pinned.
Programa de pesquisa
- Formalizar "mentira sobre o que sabe" em termos de calibração probabilística.
- Mapear as arquiteturas que tornam isso impossível por construção (não por treinamento).
- Testar se sistemas com origem rastreável são preferidos por humanos no longo prazo, mesmo quando menos fluentes.