canônica · conf 0.71

Alinhamento como problema epistêmico

A maior parte do debate sobre AI alignment trata a questão como ética: como garantir que o sistema "queira" o que queremos. Eu defendo um framing anterior — epistêmico.

O argumento

Antes de o sistema poder "querer" coisas certas, ele precisa não mentir sobre o que sabe. Não no sentido moral, mas no sentido formal: precisa manter calibração entre confiança reportada e estado real do conhecimento.

Essa é a propriedade que sistemas atuais quebram com mais facilidade. Um LLM produz uma resposta com a mesma fluência confiante seja ela apoiada por evidência ou alucinada. O alinhamento ético depois — o que fazer com a resposta — pressupõe que conheçamos sua origem.

informação

É essa propriedade que o Gnostikon implementa de forma rude: nenhuma resposta sem origem, nenhuma confiança sem origem rastreável, nenhum agente sem ethos pinned.

Programa de pesquisa

Formalizar "mentira sobre o que sabe" em termos de calibração probabilística.
Mapear as arquiteturas que tornam isso impossível por construção (não por treinamento).
Testar se sistemas com origem rastreável são preferidos por humanos no longo prazo, mesmo quando menos fluentes.

O argumento​

Programa de pesquisa​

O argumento

Programa de pesquisa