Um exemplo pré-histórico de inteligência artificial

Existe no momento um hype enorme em torno da "inteligência artificial", mais corretamente denominada de Machine Learning (ML), e que a rigor é um ramo da estatística. ML é a generalização de métodos que já são conhecidos e aplicados há décadas ou séculos, potencializados pela abundância de dados e pela grande capacidade de processamento dos computadores atuais.

Um exemplo relativamente antigo pode ajudar a desmistificar ML. No início dos anos 1980, a Nikon adicionou às suas câmeras fotográficas (na época, todas analógicas) o Matrix Metering, um sistema de exposição que fazia compensações automáticas conforme a cena sendo fotografada.

Numa câmera "burra", mas que ainda faça exposição automaticamente, o algoritmo é muito simples: um sensor determina a quantidade de luz da cena, e a máquina deixa entrar luz suficiente para que a cena fotografada fique, na média, equivalente a um tom de cinza, conhecido como cinza 12% ou 18%.

Para muitas cenas, essa exposição pela média geral não funciona bem, pois as diferenças relativas entre partes da cena podem ser muito granes. Por exemplo, um grupo de pessoas embaixo de um guarda-sol, na praia, céu limpo, sol do meio-dia. Expor esta cena pela média deixaria as pessoas tão escuras que seriam impossíveis de reconhecer.

Um fotógrafo minimamente experiente compensará a exposição para evitar esse problema e/ou usará spot metering para fazer a leitura pelo objeto de interesse, no caso as pessoas. Isso vai "estourar" a exposição do céu e da areia, mas provavelmente vai produzir um resultado mais desejável. Se fosse uma foto de pôr-do-sol, com o objetivo de mostrar as cores do poente, aí provavelmente a exposição correta seria pelo céu, ao custo de transformar quaisquer pessoas da cena em silhuetas.

O Matrix Metering automatiza o processo de compensação, pela identificação do tipo da cena. Fotógrafos das antigas que usaram esse recurso dizem que ele era quase mágico, e foi um diferencial importante da Nikon frente às concorrentes, por um longo tempo. Mas como ele consegue fazer isso?

A primeira versão do Matrix Metering consistia numa matriz de 5 sensores de luz preto-e-branco, cada um observando uma parte diferente da cena, dividindo-a mais ou menos conforme a figura abaixo:

Figura 1: Esquema aproximado do sensor Matrix Metering original

Por exemplo, numa cena de praia, os sensores superior e inferior dariam uma leitura alta, enquanto um ou mais sensores do meio indicariam leitura média ou baixa. Se o sensor tiver a capacidade de distinguir cores, melhor ainda: uma cena de campo pede uma compensação diferente de praia, pode-se distinguir céu limpo de nublado, etc.

Mas como a máquina "sabia" qual o tipo de cena, com base na leitura da matriz? Com base numa técnica análoga ao ML. A Nikon analisou um enorme banco de imagens, classificadas por tipos e com a exposição corretamente compensada por fotógrafos profissionais. A análise das imagens foi feita offline, talvez até manualmente. O resultado é uma tabela de tipos, com a respectiva luminosidade "média" por quadrante, e a compensação sugerida.

Apenas essa tabela estava "dentro" de cada câmera. Tudo que a câmera tinha de fazer era procurar o tipo de imagem mais provável, com base nos valores observados pela matriz de sensores, e fazer a compensação correspondente. Óbvio que não acertava 100% das vezes, mas era bastante efetivo. Com o tempo, o sensor do Matrix Metering ganhou a capacidade de distinguir cores, e o número de segmentos aumentou paulatinamente até 50 — e sua eficácia só fez aumentar.

Note como a ideia, uma vez descrita, parece simples, um ovo de Colombo. E ela pode ser considerada uma forma de ML: a análise é feita com base num banco de dados mais a informação de especialistas. O grosso do custo e do esforço é obter um banco de qualidade e calcular os pesos da rede neural (no caso do Matrix Metering, uma simples tabela, que poderia ser equiparada a um perceptron com um único neurônio).

Uma vez obtido o "modelo", embuti-lo num produto é fácil e barato, e o resultado é surpreendente, "parece mágica". O pessoal chama de inteligência artificial, mas não é nem inteligência nem artificial.