A empresa DeepMind foi comprada pelo Google em 2014. É uma empresa especializada em fazer inteligência artificial para que maquinas joguem games como seres humanos.
Atualmente há três métodos de ensino de máquina:
- Supervisionada: a qual os dados de entrada e saída são conhecidos por nós e atuamos como professores das máquinas.
- Não supervisionada: a máquina toma decisões baseada em conhecimento prévio. O mais conhecido exemplo são os anti-spams das caixas de email.
- Reforço: literalmente você premia o acerto e castiga o erro.
Em 2015, a DeepMind lança o Deep Q-Network (DQN) que foi o primeiro método de ensino de máquina por reforço.
O vídeo abaixo é conhecido como Breakout (eu conheci como Arkanoid :).
Nos treinos iniciais, a AI não sabe muito bem o que fazer. Após o 400º treino, a máquina já sabe como jogar. E no 600º treino, ela encontra uma estratégia de jogo…
E quem quiser brincar de treinador de máquinas, aqui você pode baixar o fonte.