A empresa DeepMind foi comprada pelo Google em 2014. Ă uma empresa especializada em fazer inteligĂȘncia artificial para que maquinas joguem games como seres humanos.
Atualmente hĂĄ trĂȘs mĂ©todos de ensino de mĂĄquina:
- Supervisionada: a qual os dados de entrada e saĂda sĂŁo conhecidos por nĂłs e atuamos como professores das mĂĄquinas.
- Não supervisionada: a måquina toma decisÔes baseada em conhecimento prévio. O mais conhecido exemplo são os anti-spams das caixas de email.
- Reforço: literalmente vocĂȘ premia o acerto e castiga o erro.
Em 2015, a DeepMind lança o Deep Q-Network (DQN) que foi o primeiro método de ensino de måquina por reforço.
O vĂdeo abaixo Ă© conhecido como Breakout (eu conheci como Arkanoid :).
Nos treinos iniciais, a AI nĂŁo sabe muito bem o que fazer. ApĂłs o 400Âș treino, a mĂĄquina jĂĄ sabe como jogar. E no 600Âș treino, ela encontra uma estratĂ©gia de jogo…
E quem quiser brincar de treinador de mĂĄquinas, aqui vocĂȘ pode baixar o fonte.