Przechwytywanie obrazu z okna przeglądarki

Załóżmy, że mamy grę w przeglądarce. Chce napisać program, który będzie przechwytywał obraz z okna, na podstawie jego podejmował decyzję a potem coś robił (odpowiednik kliknięcia na ekranie).

Nigdy nie robiłem takich rzeczy i zastanawiam się jak to można wykonać.

Jeśli chodzi o programowanie znam C++, JAVA i Pythona. Są jakieś biblioteki, które pomogą mi to zrobić w którymś z tych języków?

Chciałem zacząć od robienia screenów, ale tu się pojawia problem tego że okno musiałoby być ciągle aktywne - nie szło by robić tego w tle więc zastanawia mnie też czy mogę przechwytywać obraz z okna, które jest dla mnie zminimalizowane?

Druga kwestia, gra jest we flashu, więc nie ma innej opcji pobierania z niej danych.

Co radzicie?

https://code.google.com/p/flash-selenium

http://www.sikuli.org