To bedzie długie, ale?
Od czegos trzeba w jakims momencie zacząć.
Tu przypominaja mi sie poczatki gry w szachy miedzy programem a człowiekiem.
W chwili obecnej juz nie ma takiej mozliwosci by to człowiek był górą choc zaczynało sie skromnie.
W latach osiemdziesiątych i dziewięćdziesiątych algorytmy grające w szachy niemal całą swoją wiedzę czerpały od swoich ludzkich programistów.
Ludzie implementowali algorytmom nie tylko podstawowe zasady gry w szachy, ale także oceny różnych pozycji i ruchów na szachownicy.
„Na przykład programowano zasadę, że poświęcanie królowej w zamian za pionka na ogół jest kiepskim pomysłem.”
Te pierwsze algorytmy zdołały pokonać ludzkich mistrzów szachowych tylko dlatego, że były w stanie obliczyć o wiele więcej ruchów i ocenić o wiele więcej pozycji niż człowiek.
Jednak możliwości algorytmów pozostały ograniczone.
Ponieważ modele tę cała wiedzę zdobywały od ludzi, to kiedy ludzie czegoś nie wiedzieli, zachodziło wysokie prawdopodobieństwo, że stworzone przez nich algorytmy również tego nie wiedziały
Ale 7 grudnia 2017 roku wydarzyło się coś, co można uznać za kamień milowy: nie był to dzień, w którym jakiś komputer pokonał człowieka w grze w szachy (to nie byłoby nic nowego), lecz w którym opracowany przez Google program AlphaZero pokonał inny program, Stockfish 8.
Ten ostatni w 2016 roku zdobył mistrzostwo świata w szachach komputerowych.
Dysponował dostępem do nagromadzonego przez całe stulecia ludzkiego doświadczenia w grze w szachy, jak również do liczonego w dekadach doświadczenia komputerów.
Potrafił obliczać siedemdziesiąt milionów pozycji szachowych na sekundę.
AlphaZero natomiast wykonywał jedynie osiemdziesiąt tysięcy takich obliczeń na sekundę, a jego twórcy nie nauczyli go żadnych strategii szachowych – ani nawet standardowych otwarć.
Zamiast tego AlphaZero wykorzystał ówczesne, najnowsze metody systemów „uczenia maszynowego”, by samodzielnie nauczyć się gry w szachy, grając sam przeciwko sobie.
Wynik?
Ze stu partii rozegranych przez AlphaZero przeciwko Stockfishowi ten pierwszy wygrał dwadzieścia osiem, a zremisował siedemdziesiąt dwa razy. Ani razu nie przegrał.
Ponieważ AlphaZero nie uczył się niczego od ludzi, ludzkim obserwatorom wiele jego zwycięskich posunięć i strategii jawiło się jako dziwne ale kreatywne, jeśli nie wręcz genialne.
Jak Ci sie wydaje: ile czasu zajęło programowi AlphaZero nauczenie się szachów od zera, przygotowanie się do meczu ze Stockfishem i rozwinięcie swego genialnego instynktu?
Cztery godziny.
AlphaZero przeszedł od kompletnej niewiedzy do kreatywnego mistrzostwa w ciągu czterech godzin, bez pomocy żadnego ludzkiego przewodnika.
Więc moze troche cierpliwosci bo tak naprawde nie wiemy co będzie poniewaz widzimy tylko to co nam teraz ktoś chce pokazac.
I przy okazji dobrze by było spojrzeć „Kto” sie tym „bawi” oraz kto to finansuje.
P.S.
Ten sam tekst ale dla was obu