Fazekas László Google+ archív : Másodszor is nyert a gép ...

2016. március 10., csütörtök

Másodszor is nyert a gép ...

Másodszor is nyert a gép ...

http://phys.org/news/2016-03-ai-human-grandmaster.html
http://phys.org/news/2016-03-ai-human-grandmaster.html

7 megjegyzés:

Árpád Erdős2016. március 10. 1:40
Kíváncsi lennék azért, hogy a DeepMind mennyi go specifikus részt tartalmaz.
VálaszTörlés
Válaszok
Horváth Gyula2016. március 10. 1:44
Nehéz tudni. Ő maga tanul. De nyilván a feladatra koncentrál, így elég sok lehet.
VálaszTörlés
Válaszok
Árpád Erdős2016. március 10. 2:04
Azon gondolkodtam, hogy ha van benne valami, ami tanul, majd megmutatnak neki pármillió go játszmát, akkor - legalábbis józan ész szerint - azt fogja megtanulni, amit "látott". Mivel a játszmákat - felteszem - emberek játszották, mitől lesz a DeepMind jobb játékos az embernél? Ha nem elemzi a játszmákat, akkor ugyanúgy meg fogja tanulni a kevésbé jó lépéseket is. Nyilván lehet súlyozni, hogy jobban figyeljen a nyertesre, mint a vesztesre, de elvileg nem lehetne lényegen jobb, mint akiktől tanul. Nem?
Ahhoz, hogy jobb legyen, mindenképpen kell valami olyan algoritmus, ami a sok tanulnivalóból kiválogatja, hogy mi az, amit érdemes megtanulni, és mi az, amit esetleg nem.

Közben még az jutott eszembe, hogy ha csinálunk több DeepMind-ot, megtanítjuk őket a go "alapjaira" a fenti módszerrel, majd egymás ellen játszatjuk őket, és mindig csak a nyertes oldal lépéseit tanítjuk meg neki, talán lehet fejleszteni a go tudását. Azért jó lenne valami részletesebb leírást elolvasni arról, hogyan is csinálták.
VálaszTörlés
Válaszok
Laszlo Fazekas2016. március 10. 2:07
Volt erről egy leírás, és konkrétan Go specifikus kód nincs benne, minden tanítva van. Viszont maga a rendszer "páros játék specifikus". Szóval azért építget valami játék fát, stb. nem valami általános célú AI, ami mellékesen játszani is tud. De maguk a felépítő komponensek (konvolúciós és egyéb neurális hálózatok) általános célúak. Szerintem egyébként sokáig ilyen hibrid rendszerek lesznek a jellemzőek, klasszikus szoftverek neurális modulokkal. Aztán majd szép lassan kikopnak a klasszikus részek, és full neurális rendszerek lesznek.
VálaszTörlés
Válaszok
Laszlo Fazekas2016. március 10. 2:10
Árpád Erdős Pontosan ezt csinálták. :) Saját magával játszatták a DeepMind-ot, attól lett ilyen ügyes. Megpróbálom előkaparni azt a cikket, ahol írtak róla. Ide is kiposztoltam G+-ra. Ott nagyon jól el van magyarázva.
VálaszTörlés
Válaszok
Laszlo Fazekas2016. március 10. 2:11
https://www.dcine.com/2016/01/28/alphago/ - szerintem amúgy nem ezt olvastam, de úgy látom itt is jól leírják
VálaszTörlés
Válaszok
Árpád Erdős2016. március 10. 2:24
Laszlo Fazekas köszönöm!
VálaszTörlés
Válaszok

Megjegyzés hozzáadása