AlphaZero sun'iy ong tizimi 4 soat davomida dunyodagi eng kuchli shaxmat dasturi Stockfish 8’ni mag‘lub etdi. Ajablanarlisi, tizim Stockfish 8 bilan o‘tkazilgan musobaqadan oldin shaxmat haqida deyarli hech narsa bilmagan, u faqatgina donalar qanday yura olishidan xabardor bo‘lgan.
Endi AlphaZero sayyoramizning eng kuchli “shaxmatchisi”ga aylandi. Deepmind kompaniyasi tomondan yaratilgan ushbu tizim musobaqada o‘ynalgan 100 ta partiyadan birortasini yutqazmadi.
AlphaZero yapon o‘yini go bo‘yicha eng zo‘r inson-o‘yinchilarni yuta olgan AlphaGo dasturini 100 marta qatorasiga mag‘lub eta olgan AlphaGo Zero sun'iy ongining modifikatsiyalashgan versiyasi hisoblanadi.
AlphaZero tizimi AlphaGo Zero kabi ishlaydi, biroq go o‘yini o‘ynash o‘rniga shaxmat va yana bir yapon mantiqiy o‘yini – syogini o‘ynashga dasturlashtirilgan.
AlphaZero bu darajaga chetdan yordam olmasdan erisha oldi. Avvalgi shaxmat dasturlaridan farqli, unda o‘ynalgan partiyalar arxivlari saqlangan bazalar, shaxmat strategiyasi va donalar haqida hech qanday ma'lumot bo‘lmagan. U shunchaki donalar qanday yurishi va o‘yin maqsadini bilgan, xolos.
AlphaZero 4 soat ichida shaxmat o‘ynashni o‘rganib oldi, degan fikrga kelish mumkin. Aniqrog‘i tizim 4 soat ichida shaxmat bo‘yicha mutlaq chempion bo‘lishni o‘rganib olgan. Musobaqa boshlanganda, sun'iy ong faqatgina donalar qanday yura olishini bilgan. U qo‘llab-quvvatlash algoritmi, neyrotarmoq bilan “qurollanib”, o‘zi bilan o‘zi o‘ynay boshlagan va partiya sayin malakasi oshib borgan. Agar inson tushunchasidagi vaqt bilan o‘lchansa, u shu 4 soat ichida go‘yoki 1400 yil shaxmat o‘ynagandek bo‘lgan. Tizim bir soniyada 800 mingta pozitsiyani qayta ishlashi mumkin, Stockfish 8 esa bir soniyada 70 millionta yurishni amalga oshira oladi.
AlphaZero shu tariqa 8 soat ichida AlphaGo’ni go o‘yini bo‘yicha, 2 soat ichida esa syogi bo‘yicha eng kuchli dastur hisoblangan Elmo’ni dog‘da qoldirishga muvaffaq bo‘ldi.