„Tic Tac Toe“„Arduino“su AI („Minimax“algoritmas): 3 žingsniai

Turinys:

1 žingsnis: kurkite ir žaiskite
2 žingsnis: „Minimax“algoritmas
3 veiksmas: trikčių šalinimas ir tolesni veiksmai

👤 Autorius John Day 📧 [email protected].
⏱ Public 2024-01-30 10:48.
🖍 Paskutinį kartą keistas 2025-01-23 14:59.

Šioje instrukcijoje aš jums parodysiu, kaip sukurti „Tic Tac Toe“žaidimą su AI naudojant „Arduino“. Galite žaisti prieš „Arduino“arba žiūrėti, kaip „Arduino“žaidžia prieš save.

Aš naudoju algoritmą, vadinamą „minimax algoritmu“, kuris gali būti naudojamas ne tik kuriant „Tic Tac Toe“AI, bet ir įvairiems kitiems žaidimams, tokiems kaip „Four in a Row“, šaškės ar net šachmatai. Tokie žaidimai kaip šachmatai yra labai sudėtingi ir reikalauja daug patobulintų algoritmo versijų. Savo žaidimui „Tic Tac Toe“galime naudoti paprasčiausią algoritmo versiją, kuri vis dėlto yra gana įspūdinga. Tiesą sakant, AI yra toks geras, kad neįmanoma įveikti „Arduino“!

Žaidimą lengva sukurti. Jums reikia tik kelių komponentų ir eskizo, kurį parašiau. Taip pat pridėjau išsamesnį algoritmo paaiškinimą, jei norite suprasti, kaip jis veikia.

1 žingsnis: kurkite ir žaiskite

Norėdami sukurti „Tic Tac Toe“žaidimą, jums reikės šių komponentų:

„Arduino Uno“
9 WS2812 RGB šviesos diodai
9 mygtukai
kai kurie laidai ir jungiamieji kabeliai

Prijunkite komponentus, kaip parodyta Fritzing eskize. Tada įkelkite kodą į „Arduino“.

Pagal numatytuosius nustatymus „Arduino“žengia pirmą posūkį. Kad viskas būtų šiek tiek įdomiau, pirmasis žingsnis pasirenkamas atsitiktinai. Po pirmojo ėjimo „Arduino“naudoja minimumx algoritmą, kad nustatytų geriausią įmanomą ėjimą. Pradedate naują žaidimą iš naujo nustatydami „Arduino“.

Galite stebėti „Arduino“mąstymą, atidarę serijinį monitorių. Kiekvienam įmanomam žingsniui algoritmas apskaičiuoja reitingą, nurodantį, ar dėl šio žingsnio „Arduino“laimės (vertė 10), ar pralaimės (vertė -10), ar lygiosiomis (vertė 0).

Taip pat galite žiūrėti, kaip „Arduino“žaidžia prieš save, pačioje eskizo pradžioje nekomentuodami eilutės „#define DEMO_MODE“. Jei įkelsite modifikuotą eskizą, „Arduino“pirmą žingsnį atliks atsitiktinai, o tada naudodamas „minimumx“algoritmą nustatys geriausią kiekvieno žaidėjo ėjimą kiekviename ėjime.

Atminkite, kad negalite laimėti prieš „Arduino“. Kiekvienas žaidimas baigsis lygiosiomis arba pralaimėsite, jei suklysite. Taip yra todėl, kad algoritmas visada pasirenka geriausią įmanomą žingsnį. Kaip žinote, „Tic Tac Toe“žaidimas visada baigsis lygiosiomis, jei abu žaidėjai neklysta. Demo režimu kiekvienas žaidimas baigiasi lygiosiomis, nes, kaip visi žinome, kompiuteriai niekada neklysta;-)

2 žingsnis: „Minimax“algoritmas

Algoritmą sudaro du komponentai: vertinimo funkcija ir paieškos strategija. Vertinimo funkcija yra funkcija, priskirianti skaitinę vertę lentos pozicijoms. Jei pozicija yra galutinė pozicija (ty pozicija, kurioje laimėjo mėlynasis arba raudonasis žaidėjas arba niekas nelaimėjo), vertinimo funkcija yra labai paprasta: tarkime, „Arduino“žaidžia mėlynai, o žmogus - raudonai. Jei pozicija yra laimėjusi mėlynos spalvos pozicija, funkcija šiai pozicijai priskiria 10 reikšmę; jei tai laimėjusi raudonos spalvos pozicija, funkcija priskiria pozicijai reikšmę -10; o jei padėtis lygi, funkcija priskiria 0 reikšmę.

Kai ateina „Arduino“eilė, jis nori pasirinkti ėjimą, kuris maksimaliai padidina vertinimo funkcijos vertę, nes maksimaliai padidinus vertę, pirmenybė teikiama pergalei, o ne lygiosioms (10 yra daugiau nei 0), o lygiosioms - pralaimėjimui (0 yra didesnis nei -10). Analogišku argumentu priešininkė nori žaisti taip, kad sumažintų vertinimo funkcijos vertę.

Ne galutinei pozicijai algoritmas apskaičiuoja vertinimo funkcijos vertę pagal rekursinę paieškos strategiją. Pradedant nuo dabartinės padėties, jis pakaitomis imituoja visus judesius, kuriuos gali atlikti mėlynas ir raudonas žaidėjas. Tai galima vizualizuoti kaip medį, kaip parodyta diagramoje. Kai jis pasiekia galutinę padėtį, jis pradeda atsitraukti, perkeldamas vertinimo funkcijos vertę iš žemesnio rekursijos lygio į aukštesnį rekursijos lygį. Jis priskiria maksimalią (jei atitinkamame rekursijos etape - mėlynojo žaidėjo eilė) arba mažiausią (jei atitinkamame rekursijos etape - raudonojo žaidėjo eilė) vertinimo funkcijos reikšmes iš žemesnio rekursijos lygio į padėtį aukštesnis rekursijos lygis. Galiausiai, kai algoritmas baigia atsitraukti ir vėl pasiekia dabartinę padėtį, jis ima tą judesį (arba vieną iš judesių), kuris turi didžiausią vertinimo funkcijos vertę.

Tai gali atrodyti šiek tiek abstrakčiai, tačiau iš tikrųjų tai nėra taip sunku. Apsvarstykite diagramos viršuje parodytą padėtį. Pirmajame rekursijos etape yra trys skirtingi mėlynos spalvos judesiai. Mėlyna mėgina maksimaliai padidinti vertinimo funkcijos vertę. Kiekvienam mėlynam judesiui gali būti du raudoni judesiai. Raudona spalva stengiasi sumažinti vertinimo funkcijos vertę. Apsvarstykite žingsnį, kai mėlynė žaidžia viršutiniame dešiniajame kampe. Jei raudona spalva žaidžia centre, raudona laimėjo (-10). Kita vertus, jei centrinėje apatinėje dėžutėje žaidžia raudona spalva, kitą žingsnį laimės mėlyna spalva (10). Taigi, jei viršutiniame dešiniajame kampe žaidžia mėlyna spalva, centrinėje dėžutėje bus raudona, nes tai sumažina vertinimo funkcijos vertę. Analogiškai, jei mėlyna spalva žaidžia apatinėje apatinėje dėžutėje, raudona vėl pasirodys centrinėje dėžutėje, nes tai sumažina vertinimo funkciją. Kita vertus, jei mėlyna žaidžia centrinėje aikštėje, nesvarbu, koks raudonas žingsnis, mėlyna visada laimės (10). Kadangi mėlyna spalva nori maksimaliai padidinti vertinimo funkciją, ji bus rodoma centrinėje dėžutėje, nes dėl šios padėties vertinimo funkcija (10) bus didesnė nei kiti du judesiai (-10).

3 veiksmas: trikčių šalinimas ir tolesni veiksmai

Jei paspausite mygtuką ir užsidegs kitas šviesos diodas nei tas, kuris atitinka mygtuką, greičiausiai susimaišė laidai ant kaiščių A0-A2 arba 4-6, arba prijungėte šviesos diodus netinkama tvarka.

Taip pat atkreipkite dėmesį, kad algoritmas nebūtinai visada pasirenka ėjimą, kuris leis „Arduino“laimėti kuo greičiau. Tiesą sakant, aš praleidau šiek tiek laiko derindamas algoritmą, nes „Arduino“nepasirinko žingsnio, kuris būtų buvęs laimėtas žingsnis. Prireikė šiek tiek laiko, kol supratau, kad ji pasirinko žingsnį, garantuojantį, kad vėliau jis laimės vieną žingsnį. Jei norite, galite pabandyti pakeisti algoritmą taip, kad jis visada pirmenybę teiktų laimėjusiam, o ne vėlesniam laimėjimui.

Galimas šio projekto pratęsimas būtų naudoti algoritmą 4x4 ar net 5x5 „Tic Tac Toe“AI sukūrimui. Tačiau atminkite, kad algoritmui reikalingų pozicijų skaičius labai sparčiai auga. Turėsite rasti būdų, kaip padaryti intelektualesnę vertinimo funkciją, vertes vertinant ne galutinėse pozicijose, atsižvelgiant į tikimybę, kad pozicija yra gera ar bloga atitinkamam žaidėjui. Taip pat galite pabandyti padaryti paiešką protingesnę, sustabdydami rekursiją anksti, jei pasirodo, kad žingsnis yra mažiau vertas tolesnio tyrimo nei alternatyvūs judesiai.

„Arduino“tikriausiai nėra geriausia platforma tokiems plėtiniams dėl ribotos atminties. Rekursija leidžia kaminui augti vykdant programą, o jei krūva auga per daug, ji gali sugadinti programos atmintį ir sukelti gedimus ar netinkamą elgesį. Aš pasirinkau „Arduino“šiam projektui daugiausia todėl, kad norėjau sužinoti, ar tai galima padaryti, ir švietimo tikslais, o ne todėl, kad tai geriausias pasirinkimas šiai problemai spręsti.

Rekomenduojamas:

Savaime balansuojantis robotas - PID valdymo algoritmas: 3 žingsniai

Savaiminio balansavimo robotas - PID valdymo algoritmas: Šis projektas buvo sukurtas, nes man buvo įdomu sužinoti daugiau apie valdymo algoritmus ir kaip efektyviai įgyvendinti funkcines PID kilpas. Projektas dar tik kuriamas, nes dar reikia pridėti „Bluetooth“modulį, kuris

„Arduino Touch Tic Tac Toe“žaidimas: 6 žingsniai (su paveikslėliais)

„Arduino Touch Tic Tac Toe“žaidimas: Mieli draugai, sveiki atvykę į kitą „Arduino“pamoką! Šioje išsamioje pamokoje mes sukursime „Arduino Tic Tac Toe“žaidimą. Kaip matote, mes naudojame jutiklinį ekraną ir žaidžiame prieš kompiuterį. Toks paprastas žaidimas kaip „Tic Tac Toe“yra

Kordinis algoritmas naudojant VHDL: 4 žingsniai

Cordinis algoritmas naudojant VHDL: ## Tai yra labiausiai spustelėta, populiariausia „Google“nuoroda, skirta VHDL įgyvendinti CORDIC ALGORITHM, kad būtų sukurtos sinusinės ir kosinusinės bangos ## Šiuo metu egzistuoja daug aparatūros efektyvių algoritmų, tačiau jie nėra gerai žinomi dėl „Softwar“dominavimas

Stalo žaidimas Dirbtinis intelektas: „Minimax“algoritmas: 8 žingsniai

Stalo žaidimas Dirbtinis intelektas: „Minimax“algoritmas: Ar kada susimąstėte, kaip sukurti kompiuteriai, prieš kuriuos žaidžiate šachmatais ar šaškėmis? Neskubėkite ieškoti šios instrukcijos, nes ji parodys, kaip sukurti paprastą, bet veiksmingą dirbtinį intelektą (AI) naudojant „Minimax“algoritmą! Naudodamiesi t

Interaktyvus „Tic-Tac Toe“žaidimas, valdomas naudojant „Arduino“: 6 žingsniai

Interaktyvus „Tic-Tac Toe“žaidimas, valdomas naudojant „Arduino“: Fizinio „Tic-Tac-Toe“projekto tikslas yra perkelti gerai žinomą žaidimą į fizinę sritį. Iš pradžių žaidimą žaidžia du žaidėjai ant popieriaus lapo - paeiliui dėdami „X“ir „O“simbolius. Mūsų idėja buvo ištirti žaidėjų elgesį

„Tic Tac Toe“„Arduino“su AI („Minimax“algoritmas): 3 žingsniai

Turinys:

1 žingsnis: kurkite ir žaiskite

2 žingsnis: „Minimax“algoritmas

3 veiksmas: trikčių šalinimas ir tolesni veiksmai

Rekomenduojamas:

Savaime balansuojantis robotas - PID valdymo algoritmas: 3 žingsniai

„Arduino Touch Tic Tac Toe“žaidimas: 6 žingsniai (su paveikslėliais)

Kordinis algoritmas naudojant VHDL: 4 žingsniai

Stalo žaidimas Dirbtinis intelektas: „Minimax“algoritmas: 8 žingsniai

Interaktyvus „Tic-Tac Toe“žaidimas, valdomas naudojant „Arduino“: 6 žingsniai

Sukurkite fotografo priartinimo vietą: 9 žingsniai (su nuotraukomis)

Kondensatoriaus remontas - mažas kintamas oro kondensatorius siųstuve: 11 žingsnių

Baterijų persodinimas, maksimalus perdirbimas: 5 žingsniai

Kaip užprogramuoti AVR (arduino) naudojant kitą „Arduino“: 7 žingsniai

LED stovas: 4 žingsniai

Gitaros stiprintuvas su baterijomis maitinamas cigarų dėžėje: 5 žingsniai

Stilingo laidžio audinio kūrimas*: 6 žingsniai (su nuotraukomis)

Nugaros (blizgios) pusės tapyba 5 -osios kartos „iPod“: 3 žingsniai

Galutinės pagalbos rankos/stotis: 7 žingsniai (su nuotraukomis)

LED skydelio lempa: 8 žingsniai

4 USD „USB Latte Foamer“: 4 žingsniai (su nuotraukomis)

Galutinis „Ikea“DJ įrenginys: 5 žingsniai (su nuotraukomis)

Ištaisykite sugedusį „Nintendo“pasibaigus taupymo kortelei: 6 veiksmai

Bazilikas „α“. „Mandalorian's Basilisk W“/ „Raspberry Pi“aparatinė įranga ir „Raspbian“OS: 19 žingsnių

Sukurkite savarankiškai vairuojantį automobilį - (šis nurodymas veikia): 7 žingsniai

Sukurkite žaidimų konsolę naudodami savo Raspberry Pi !: 6 žingsniai