Pagrindinis Srautinio Perdavimo Paslaugos Dirbtinis intelektas išmoksta apgauti Q * bertą taip, kaip dar niekas nėra daręs

Dirbtinis intelektas išmoksta apgauti Q * bertą taip, kaip dar niekas nėra daręs



Dirbtinis intelektas sugebėjo apgauti geriausius žmonijos pasiūlymus, atradęs klasikinio arkadinio žaidimo Q * bert išnaudojimą ir bėgdamas su juo.

Nors anksčiau dirbtinio intelekto iteracijos tinkamai atlikdavo Q * bert, tam tikru metu sužinodamas, kaip žaidimas veikia, jis atranda išnaudojimą, leidžiantį surinkti beprotiškus taškus. Natūralu, kad kaip ir bet kuris žaidėjas, žaidžiantis taškų ieškojimu, pakartoja procesą, kad galėtų padidinti savo rezultatą kuo efektyviau.

Žemiau esančiame vaizdo įraše galite pamatyti, kaip dirbtinis intelektas veikia aplink platformas. Iš pradžių atrodo, kad be tikslo šokinėja tarp platformų. Užuot matęs žaidimo eigą į kitą etapą, Q * bertas įstringa kilpoje, kurioje pradeda mirksėti visos jos platformos - čia dirbtinis intelektas gali tada nusimesti ir rinkti didžiulius taškus.

SKAITYKITE TOLIAU: Pagaliau buvo diskredituotas vienas iš prieštaringiausių žaidimų įrašų

kaip kreivinti tekstą paint.net

Kaip dirbtinis intelektas laimėjo Q * bert karą

Sumušęs visų laikų titulo rekordą, dirbtinis intelektas užėmė neįmanomai aukštą rezultatą dėl savo evoliucijos strategijos algoritmo programavimo. Evoliucijos strategijos (ES) skiriasi nuo įprasto sustiprinimo mokymosi (RL), kurį naudoja tradicinis dirbtinis intelektas, nes jis matomas labiau keičiamo dydžio dėl savo mokymosi iš kartų.

Kiekviena mokymosi kilpa vadinama karta ir ji tęsia savo užduotį, kol įvykdoma nustatyta sąlyga (šiuo atveju - aukštas balas). Su kiekviena karta iš kartos intelektas sugeria ankstesnės kartos žinias, todėl geriau pasiekia tą patį tikslą ir jį pranoksta. Tęskite ir gausite dirbtinį intelektą, kurio užduotis yra visiškai neprilygstama. Čia taip atsitiko su Q * bert balu.

Apibūdinta popierius , kurią praėjusią savaitę paskelbė Freiburgo universiteto (Vokietija) mokslininkai, atrodo, kad klaida nebuvo žinomas kiekis. Tiesą sakant, nors jie per daug nesistebi radę klaidą, įdomu pamatyti, kaip dirbtinis intelektas tada žengė į priekį ir išmoko jį išnaudoti kiekvieną kartą žaisdamas, kad padidintų savo įvarčių potencialą.

SKAITYKITE TOLIAU: Šis dirbtinis intelektas išmoko įvaldyti „Super Mario Bros“

Norėdami rasti klaidą, agentas pirmiausia turėjo išmokti beveik užbaigti pirmąjį lygį - tai nebuvo padaryta vienu metu, bet naudojant daugybę mažų patobulinimų, paaiškino mokslininkai Registras . Įtariame, kad tam tikru metu mokymuose vienas iš atžalų sprendimų susidūrė su klaida ir gavo daug geresnį balą, palyginti su savo broliais ir seserimis, o tai savo ruožtu padidino jo indėlį į atnaujinimą - jo svoris buvo didžiausias pagal svertinį vidurkį. Tai lėtai perkėlė sprendimą į erdvę, kur vis daugiau atžalų pradėjo susidurti su ta pačia klaida.

Mes nežinome tikslių sąlygų, kuriomis atsiranda klaida; gali būti, kad jis pasirodo tik tuo atveju, jei agentas vadovaujasi modeliu, kuris atrodo neoptimalus, [pavyzdžiui, kai agentas sugaišta laiko ar net praranda gyvybę]. Jei taip buvo, standartiniam RL būtų labai sunku rasti klaidą: jei naudosite papildomus atlygius, sužinosite strategijas, kurios greitai duoda tam tikrą atlygį, o ne mokymosi strategijas, kurios kurį laiką negauna daug naudos ir tada staiga laimėti didelis.

Žiūrėkite susijusius „Dragster“ čempionas Toddas Rogersas po 35 metų ką tik prarado karūną Šis dirbtinis intelektas 17 dienų mokėsi įvaldyti „Super Mario Bros 1-2“ Stebėkite, kaip šis dirbtinis intelektas išmoksta vairuoti „GTA V“ sistemoje „Twitch“

Nepaisant nuostabių botų rezultatų, mokslininkai nesako, kad tai yra ES mokymosi per RL čempionas. Tiesą sakant, abi sistemos turi savų problemų, o jų derinys dažniausiai laikomas geriausiu variantu.

Tas pats ES metodas kituose „Atari“ žaidimuose neatnešė tų pačių teigiamų rezultatų. Kita vertus, RL yra atsakingas už įrašų sumušimą kairėje, dešinėje ir centre, įskaitant geriausio pasaulio GO žaidėjo sumušimą. ES vis dar turi savo vietą dalykuose, ir iš tikrųjų tai, kaip „Nvidia“ atlieka daugybę dirbtinio intelekto mokymų, nes reikalauja daugiau skaičiavimo galios, tačiau ilgesniam laikui pasiekia geresnių rezultatų.

Nepaisant to, kuris būdas taps AI kūrimo ateitimi, bent jau šis botas, apgaudinėjantis sistemą, nėra toks blogas dabar gėdingas vaizdo žaidimų pasaulio čempionas .

Įdomios Straipsniai

Redaktoriaus Pasirinkimas

Keisti nuotolinio darbalaukio (RDP) prievadą sistemoje „Windows 10“
Keisti nuotolinio darbalaukio (RDP) prievadą sistemoje „Windows 10“
Šiame straipsnyje pamatysime, kaip pakeisti prievadą, kurio klausosi nuotolinis darbalaukis (RDP). Sistemoje „Windows 10“ tai galima padaryti su registro pakeitimais.
Geriausi „OneNote“ šablonai
Geriausi „OneNote“ šablonai
Microsoft OneNote yra organizacinis įrankis, kuris veikia kaip skaitmeninis bloknotas. Ši užrašų programėlė suteikia skaitmeninę visų jūsų užrašų, sąrašų, tyrimų ir kt. vietą. Galima laikyti begalę minčių ir idėjų rinkinių ir
Kaip išjungti sparčiuosius klavišus „Windows“ arba „Mac“.
Kaip išjungti sparčiuosius klavišus „Windows“ arba „Mac“.
Nors kompiuterio spartieji klavišai gali pagreitinti darbo eigą ir leisti efektyviau valdyti laiką, kartais jie gali sulėtinti darbą. Paprastai taip nutinka, jei jie nesuderinami su konkrečios programos sparčiaisiais klavišais arba tiesiog neatitinka jūsų pageidaujamos klaviatūros
Kaip padidinti „Outlook“ priedo dydžio ribą
Kaip padidinti „Outlook“ priedo dydžio ribą
Jei „Outlook“ neleidžia siųsti priedo, nes jis viršija tam tikrą ribą, pakoreguokite „Outlook“ priedo dydžio apribojimą. Atnaujinta, kad būtų įtraukta „Outlook 2019“.
Kaip patikrinti „iPhone“ vietos istoriją
Kaip patikrinti „iPhone“ vietos istoriją
Štai kaip naudoti vietovių istorijos funkcijas, kad galėtumėte stebėti ir peržiūrėti savo vietas „Google“ žemėlapiuose arba „iPhone“ vietos nustatymuose.
Kaip rasti visas paskyras, susietas su jūsų el
Kaip rasti visas paskyras, susietas su jūsų el
Išsiaiškinę, kurios paskyros susietos su jūsų el. paštu, žengiate didelį žingsnį savo internetinio privatumo apsaugos link. Šiuolaikiniame skaitmeniniame amžiuje sunku neatsilikti nuo socialinės žiniasklaidos paskyrų, svetainių,
Kaip pareikšti teises į neaktyvų „Instagram“ vartotojo vardą
Kaip pareikšti teises į neaktyvų „Instagram“ vartotojo vardą
https://www.youtube.com/watch?v=NPi85dPXfIE „Instagram“ naudotojų vardų rinka Jei kuriate „Instagram“ paskyrą ir pagalvojote apie geriausią vartotojo vardą, kuris atspindėtų jūsų individualumą ar misiją, galite suprasti, kad vartotojo vardas yra