Kecerdasan buatan hampir lebih baik di Taruhan Poker daripada Anda

Kecerdasan buatan hampir lebih baik di Taruhan Poker daripada Anda

Bermain poker kecerdasan buatan telah “mendekati kinerja” ahli manusia dan dapat menggunakan “state-of-the-art methods” dalam gameplay-nya.

Peneliti dari University College London – termasuk anggota staf dari tim yang mengalahkan DeepMind Go – telah menciptakan serangkaian algoritme penguatan yang dapat memainkan Texas Hold’em dan poker Leduc yang sederhana.

AI mampu mempelajari permainan tanpa pengetahuan sebelumnya tentang strategi dan belajar sendiri dengan memainkan pertandingan fiktif sendiri, menurut makalah Deep Reinforcement Learning dari Self-Play di Imperfect-Information Games.

Mahasiswa peneliti Johannes Heinrich dan dosen dan David Silver menjelaskan di koran bahwa metode Neural Fictitious Self-Play yang mereka buat menggunakan pembelajaran penguatan mendalam “untuk belajar langsung dari pengalaman mereka berinteraksi dalam permainan”. Metode belajar dari kesalahannya dan mengembangkan cara untuk memenangkan permainan, sementara juga memanfaatkan jaringan syaraf.

Para peneliti mengklaim model mereka mampu mensimulasikan ekuilibrium Nash untuk Leduc, sementara terobosan serupa mendekati Texas Hold’em. “Itu bisa dibayangkan bahwa itu juga berlaku untuk masalah dunia nyata lainnya yang bersifat strategis,” kata Heinrich kepada The Guardian.

Makalah penelitian ini muncul setelah Google DeepMind AI mengalahkan juara dunia Go Lee Sedol 4-1. AI AlphaGo berhasil mengalahkan Lee dengan memainkan gerakan yang tidak mungkin dibuat atau diprediksi oleh manusia. Meskipun kekalahan Lee sejak mengatakan dia akan mengambil sistem pembelajaran mendalam untuk kedua kalinya.

Sementara Go telah ditaklukkan, poker menyajikan berbagai tantangan lain bagi mereka yang mengembangkan AI. Ketidakpastian manusia, menjadi satu.

Para peneliti UCL bukan yang pertama mencoba dan membuat algoritma pembelajaran umum untuk mengalahkan poker. Pada tahun 2015, 14 hari, 80.000 kompetisi tangan dari Texas Hold’em melihat AI dari Carnegie Mellon University mengambil manusia untuk pertama kalinya.

Dalam kontes, manusia menduduki puncak $ 732.713 setelah teori $ 170 juta dipertaruhkan oleh kedua belah pihak. AI dihalangi oleh bagaimana ia menanggapi manusia yang meningkatkan taruhannya; Ketidakpastian taruhan manusia berarti bahwa AI mengalami kesulitan menafsirkan permainan.

Manusia juga dapat mengambil keuntungan dari ketidakmampuan AI untuk memprediksi mengapa kartu di tangan seseorang dapat mempengaruhi permainan. Karena itu mudah bagi manusia untuk mengatakan kapan program komputer menggertak di tangan yang lemah.

Leave a Reply

Your email address will not be published. Required fields are marked *