Analisis Sederhana untuk Game KATLA

Muhamad Mustain
5 min readJan 27, 2022

Jadi, ceritanya beberapa hari ini saya tuh lihat di Twitter ada banyak banget orang ngeshare emot kotak-kotak abu, kuning, sama ijo. Aku pikir awalnya, “ini bahasa alay tingkat baru lagi kah?”. Nah aku akhirnya baru tau kalo mereka tuh lagi main game Wordle.

“Hah? Wordle? Wortel gitu maksudnya, tapi diucapin pake aksen British?”

Hehe. Intinya, game ini tuh minta kita buat nebak kata di bahasa Inggris dalam 6 kali tebakan. Kata yang dimaksud itu cuma terdiri dari 5 huruf. Hampir mirip Hangman sih kalo dipikir-pikir.

Trus, ternyata ada versi Indonesia dari game ini, namanya KATLA. Konsepnya sama persis kok.

Terus, pas aku lagi buka email terus nemu ada email menarik. Yah aku awalnya berharap email gaji tambahan gitu. Ternyata email dari Medium. Tapi sama menariknya kok, hehe. Jadi dia share artikel analisis sederhana dari game WORDLE. Kalian bisa baca di link di bawah.

Intinya, si bapak penulis menjelaskan kemungkinan cara gampang memenangkan game WORDLE ini berdasarkan data semua kata 5 huruf di bahasa Inggris. Jadi dia liat tuh persebaran hurufnya, kira-kira huruf apa sih yang paling sering muncul? Trus dia akhirnya mencari susunan kata 5 huruf dari huruf-huruf yang sering muncul tadi dan dijadikan sebagai tebakan pertama.

Katanya sih, kalo tebakan pertama kita tepat, bisa more likely untuk menang gitu lah. Walaupun… gak juga sih pas barusan kucoba. Hiks. Sampe lima kali tebakan loh baru bener. Ya gapapa sih. Ga ada analisis yang sempurna, karena yang sempurna cuma ̶p̶a̶k̶ ̶L̶u̶h̶u̶t̶.

Ok next. Nah terus aku jadi mikir, ih kayaknya seru deh kalo dibikin untuk KATLA juga. Jadi, akhirnya aku coba-coba. Karena aku juga udah bukan anak-anak. Karena kalo untuk anak-anak kan ga boleh coba-coba. hehe.

Perjalanan kita akan dimulai dengan mencari daftar kata dalam bahasa Indonesia, atau KBBI. Agak njlimet sih soalnya takutnya belum memuat kata terbaru, kayak kata hoaks kan baru kapan tahun tuh ditambah di KBBI. Setelah kesana kemari mencari dataset, saya akhirnya menemukan…. nothing! WKWKWK. Susah banget cari dataset KBBI terbaru pakkk! Boleh komen ya kalo ada yang tau! At least memuat kata “hoaks”, jadi kita bisa assume itu yang terbaru.

Anw, sedikit intermezzo, kata “hoaks” emang di KBBI tulisannya ada keterangan cak. Awalnya kukira cak ini maksudnya cakwe. Ternyata bukan…

Jadi, meskipun non-formal, kata “Hoaks” juga bisa jadi jawaban kok. Kalo kata yang gabisa, misal aku coba “Wafru”, kan ada errornya “Tidak ada dalam KBBI” ntar. Entah kenapa aku kepikiran nulis “Wafru”. Aneh.

Nah sekarang, daripada analisisnya gajadi, mari kita pakai data paling terbaru yang kita temukan saja ya. Aku ambilin data di sini. Total kata yang kita punya ada 72.421, padahal kabarnya¹ sih ada 127ribu data. Huhu, data yang kita punya cuma 57% dari keseluruhan data. Gapapa lah ya.

Setelah kita eliminasi hanya 5 kata dan menghilangkan kata dengan tanda “-” kayak “au-au”, kita punya 7.980 kata. Trus, aku tuh ngikut cara di artikel tadi. Jadi, kita bisa lihat kalau di bahasa Indonesia, huruf apa sih yang paling sering muncul?

Hmmm banyak banget ya huruf A, sampe 15% dari keseluruhan loh. Ya wajar sih, misal kalimat “harta, tahta, tiara” aja berapa banyak tuh huruf A-nya. Huruf vokal menempati posisi teratas sih. Expected juga kok kalo huruf yang jarang dipakai itu V, Z, X, Q. Nah, coba kita cek distribusinya kayak gimana.

Yah ternyata dari distribusi kumulatif di atas, kita bisa tahu kalau ada 7 huruf juga yang kemunculannya >50% dari semua kata 5 huruf, yaitu huruf A, E, I, U, K, R, T. Aku awalnya mau pake 80%, karena kan biasanya Pareto Rule yak, cari 20% yang give impact ke 80%. Tapi kebanyakan wkwk.

Yaudah, kita bakal pake kata yang terdiri dari 7 huruf tadi sebagai tebakan pertama. Jadi total kata yang bisa kita jadikan tebakan itu ada 175 kata. Nah tapi, kayak di artikel referensi² kita, kalau ada huruf muncul berulang kan bisa mengurangi peluang kita menang. Ibaratnya kalo kita nebak “KAKAK” jadi kata pertama, kan cuma 2 huruf tuh yang kecover. Kalo salah semua kan berabe. Jadi, kita tinggal cari kata 5 huruf dari 7 huruf ini yang semua hurufnya beda.

Total kata yang bisa terbentuk tuh ada 52 kata. Di bawah aku list semua. Silakan pilih sendiri dah wkwkwk.

‘artik’, ‘etika’, ‘karet’, ‘karti’, ‘kartu’, ‘karut’, ‘kater’, ‘katir’, ‘kerai’, ‘kerat’, ‘kerau’, ‘keria’, ‘kerit’, ‘kerut’, ‘ketai’, ‘ketar’, ‘ketua’, ‘ketur’, ‘kirau’, ‘kitar’, ‘kuari’, ‘kuart’, ‘kurai’, ‘kuret’, ‘kuria’, ‘raket’, ‘rakit’, ‘rakut’, ‘rekat’, ‘retai’, ‘retak’, ‘takir’, ‘takur’, ‘tarek’, ‘tarik’, ‘taruk’, ‘tauke’, ‘tekar’, ‘tekua’, ‘tekur’, ‘terak’, ‘terau’, ‘terik’, ‘terka’, ‘teruk’, ‘tikar’, ‘tirau’, ‘tukai’, ‘tukar’, ‘turki’, ‘urita’, ‘uteri’

Tapi, mayan juga kan, dari 170K kata, kita bisa reduksi jadi cuma 52 kata untuk tebakan pertama. Mungkin ada kalian yang bilang “halah mana percaya bisa naikin kesempatan menang?”. Lho lho lho lhoooo. Lihat game yang saya mainin tanggal 27 dan 28 Januari ini awikwok.

Aku pake kata yang ada di list 52 kata tadi dan semuanya bisa ketebak dalam 3 kali kesempatan. Hehe. Yang sebelah kiri, kan R-E-K udah eliminated, jadi kata berikutnya bisa ambil huruf I sebagai huruf ketiga yg paling sering muncul. Biasanya kan kata bahasa Indonesia 5 huruf dominan cuma ada 2 huruf vokal, jadi sisanya pilih konsonan yg sering muncul, jadi aku ambil P-N. Belum bener, tapi 3 huruf kan udah bener. Jadi, tinggal diotak-atik aja. Yang kanan, konsepnya sama aja.

Ngomong apa sih kwwkkw

Yak intinya gitu lah untuk artikel kali ini. Makasi udah baca. Ciao!

[1] Beritasatu.com. “Bahasa Indonesia Punya 127.000 Kosakata, Bahasa Inggris Lebih dari 1 Juta” 2018. https://www.beritasatu.com/nasional/527025/bahasa-indonesia-punya-127000-kosakata-bahasa-inggris-lebih-dari-1-juta (diakses tanggal 27 Januari 2022)

[2] Towardsdatascience.com. “WORDLE-VISION: Simple Analytics To Up Your Wordle Game” 2022. https://towardsdatascience.com/wordle-vision-simple-analytics-to-up-your-wordle-game-65daf4f1aa6f

--

--