Talkie-1930 Rilis Sebagai AI Vintage yang Hanya Mengenal Dunia Sebelum 1930

Peneliti mengembangkan Talkie-1930, sebuah model bahasa besar (LLM) yang hanya dilatih menggunakan data teks sebelum tahun 1930. Teknologi unik ini bertujuan untuk menguji kemampuan prediksi kecerdasan buatan tanpa kontaminasi informasi modern dan kini tersedia secara open source bagi para pengembang.

Masalah klasik yang dihadapi pengembang model bahasa besar (LLM) seperti GPT-4 atau Claude adalah knowledge cutoff atau batas waktu pengetahuan. Namun, Talkie-1930 justru mengambil langkah ekstrem dengan sengaja membatasi memorinya hanya pada informasi yang terbit sebelum tahun 1930. Proyek ini bukan sekadar nostalgia, melainkan upaya saintifik untuk memahami cara kerja kecerdasan buatan dalam lingkungan data yang murni.

Talkie-1930 hadir sebagai "AI vintage" yang dilatih secara eksklusif menggunakan buku, surat kabar, dan dokumen bersejarah dari era pra-Depresi Besar. Tanpa akses ke internet maupun informasi modern, model ini menawarkan perspektif otentik mengenai pola pikir, budaya, dan struktur bahasa manusia di awal abad ke-20.

Spesifikasi dan Kemampuan Teknis Talkie-1930

Para peneliti membangun model ini dengan parameter yang cukup besar untuk memastikan kedalaman pemahaman konteks sejarah. Dalam pengujian awal, Talkie-1930 menunjukkan kemampuan luar biasa dalam meniru gaya penulisan penulis era Victoria seperti Charles Dickens.

Jumlah Parameter: 13 miliar (13B)
Basis Data: Buku, koran, dan teks sejarah pra-1930
Akses Internet: Tidak ada (Offline training)
Lisensi: Open Source (Tersedia di GitHub)
Kemampuan Utama: Imitasi gaya bahasa klasik dan analisis sejarah

Meski mahir dalam narasi formal, model ini tercatat masih memiliki keterbatasan dalam memahami format satir modern. Hal ini wajar mengingat struktur komedi dan sindiran sosial telah berevolusi signifikan dalam seratus tahun terakhir.

Menguji Prediksi Masa Depan Tanpa "Mencontek"

Salah satu kegunaan utama Talkie-1930 adalah menjadi subjek kontrol untuk mengukur sejauh mana AI bisa memprediksi masa depan berdasarkan pola sejarah. Peneliti memberikan 5.000 deskripsi peristiwa sejarah yang terjadi setelah 1930, yang diambil dari kolom "On this day" milik New York Times.

Baca Juga Harga Emas Hari Ini 7 Mei 2026: Rp 2.627.291/Gram Naik

Hasilnya menarik, tingkat "keterkejutan" model melonjak tajam saat dihadapkan pada peristiwa dari dekade 1950-an dan 1960-an. Namun, tingkat kejutan tersebut cenderung stabil pada dekade-dekade berikutnya. Eksperimen ini membuktikan bahwa AI dapat digunakan untuk memetakan lompatan besar dalam sejarah manusia yang tidak terprediksi oleh pola masa lalu.

CEO Google DeepMind, Demis Hassabis, sebelumnya pernah melontarkan gagasan serupa. Ia mempertanyakan apakah AI yang hanya diberi data hingga tahun 1911 mampu merumuskan Teori Relativitas yang ditemukan Einstein pada 1915. Talkie-1930 menjadi sarana untuk menjawab hipotesis tersebut dalam skala yang lebih luas.

Solusi Masalah Kontaminasi Data AI

Industri AI saat ini sedang bergelut dengan isu kontaminasi data, di mana data evaluasi sering kali tidak sengaja masuk ke dalam proses pelatihan model modern. Hal ini membuat skor performa AI terlihat lebih tinggi dari kemampuan aslinya karena AI tersebut sebenarnya sudah "melihat jawaban" di internet.

Talkie-1930 menawarkan lingkungan yang bersih dari kontaminasi tersebut. Peneliti bahkan mencoba melihat apakah model ini bisa belajar pemrograman komputer dari nol, padahal ia tidak memiliki konsep dasar tentang apa itu informatika atau komputer digital yang baru muncul pasca-1930.

Peluang bagi Riset Teknologi di Indonesia

Kehadiran Talkie-1930 di platform GitHub membuka peluang lebar bagi akademisi dan peneliti teknologi di Indonesia. Model ini bisa digunakan sebagai fondasi untuk membangun AI yang memahami konteks sejarah kolonial atau perkembangan bahasa Melayu awal tanpa tercampur dengan slang internet modern.

Bagi pengembang lokal, Talkie-1930 menjadi alat riset yang efisien untuk mempelajari efektivitas algoritma LLM pada dataset yang spesifik dan terbatas. Langkah ini krusial untuk pengembangan model AI bahasa daerah yang datanya mungkin tidak sebanyak bahasa Inggris di internet saat ini.

Talkie-1930 kini sudah bisa diunduh dan dijalankan oleh komunitas pengembang global. Langkah selanjutnya dari tim peneliti adalah mencoba melatih model dengan batas waktu yang lebih tua lagi untuk melihat evolusi logika mesin dalam rentang waktu berabad-abad.