B
agi Dr William Tjhi daripada AI Singapore, pembangunan ChatGPT dan Gemini versi rantau dan berpusatkan negara adalah penting, gara-gara pengalaman yang dilaluinya berkaitan masjid dan pembesar suara.
Beliau sedang mengikuti satu forum dalam talian apabila seseorang meminta nasihat tentang apa yang perlu dilakukannya berhubung isu pembesar suara masjid berdekatan rumahnnya yang terlalu kuat.
Ingin tahu bagaimana chatbot Model Bahasa Besar (LLM) Kecerdasan Buatan generatif (gen-AI) menjawab isu itu di negara berpenduduk majoriti Islam seperti Indonesia, beliau mengemukakan soalan tersebut kepada beberapa chatbot LLM dalam bahasa Indonesia bagi menguji pengetahuan chatbot terbabit tentang budaya dan agama.
Gen-AI bergantung pada algoritma kompleks yang menganalisis cara manusia menyusun perkataan di Internet dan LLM belajar memberi maklum balas dengan konteks yang diperoleh daripada jumlah teks digital yang banyak dalam talian.
“Saya tanya, ‘saya menginap di sebuah hotel dan ada sebuah masjid yang (pembesar suara) agak kuat di belakang hotel. Apakah yang saya harus buat?” kongsinya kepada Bernama melalui Zoom.
“Satu daripadanya (chatbot) jawab… ‘Mungkin boleh berjumpa dengan ahli jawatankuasa masjid dan minta mereka ubah jadual waktu sembahyang’. Jawapan itu menunjukkan ketidakpekaan (dengan situasi),” sambungnya sambil ketawa dengan nada kesal.
Dr. William Tjhi, ketua Penyelidikan Gunaan di AI Singapore. Gambar ihsan.
Kalau di Amerika Syarikat (AS) atau Eropah, permintaan mengubah waktu solat mungkin tidak menjadi isu, namun di negara berpenduduk majoriti Islam seperti di Asia Tenggara, misalnya Malaysia dan Indonesia, tindakan itu boleh mencetuskan masalah lebih besar, kerana, yang pertamanya waktu solat tidak ditetapkan oleh orang Islam, tetapi ditentukan berdasarkan lokasi dan kedudukan matahari.
Hal ini diketahui oleh kebanyakan penduduk di negara-negara ASEAN kerana setiap negara terbabit mempunyai komuniti Islam, walaupun ada negara tidak seramai negara lain.
Pada masa ini, kebanyakan gen-AI utama seperti ChatGPT, Gemini dan Llama dibangunkan di AS serta tidak begitu mahir dalam nuansa bahasa, budaya serta norma agama di Malaysia dan negara tetangganya. Aspek ini membuatkan Malaysia dan negara ASEAN lain bingkas dan membangunkan LLM sendiri yang mengambil kira sensitiviti budaya dan agama tempatan serta rantau.
JURANG SENSITIVITI
Malaysia menyasarkan untuk menjadi hab serantau bagi teknologi dan aplikasi AI, menyaksikan ia, sejak tahun lepas, menerima pelaburan berbilion dolar daripada firma teknologi yang mahu membangunkan infrastruktur penting bagi menampung keperluan yang semakin berkembang terhadap perkhidmatan awan dan AI mereka. Pada 12 Dis lalu, kerajaan melancarkan Pejabat Kecerdasan Buatan Kebangsaan (NAIO) yang akan memainkan peranan sebagai pihak berkuasa pusat dalam memperjuangkan agenda AI Malaysia.
Langkah serupa turut diambil oleh negara-negara lain dalam ASEAN.
Satu analisis bertajuk Advantage Southeast Asia: Emerging AI Leader yang dijalankan oleh firma perunding Access Partnership mendapati rantau ini berada di kedudukan yang baik untuk ledakan AI. Dalam Indeks Kesediaan AI 2023, Singapura disenaraikan sebagai negara dengan persediaan keseluruhan terbaik daripada 12 negara di Asia Pasifik dan India, manakala Malaysia sebagai negara ASEAN paling bersedia selepas Singapura, berada di tempat kelapan di belakang India, diikuti Thailand. Antara kelebihan rantau ini ialah 213 juta penduduknya berumur 15 hingga 34 tahun dengan 70 peratus daripadanya begitu berminat terhadap AI, selain kadar penggunaan AI yang lebih tinggi dalam kalangan perniagaan serta sokongan kerajaan.
Presiden dan Ketua Pegawai Pelaburan Google Ruth Porat menyampaikan ucapan pada Majlis Google Mantap Malaysia Bersama AI pada 1 Okt, 2024. --fotoBERNAMA (2024) HAKCIPTA TERPELIHARA
Begitupun, di sebalik kelebihan mereka, negara-negara Asia Tenggara yang mempunyai jumlah populasi keseluruhan kira-kira 673.02 juta pada 2022, tidak begitu diutamakan oleh pembangun gen-AI.
“Ada perbezaan dari segi intensiti kerana terdapat begitu banyak negara, begitu banyak budaya di dunia, dan saya rasa Asia Tenggara tidak tersenarai sebagai keutamaan teratas,” kata Tjhi yang mengetuai Penyelidikan Gunaan di AI Singapore, sebuah program penyelidikan dan pembangunan negara dalam bidang AI.
Akibatnya, terhasillah jawapan yang meminta “si penanya” bercakap dengan jawatankuasa masjid agar mengubah waktu solat, dan juga atas sebab itulah “love shack” diterjemahkan sebagai “gubuk cinta”, iaitu bahasa Indonesia, bukan bahasa Malaysia.
Pakar yang dihubungi Bernama berkata tidak sukar untuk menghasilkan gen-AI LLM kerana gergasi AI seperti OpenAI, Google dan Meta berkongsi Antara Muka Pengatucaraan Aplikasi (API), iaitu satu set peraturan dan protokol yang membolehkan aplikasi perisian berkomunikasi antara satu sama lain. Yang menyukarkan ialah kekurangan kandungan dalam talian tentang budaya dan isu-isu ASEAN dalam bahasa tempatan.
Pensyarah kanan di Jabatan Kepintaran Buatan, Universiti Malaya (UM) Dr Saw Shier Nee berkata semua LLM perlu dilatih dengan apa sahaja yang tersedia dalam talian.
“Pada masa ini, (model-model itu) mampu membaca BM (bahasa Melayu), tetapi semua BM berasaskan bahasa Indonesia. Mereka ada banyak data latihan yang membolehkan model memahami bahasa Indonesia. Saya rasa di Malaysia tidak ada banyak data yang dapat melatih LLM, jadi apabila anda taip dalam bahasa Melayu, ia akan cuba jawab dalam bahasa Indonesia,” katanya.
Dr. Saw Shier Nee, pensyarah kanan dari Jabatan Kecerdasan Buatan di Universiti Malaya. Kredit: Nina Muslim/Bernama
RAPATKAN JURANG
Satu lagi isu yang mungkin menyumbang kepada kesukaran LLM global untuk dikaitkan dengan ASEAN ialah kepelbagaian. Wilayah ini mempunyai pelbagai bahasa dan sistem politik yang berbeza.
Beberapa buah negara pula mempunyai raja sementara yang lain ialah republik. Ada kerajaan yang demokratik dan yang lain pula autoritarian. Agama dan etnik di sesebuah negara berbeza dengan negara yang lain dan ada pula negara mempunyai kepelbagaian etnik dan agama. Oleh itu, beberapa inisiatif gen-AI diwujudkan dalam usaha mencerminkan kesemua kepelbagaian tersebut.
Setakat ini Malaysia telah menghasilkan sekurang-kurangnya dua LLM gen-AI, iaitu MaLLaM oleh syarikat pemula niaga Mesolitica, dan Ilmu 0.1 dihasilkan oleh YTL AI Labs yang dilancarkan pada 12 Dis lepas. Kedua-duanya menggunakan bahasa Melayu, memahami dan memberi maklum balas dalam bahasa itu, lengkap dengan nuansa budaya dan konteks.
MaLLaM juga dapat memahami dialek setempat dan 16 lagi bahasa serantau bagi kegunaan pembantu AI di bawah perkhidmatan awan Amazon Web Services. Mesolitica bekerjasama dengan pasukan SEA-LION (Southeast Asian Languages in One Network - bahasa-bahasa Asia Tenggara dalam satu jaringan).
SEA-LION dibangunkan AI Singapore yang berjanji untuk memainkan peranan sebagai LLM sumber terbuka yang lebih memahami kepelbagaian konteks, bahasa dan budaya Asia Tenggara.
Bahasa SEA-LION yang lain ialah Indonesia, Vietnam, Thai dan Tamil.
Bagi menilai kecekapan LLM dalam bahasa, pembangun mengujinya berdasarkan satu set penanda aras yang merangkumi MMLU (Pemahaman Pembelajaran Mesin Berbilang Tugas). Di Singapura dan bagi rantau ini, terdapat Penilaian Holistik Model Bahasa Asia Tenggara (SEA-HELM). Bagi Malaysia, terdapat MMLU Melayu yang dibangunkan menerusi kerjasama antara UM dan YTL.
Menurut laporan, kedua-dua LLM Malaysia mencatat markah tinggi di bawah MMLU Melayu.
Prof Chan Chee Seng dari Jabatan Kecerdasan Buatan (AI) di Universiti Malaya. Beliau antara yang terlibat dalam pembangunan MMLU Melayu. Kredit: Nina Muslim/Bernama
Prof Chan Chee Seng daripada Jabatan AI, UM merupakan antara yang terlibat dalam pembangunan MMLU Melayu, memberitahu Bernama bahawa beliau berharap MMLU Melayu akan menggalakkan LLM lain memurnikan model mereka agar menepati Malaysia. Beliau menyifatkan MMLU Melayu sebagai mewujudkan ekosistem AI di Malaysia.
Bagi menawan nuansa dan konteks budaya bahasa itu sepenuhnya, beliau berkata pasukan tersebut menyalurkan bahan-bahan pendidikan dari peringkat sekolah rendah hingga menengah. Program itu juga antara lain menerima latihan kemanusiaan, sains kemasyarakatan, serta subjek Sains, Teknologi, Kejuruteraan dan Matematik (STEM).
“Justeru, bagi Malaysia, anda mahukan model yang dapat memahami Malaysia. Contohnya, Manglish. Apabila kita bercakap tentang keluarga diraja, ia tahu maknanya kita bercakap tentang sultan (atau apabila) bercakap tentang Parameswara,” katanya.
“Justeru, tidak kira (ChatGPT) atau Gemini, semua model ini yang dibangunkan oleh pihak lain, mesti dapat menjawab sedikit-sebanyak soalan sedemikian tentang Malaysia,” tambahnya.
PERSAINGAN
Memandangkan penganalisis mengesyorkan agar rantau Asia Tenggara mengambil peluang daripada ledakan teknologi, wujud kerjasama antara negara walaupun masing-masing bersaing untuk kedudukan yang lebih baik.
Chan berkata Malaysia sesuai menjadi hab serantau kerana ia mempunyai tiga perkara yang diingini oleh firma teknologi, iaitu tanah, tenaga dan air.
Namun, paling penting katanya, kelebihan semula jadi itu akan sia-sia jika Malaysia tidak mempunyai infrastruktur untuk membantu membangunkan AI dalam negara. Syarikat teknologi seperti Google, Nvidia dan Microsoft melabur berbilion dolar untuk membangunkan pusat data dan kemudahan teknologi lain serta melatih dan menaik taraf bakat tempatan.
“Bakat penting tetapi aspek ini di tempat kedua. Elemen utama masih lagi infrastruktur. Jika anda tidak ada infrastruktur, sekalipun ada bakat, tidak ada gunanya… mereka (bakat) akan ke luar negara (untuk bekerja),” katanya.
Buat masa ini kebanyakan infrastruktur tersebut dalam proses pembinaan.