Bayangkan seorang analis pertahanan di kementerian strategis yang tengah menyiapkan laporan situasi geopolitik kawasan. Karena ingin menulis cepat dan efisien, ia memanfaatkan bantuan AI publik untuk merapikan redaksi dan menyusun ringkasan eksekutif.
Ia mungkin tidak sadar bahwa setiap kata yang diketik, setiap konsep yang dijelaskan, dan setiap data yang disisipkan akan meninggalkan jejak digital yang tidak bisa dihapus.
Data tersebut tidak berhenti di layar komputernya. Begitu laporan dikirim ke sistem AI, informasi itu berpindah ke lapisan akuisisi data, di mana semua teks, istilah, dan konteks dikumpulkan oleh sistem untuk kepentingan pembelajaran mesin.
Baca Juga:Pewaris dan Perintis dalam Sudut Pandang Psikologi Islam, Beda TantangannyaDulu Patrick Kluivert Jadi Anak Buahnya, Kini Louis van Gaal yang Turun Gunung Latih Indonesia?
Sumbernya bisa beragam, mulai dari dokumen publik, basis data riset, hingga input langsung pengguna. Dalam ekosistem inilah batas antara “publik” dan “rahasia” menjadi kabur.
Setelah terkumpul, sistem AI akan memproses data tersebut dalam lapisan kurasi dan prapemrosesan. Di sini, algoritma melakukan pembersihan, penandaan, dan penyusunan ulang data agar dapat digunakan untuk melatih model.
Namun, sistem ini tidak memiliki kesadaran politik, bahwa ia tidak membedakan antara laporan strategis kementerian dan artikel akademik biasa. Jika tidak terlindungi oleh enkripsi atau pengamanan jaringan, data rahasia dapat diperlakukan sebagai “bahan pelatihan” biasa.
Kasus nyata terjadi pada tahun 2023, ketika beberapa insinyur di perusahaan pertahanan Korea Selatan tanpa sengaja membocorkan potongan kode rahasia ke ChatGPT.
Mereka menggunakan AI tersebut untuk membantu laporan teknis internal. Investigasi kemudian menemukan bahwa data itu disimpan sementara di server luar negeri dan dapat diakses oleh pengembang model untuk penyempurnaan sistem.
Pemerintah Korea Selatan kemudian melarang penggunaan AI publik untuk pekerjaan sensitif, menandai awal kesadaran bahwa setiap interaksi dengan AI adalah potensi kebocoran strategis.
Data akan ke pusat pelatihan model yang tersebar di berbagai belahan dunia, yaitu dari pusat data di Amerika Serikat, Israel, hingga Uni Eropa.
Baca Juga:Louis van Gaal Latih Indonesia? Senin Ini akan Sampaikan Berita BesarViral! Cara Edit Foto Ala Selebgram yang Bikin Feed Instagram Jadi Estetik
Di tahap ini, data diproses dalam jumlah masif menggunakan superkomputer. Karena sistem ini beroperasi lintas yurisdiksi, data dari Indonesia atau negara lain otomatis tunduk pada hukum negara tempat server berada. Sehingga setiap file yang pernah diunggah ke AI publik bisa saja menjadi milik hukum asing, bukan lagi milik negara pengunggah.