Apakah perlombongan data, cara lain untuk melihat dunia? Mari belajar tentang definisi, kes, proses, kawasan aplikasi, dan kemungkinan pembangunan masa hadapan perlombongan data.


Semua orang mungkin pernah mengalami pengalaman terlepas bas atau kereta api bawah tanah terakhir sekurang-kurangnya sekali dan menaiki teksi pulang ke rumah lewat malam. Dahulu kala, Seoul, Korea Selatan, mula mengendalikan bas lewat malam supaya orang ramai boleh menggunakan pengangkutan awam dan bukannya teksi pada waktu lewat malam. Laluan bas lewat malam telah diputuskan berdasarkan data jumlah trafik di stesen kereta api bawah tanah dan bas utama. Selain itu, apabila mencari buku di pusat beli-belah dalam talian, anda mungkin menemui ‘produk yang pelanggan yang melihat produk ini turut lihat’ dan ‘buku disyorkan yang disesuaikan.’ Dengan cara ini, teknologi perlombongan data tertanam secara mendalam dalam kehidupan kita. Pada masa ini, teknologi perlombongan data sedang digunakan dalam pelbagai bidang seperti pengangkutan awam, pusat beli-belah dalam talian, enjin carian Internet, perkhidmatan rangkaian sosial, dan industri kewangan. Perlombongan data merujuk kepada proses pemprosesan dan pemprosesan data untuk mendapatkan kesimpulan yang bermakna berdasarkan teori statistik dan kuasa pengkomputeran komputer. Apakah perubahan yang akan dibawa oleh perlombongan data kepada kehidupan kita?

Data adalah hasil daripada proses memproses dunia dan menukarkannya kepada bentuk yang lebih mudah untuk kita lihat. Data boleh wujud dalam sebarang bentuk, seperti data teks dalam bahasa bertulis, data foto, serta suara dan video. Perlombongan, yang bermaksud 'untuk melombong,' dan data digabungkan, dan istilah perlombongan data dicipta. Matlamat perlombongan data adalah untuk mencari hubungan dan corak menggunakan data. Perlombongan data ialah bidang kejuruteraan industri, dan ia mencerminkan teras kejuruteraan industri, iaitu menganalisis ciri-ciri objek tertentu melalui kaedah statistik dan kejuruteraan komputer.

Data teks boleh diperolehi melalui siaran pengguna dalam rangkaian sosial, dan data berangka boleh diperoleh melalui perubahan harga saham dalam pasaran kewangan. Bagaimanakah data yang diperoleh daripada tempat yang pelbagai itu boleh diproses? Ini dilakukan melalui metodologi yang dipanggil statistik dan alat yang dipanggil pengaturcaraan. Dua tugas utama dilakukan: mengalih keluar data yang tidak diperlukan dan melakukan analisis statistik pada data yang tinggal.

Bagaimanakah data yang diperoleh dengan cara ini boleh digunakan? Perlombongan data bukan sahaja mempengaruhi kehidupan seharian kita, tetapi juga mempengaruhi perubahan dalam masyarakat dan negara secara keseluruhan. Google, enjin carian perwakilan, cuba meramalkan perubahan dalam masyarakat secara keseluruhan dengan menggunakan kekerapan istilah carian tertentu. Contohnya, jika kekerapan istilah carian yang berkaitan dengan penyakit selsema seperti selsema, topeng dan ubat selsema meningkat, boleh disimpulkan bahawa wabak selsema akan berlaku di seluruh kawasan yang luas.

Oleh kerana data boleh wujud dalam sebarang bentuk, tiada had untuk kawasan di mana perlombongan data boleh digunakan. 'Teknologi pemprosesan bahasa semula jadi', yang telah aktif secara berterusan sejak 10 tahun lalu, mempunyai nilai potensi yang besar. Para sarjana sedang membangunkan penterjemah universal menggunakan sejumlah besar data. Malah sekarang, para sarjana meneruskan penyelidikan untuk mencipta dunia di mana kita boleh berkomunikasi antara satu sama lain tidak kira apa bahasa yang kita gunakan. Jika halangan bahasa hilang, dunia akan berubah dengan cara yang sama sekali berbeza daripada sekarang. Tambahan pula, robot kecerdasan buatan yang boleh melakukan perbualan semula jadi menggunakan bahasa manusia akan dibangunkan dan akan berfungsi sebagai rakan perbualan untuk warga tua seiring dengan usia masyarakat. Skala industri penjagaan kesihatan, yang menyediakan perkhidmatan perubatan tersuai dengan menganalisis isyarat badan masa nyata, akan berkembang. Selain itu, teknologi perlombongan data boleh berkembang dalam pelbagai bidang, seperti penyiasatan jenayah yang menggunakan pelbagai rangkaian data CCTV untuk mengesan penjenayah.

Dengan cara ini, kami melihat persoalan tentang apakah data, proses perlombongan data, kawasan aplikasi, dan kemungkinan pembangunan masa depan. Seperti yang dikatakan oleh ahli falsafah Perancis Marcel Proust, ‘Penemuan sebenar bukanlah mencari tanah baharu, tetapi melihatnya dengan mata baharu,’ teknologi perlombongan data juga akan memberi kita mata untuk melihat dunia dengan cara baharu.