Data besar mempunyai potensi pembangunan yang tidak berkesudahan. Mari ketahui apakah data besar itu dan tiga sebab mengapa ia hanya menjadi popular pada tahun 2010.


Pada satu ketika, kami mula menemui perkataan Big Data yang tidak dikenali melalui pelbagai media. Ia baru beberapa tahun sejak perkataan ini mula digunakan. Walau bagaimanapun, ia telah digunakan secara berlebihan oleh media baru-baru ini sehingga ungkapan seperti "pemasaran menggunakan data besar" kini terasa membosankan kepada kami. Jadi apakah yang dimaksudkan dengan data besar dan perlombongan data yang menjadikannya begitu popular?

Data besar secara literal bermaksud set data yang besar. Sebarang data yang boleh disimpan dalam medium storan, daripada nombor mudah kepada imej CCTV yang kompleks, boleh menjadi data besar dengan mengumpulkannya bersama-sama untuk membentuk satu set, tanpa mengira formatnya. Dalam erti kata lain, dari aspek formal data, tidak ada perbezaan antara data sebelumnya dan data besar. Walau bagaimanapun, jika data besar hanyalah data bersaiz besar, ia sepatutnya menjadi popular seperti sekarang pada akhir 1990-an dan awal 2000-an, apabila teknologi komputer berkembang pesat. Walau bagaimanapun, terdapat tiga sebab mengapa data besar hanya menjadi popular pada tahun 2010-an:

Pertama sekali, punca terbesar ialah anjakan paradigma dalam pembangunan CPU. CPU (Unit Pemprosesan Pusat) ialah otak komputer yang menjalankan tugas pengiraan. Pada masa lalu, kadar pembangunan sangat pantas sehingga Undang-undang Moore, yang menyatakan bahawa prestasi CPU berganda setiap 18 bulan, diterima secara meluas. Walau bagaimanapun, pada tahun 2004, pembangunan CPU mencapai had yang dipanggil 'dinding 4GHz'. Sebelum ini, hala tuju pembangunan CPU adalah untuk meningkatkan kelajuan satu unit pemprosesan dengan menambah bilangan transistor (elemen pengkomputeran) yang dimasukkan ke dalam satu teras (unit pengkomputeran). Walau bagaimanapun, kaedah ini mempunyai masalah haba yang serius kerana apabila penyepaduan transistor meningkat, kawasan pelesapan haba bagi setiap transistor berkurangan. Pengeluar CPU akhirnya gagal menyelesaikan masalah pemanasan ini. Akibatnya, penyepaduan transistor tidak melebihi tahap tertentu, dan kelajuan operasi satu teras kekal sekitar 4GHz. Walau bagaimanapun, daripada menambah bilangan transistor dalam teras, pengeluar CPU telah menemui cara lain untuk menangani isu haba. Satu kejayaan baharu ditemui dengan membangunkan CPU berbilang teras yang merangkumi berbilang teras dalam CPU. Walaupun CPU teras tunggal sedia ada memproses berbilang tugas mengikut urutan oleh satu teras, CPU berbilang teras meningkatkan kelajuan pemprosesan dengan membahagi dan menyelaraskan berbilang tugas merentas berbilang teras dan memprosesnya serentak. CPU berbilang teras ini telah menjadi semakin popular, dan teknologi pengkomputeran selari yang memproses data secara serentak telah berkembang. Akibatnya, kini adalah mungkin untuk mengendalikan sejumlah besar data dengan lebih cepat dan mudah yang sebelum ini tidak dapat dikendalikan kerana had dalam kelajuan pengkomputeran.

Bukan sahaja mempopularkan CPU berbilang teras, tetapi juga pembangunan media storan memainkan peranan besar dalam membuka era data besar. Dalam kes cakera keras, medium storan perwakilan, data disimpan pada plat logam yang dipanggil platters. Teknologi seperti integrasi rekod magnetik yang dipertingkatkan dan CPU berbilang teras untuk memasukkan berbilang pinggan ke dalam satu cakera keras telah dibangunkan. Terima kasih kepada ini, kapasiti storan telah meningkat dengan ketara, sehingga ke tahap produk dengan ruang storan 8TB telah menjadi popular pada tahun 2023, iaitu hanya 1GB pada tahun 1990-an. Selain itu, tidak seperti cakera keras yang agak perlahan, media storan baharu dengan kelajuan tinggi seperti SSD (Solid State Drive) telah muncul. Ia menjadi lebih mudah untuk menggunakan sejumlah besar data yang sebelum ini tidak dapat disimpan kerana ruang storan yang tidak mencukupi atau sukar untuk diproses kerana kelajuan membaca dan menulis yang perlahan walaupun disimpan.

Kemajuan dalam CPU dan media storan telah memungkinkan untuk menggunakan sejumlah besar data yang sebelum ini tidak dapat dikira atau disimpan. Walau bagaimanapun, perbezaan asas antara data besar hari ini dan data besar masa lalu terletak pada cara data dikumpulkan. Peranti pintar dan SNS, yang menjadi popular dengan pesat pada tahun 2010-an, mengubah paradigma pengumpulan data. Peranti pintar yang disambungkan secara langsung atau tidak langsung ke rangkaian mengumpul data pengguna melalui pelbagai penderia seperti kamera, GPS (Global Positioning System) dan NFC (Near Field Communication). Dan data ini sentiasa dimuat naik ke rangkaian. Selain itu, pengguna SNS seperti Facebook dan Twitter sentiasa memuat naik pelbagai maklumat peribadi mereka ke rangkaian. Dahulu, pengumpulan data dilakukan untuk mendapatkan data sasaran tertentu sahaja yang dianggap penting oleh subjek pengumpulan data. Walau bagaimanapun, pengumpulan data semasa secara sembarangan mengumpul sejumlah besar data yang mengalir melalui rangkaian melalui peranti pintar dan SNS. Selain itu, apabila teknologi rangkaian berkembang secara beransur-ansur, jenis objek yang disambungkan ke rangkaian semakin meningkat. Dengan kata lain, dengan kemunculan Internet of Things (IOT), kawasan pengumpulan data semakin berkembang.

Dengan cara ini, konsep data besar muncul melalui gabungan harmoni pembangunan CPU berbilang teras, pembangunan media storan, dan pengembangan skop pengumpulan data. Pada masa ini, banyak syarikat, kerajaan dan kumpulan lain sedang menggali data besar yang telah mereka kumpulkan untuk mencari harta karun, dan pelbagai media menekankan kepentingan data besar. Tetapi lebih daripada segala-galanya, perkara yang perlu kita pertimbangkan tentang data besar ialah data besar semasa hanyalah permulaan. Pada masa hadapan, CPU berbilang teras akan dibangunkan untuk dapat melakukan pengiraan yang lebih pantas secara serentak, dan media storan akan berkembang untuk dapat menyimpan lebih banyak data dengan lebih cepat. Dan semakin banyak perkara akan disambungkan ke rangkaian dan menghantar data yang telah mereka kumpulkan ke rangkaian. Data besar semasa yang kami anggap sebagai besar pada masa ini mungkin tidak besar sama sekali dalam era data besar yang akan datang.