اس وقت آپ کو اپنی سکرین پر شاید کچھ اشتہار نظر آ رہے ہوں۔ یا اس وقت جب آپ یوٹیوب، ٹوئٹر یا فیس بُک پر کچھ دیکھ رہے ہوتے ہیں، یہ آپ کی دلچسپی کے مطابق ہوں گے۔ کیوں؟ اس لئے کہ آپ اپنے بارے میں بہت کچھ بتا چکے ہیں۔ آپ نے اس سے پہلے کدھر کلک کیا، کدھر کلک نہیں کیا، کتنی دیر کس جگہ رکے رہے۔ یہ سب کچھ سٹور ہو رہا ہے۔ اس سے آپ کی عمر، جنس، نظریے، پسند وغیرہ کے بارے میں معلوم کر کے یہ آپ کو بھیجے جا رہے ہیں۔ یہ بِگ ڈیٹا کی ایک مثال ہے۔
آپ نے کونسی پوسٹ لائک کی، کہاں پر کمنٹ کیا، انسٹاگرام میں کیا تصویر دیکھی، کریڈت کارڈ سے کیا خریدا، کونسا پیج وزٹ کیا، کیا سرچ کی۔ دنیا کے ساڑھے سات ارب لوگ ہر سیکنڈ میں بہت سا ڈیٹا تخلیق کر رہے ہیں۔ صرف آپ کا ہونا بھی ڈیٹا ہے۔ اتنا زیادہ ڈیتا کہ ہم اس کو کہتے ہی بِگ ڈیٹا ہیں۔ (صرف آپ کا فون، کمپیوٹر، سمارٹ واچ ہی ڈیٹا نہیں دے رہے۔ اب کچھ روزمرہ کی دوسری چیزیں بھی روزانہ کی عادتوں کے بارے میں معلومات اکٹھی کر رہی ہیں)۔
سمارٹ فون، لیپ ٹاپ وغیرہ سے پہلے ڈیٹا اکٹھا کرنا مشکل کام تھا۔ مردم شماری دس سال بعد ہوتی تھی اور اس ڈیٹا کے حاصل کرنے، سٹور کرنے اور تجزیے میں برسوں لگ جایا کرتے تھے۔ کمپیوٹرز نے اس کو حاصل کرنے، اس سے خلاصہ بنانے اور سٹور کرنے کا وقت مختصر کر دیا۔ جس طرح ہماری اس کو سٹور کرنے اور تجزیہ کرنے کی صلاحیت میں اضافہ ہو رہا ہے، ہم مزید ڈیٹا تخلیق کرتے جا رہے ہیں کیونکہ اب ان چیزوں کو اکٹھا کر کے تجزیہ کیا جا سکتا ہے جو پہلے ممکن نہ تھا۔ بگ ڈیٹا کی اصطلاح نوے کی دہائی میں جان ماشلے نے پہلی بار استعمال کی۔ اتنا ڈیٹا جس کو عام اور روایتی طریقے سے ہینڈل نہ کیا جا سکے۔ آپ کا فون آپ کی جگہ کو ریکارڈ کر رہا ہے۔ آپ کونسی ایپ استعمال کرتے ہیں اور کتنی دیر استعمال کرتے ہیں، یہ ڈیٹا آپ کا فون اکٹھا کر رہا ہے۔ ان میں سے ہر ایپ خود اپنی دلچسپی کا ڈیٹا اکٹھا کر رہی ہے۔ ہر ایپ آپ کی توجہ چاہتی ہے اور یہ جاننا چاہتی ہے کہ آپ کی دلچسپی ہے کس میں۔ وہ آپ کو جانتی ہے اور مزید جاننا چاہتی ہے۔ (آپ کی سکرین کے اشتہار اسی کی مثال ہیں)۔ لوگ خریدتے کیا اور کیسے ہیں، کمپنیاں اپنے پراڈکٹ اس طرح ڈیزائن کرتی ہیں۔ (ائرکنڈیشنر، بلڈ پریشر کے آلے، گھریلو روشنیاں اور یہاں تک کہ اب تبدیل شدہ پالک کے پودے بھی یہ ڈیٹا جنریٹ کر سکتے ہیں)۔
فیس بُک پر لائک کچھ سال تک ایک بیکار ڈیٹا سمجھا جاتا رہا۔ لیکن یہ انفارمیشن آپ کے اندازے سے زیادہ آپ کے بارے میں بتاتی ہے۔ 2013 میں ایک سائیکومیٹرکس کے سٹڈی پبلش ہوئی۔ اس میں اٹھاون ہزار شرکاء تھے جنہوں نے ایک سروے کے نتیجے میں اپنے کئے گئے لائک کا تجزیہ کرنے کی اجازت دی تھی۔ اس سے انہوں نے ان لوگوں کی شخصیت کو جانچ لیا تھا۔ کن چیزوں کو پسند کرنے کا تعلق استعمال کرنے والی کی ذہانت سے تھا، یہ بھی معلوم کر لیا گیا۔ فلموں کی پسند ان کی جنس اور جنسی رجحان کا بتا دیتی تھی۔ شخصیت کی پانچ بڑی خاصیتوں سے لے کر مذہبی اور سیاسی خیالات، نسل، عمر تک سب کچھ ان لائکس سے نکال لیا تھا۔ یہ بگ ڈیٹا کے استعمال کی چھوٹی سے مثال ہے جو صرف ایک چیز کے ڈیٹا سے حاصل کی گئی۔
فیس بُک لوگوں پر لیبل لگاتی ہے۔ اگر آپ نے نئی دکان کھولی ہے اس کا اشتہار دینا چاہتے ہیں تو فیس بک پر منتخب کر سکتے ہیں کہ یہ اشتہار صرف لاہور میں جوہر ٹاون میں رہنے والی بیس سے چالیس سال کی عمر کی خواتین تک پہنچے یا انجینئرنگ کونسل کے انتخاب کے لئے لڑ رہے ہیں تو صرف انجینئرز کو اپنا پیغام پہنچانا چاہتے ہیں تو ایسا کرنا اس لئے ممکن ہے کہ فیس بُک اس ڈیٹا کی مدد سے اپنے استعمال کرنے والوں کو جانتا ہے۔
اگر آپ نے خود کچھ بھی لائک نہیں کیا تو بھی فیس بک آپ کے بارے میں جانتا ہے، اس لئے کہ وہ آپ کے دوستوں کو جانتا ہے۔
اگر آپ گوگل میپ کا استعمال کرتے ہیں تو یہ بگ ڈیٹا کا ایک بڑا کارآمد استعمال ہے۔ اس کو استعمال کرنے والوں کا ڈیٹا گوگل مسلسل اکٹھا کر رہا ہے۔ آپ کتنی دیر میں کونسی سڑک پر کتنا فاصلہ طے کر رہے ہیں اور اسی سڑک پر دوسرے استعمال کرنے والے کس رفتار سے سفر کر رہے ہیں، اس سے گوگل کو علم ہو جاتا ہے کہ ٹریفک کہاں پر بلاک ہے اور کہاں پر رواں۔ روز کس وقت ٹریفک کہاں پر بلاک ہوتا ہے، کس سڑک پر کس رفتار سے سفر کیا جاتا ہے۔ ٹریفک کے پیٹرن کیسے بنتے ہیں۔ چھٹی والے دن اس پر کیسے کیا فرق پڑتا ہے۔ اس کو دیکھتے ہوئے یہ آپ کے لئے راستے کا انتخاب کرتا ہے اور پھر آپ کی اور دوسروں کی حرکت کو ٹریک کر کے اس کو اپڈیٹ کرتا جاتا ہے۔ یہ آپ کی ڈرائنونگ کی عادات کو بھی سٹور کرتا ہے۔
چین کے شہر ہوانگ ژو نے 2016 میں سٹی برین (شہر کا دماغ) کا پراجیکٹ شروع کیا جو اس سے بھی ایک قدم آگے تھا۔ اس کا مقصد یہ تھا کہ شہر کے ٹریفک کو کیسے بہہتر بنایا جائے۔ گوگل میپ کی طرح کا یہ پراجیکٹ بھی ایک بڑی کمپنی، علی بابا نے کیا۔ اس میں مقامی حکومت سے لیا گیا ڈیٹا بھی شامل تھا۔ یہ گوگل میپ کی طرح سفر کرنے والوں سے بھی ڈیٹا اکٹھا کرتا تھا اور اس کے ساتھ حکومت کے لگائے گئے کیمروں اور ٹرانسپورٹ بیورو کی انفارمیشن سے بھی۔ علی بابا کا دعوی ہے کہ جس علاقے میں یہ پراجیکٹ استعمال کیا گیا، وہاں پر ٹریفک کی رفتار میں پندرہ فیصد اضافہ ہو گیا۔ مقامی حکومت بھی اس ڈیٹا کو استعمال کرتی ہے، یہ دیکھنے کے لئے کہ حادثہ کہاں ہوا ہے اور ایمرجنسی گاڑیوں کو کس راستے سے بھیجا جائے۔ کونسا علاقہ ہے جہاں پر انفراسٹرکچر کو کس طرح بہتر بنانے کی ضرورت ہے۔ اس وقت یہی پراجیکٹ ایک دوسرے شہر میں کیا جا رہا ہے جو ملیشیا کا دارلحکومت کوالالمپور ہے۔
اس وقت بگ ڈیٹا کو استعمال کر کے بڑی ریسرچ میڈیسن میں ہو رہی ہے۔ ابھی تک ہر شخص کے لئے میڈیکل میں ایک بیماری میں ایک ہی دوائی کا استعمال ہوتا ہے۔ مثال کے طور پر اگر آپ کو الژائمر ہے تو جو دوائی ایک طرح کی علامات پر ایک مریض کو دی جائے گی، وہی دوسرے کو۔ لیکن ہر شخص مختلف ہے اور دوائی کا اثر فرق ہو گا۔ انفرادی ڈی این اے کو دیکھ کر دوا کیسے ڈیزائن کی جائے، یہ اس وقت ایکٹو ریسرچ کا ایریا ہے۔ بغیر ڈرائئور کے گاڑیاں یا کھیلوں کی پیشگوئیاں بھی اسی تیکنیک سے کی جاتی ہیں۔
بگ ڈیٹا کا ایک اور دلچسپ استعمال آن لائن انٹرٹینمنٹ کی بڑی کمپنی نیٹ فلکس کرتی ہے۔ یہ اپنے صارفین کے استعمال سے نہ صرف یہ دیکھتی ہے کہ کون کس فلم میں دلچسپی رکھتا ہے بلکہ یہ بھی کہ کیوں۔ کسی کو کوئی فلمی ہیرو پسند ہے یا کوئی رومینٹک فلمیں پسند کرتا ہے۔ جو لوگ ٹی وی اکٹھا بہت سا دیکھتے ہیں، وہ ان ٹی وی شوز کو پسند کرتے ہیں جن میں سیزن زیادہ ہوں یا پھر آپ کو وہ شو پسند ہیں جن میں دوستی کو دکھایا گیا ہو۔ اس طرح کے ڈیٹا سے آپ کی توجہ کھینچنے کے لئے نیٹ فلکس کے پاس ایک ہی شو کی ایک سے زیادہ تصاویر ہوتی ہیں۔ یہ آپ کی پسند کو دیکھ کر اس شو کا آپ کی پسند کے حساب سے ٹائٹل دکھاتا ہے۔ کیونکہ یہ تصویر دیکھ کر آپ فیصلہ کرتے ہیں کہ اس کو دیکھنا ہے کہ نہیں۔ اگر آپ کسی خاص ایکٹر کو دیکھنا پسند کرتے ہیں تو اس ایسا اشتہار جس میں وہ ایکٹر ہو، اگر آپ کو پرتشدد فلمیں پسند ہیں تو خون آلود ناک والی تصویر۔
کسی مجمع میں سے مجرم کی شناخت سے لے کر مصنوعات کی تیاری اور دستیابی تک بگ ڈیٹا اب ہر جگہ موجود ہے۔
اور ہاں، آپ نے اگر یہ پوسٹ یہاں تک پڑھ لی ہے تو یہ بھی فیس بُک کے لئے آپ کو مزید بہتر جاننے کا ایک اور پوائنٹ تھا۔