در یک مقاله علمی منتشر شده در Science، آمده است؛ پژوهشگران متوجه شده اند که با استفاده از چهار شاخص زمان، مکان، مبلغ و محصول خریداری شده؛ می توان ۹۰ درصد از افراد را شناسایی کرد. این آزمایش بر روی مجموعه ای از تراکنش های کارت های اعتباری ۱/۱ میلیون نفر در سه ماه متوالی انجام گرفت.
نویسندگان این مقاله، خاطرنشان کردند که داده های مالی پتانسیل بسیار زیادی دارند و در امتیازدهی اعتبار، تشخیص تقلب و درک پیش بینی الگوهای خرید کردن افراد بسیار مفید خواهند بود. با این حال، آمریکایی ها در مورد نحوه استفاده از این اطلاعات کمی مضطرب هستند و ۸۷ درصد از آن ها معتقدند داده های کارت های اعتباری بسیار خصوصی اند.
برای مشاهده چگونگی شناسایی افراد با خریدهای آن ها، مجموعه ای از داده های تراکنش های ۱/۱ میلیون نفر از خریدکنندگان ۱۰ هزار فروشگاه را گردآوری کردند و اسامی و شماره حساب ها و شناسه های آشکار آن افراد را در کنار یکدیگر قرار دادند.
با این وجود، آن ها همیشه قادر به شناسایی افرادی که در چه زمانی و چه مکانی مثلا قهوه خریداری کرده اند می باشند. زمانی که مبلغ حدودی قهوه نیز به این معادله افزوده شود، شناسایی بسیار ساده تر می گردد.
همچنین پژوهشگران داده ها را پیچیده تر کرده و بازه زمانی مورد مطالعه را نیز بزرگ تر می کنند و به جای این که روی فروشگاه های خاصی تمرکز کنند؛ منطقه جغرافیایی را در نظر می گیرند و مبلغ خرید را دقیق تر وارد نمایند. اگرچه انجام همه این کارها برای افراد زیاد، ساده نبوده و برای رخنه به حریم خصوصی افراد و داده های مالی آن ها نیز کافی نیست.
بر اساس این پژوهش، زنان ساده تر از مردان شناسایی می شوند و مردمی که درآمد بالاتری دارند معمولا دارای اطلاعات روشن تری هستند؛ شاید دلیل این امر، نحوه تقسیم زمان این افراد در فروشگاه های مختلف باشد.
علی رغم نگرانی هایی که پیرامون حریم خصوصی افراد وجود دارد، نویسنده اصلی این مقاله آقای ایوز الکساندر دِ مونت (Yves Alexandre de Montjoye) به خبرگزاری MIT گفت: «ما واقعا معتقدیم که این داده ها پتانسیل زیادی دارند و باید از آن ها استفاده شوند؛ هرچند که برای این منظور، باید آگاه باشیم و مخاطرات و مسائل شناسایی دوباره افراد را نیز بشناسیم.»