توضیحات
اگر همه دروغ میگویند پس چه کسی راست میگوید؟ گفتههای مردم در مورد خودشان، درآمدشان، عقاید و جهتگیریهای اجتماعیشان اندکی با چاشنی دروغ همراه است. اغلب افراد در پاسخ به پرسشهای حضوری و نظرسنجیها در گفتن حقیقت اغراق میکنند. اما آنها تنها در یک موقعیت حقیقت را میگویند و آن زمانی است که با اینترنت و گوگل تنها باشند. کاربران هرروزه اطلاعات زیادی را به اینترنت اضافه میکنند. گوگل با داشتن حجم انبوهی از اطلاعات و دادهها از این اطلاعات به درستی استفاده میکند. کلان دادهها منجر به پیدایش علم جدیدی به نام «علم داده» شده است. متخصصین این حوزه کسانی هستند که با کمک الگوریتمها حقیقت محض را از دل دادههای کلان بیرون میکشند و واقعیتها را بیان میکنند.
کتاب «همه دروغ میگویند» از 3 فصل و 8 مختلف بخش تشکیل شده است. سث استفنز، کارشناس کلان داده و نویسندۀ این کتاب از اهمیت کلان دادهها و لزوم استفاده از آنها میگوید. او کاربردهای علم داده را در بخشهای مختلف جامعه بیان کرده و هر یک را با مثالهایی حقیقی توضیح میدهد. یکی از ویژگیهای این کتاب بیان واقعیتها و مشکلات ملموس جامعه است. اشاره به واقعیتهای موجود که از چشم افراد جامعه پنهان مانده است میتواند این کتاب جذاب را به یک کتاب غمانگیز و ناامیدکننده تبدیل کند. در این رابطه میتوان به آمار واقعی سقط جنینهای خانگی، نژادپرستی و کودک آزاری اشاره کرد.
سوگیری مطلوبیت اجتماعی یکی از دلایلی است که مردم را به دروغ گفتن وادار میکند. زیرا افراد با گفتن دروغهایی به ظاهر کوچک و بی اهمیت سعی دارند دیگران را تحت تاثیر قرار دهند. این موضوع حتی در پرسشنامهها و نظرسنجیهای ناشناس و غیر حضوری نیز صادق است. میل به مقبولیت اجتماعی موجب میگردد افراد در مورد حقوق، معدل دانشگاه، فعالیتهای خیریه، شرکت در انتخابات و مصرف مواد مخدر دروغ بگویند. گرایش مردم به ساختن تصویری بی نقص از خود و کسب مقبولیت از جانب دوست، شریک تجاری و حتی پژوهشگران موجب میگردد مطالعهی رفتار و افکار آنها با خطا روبهرو گردد و اطلاعات نادرستی را در اختیار نهادهای مرتبط قرار دهد.
کلان دادهها از چند جهت اهمیت بسیاری دارد. در ابتدا باید گفت که دادههای کلان دادهها هیچگاه دروغ نمیگویند. زیرا این اطلاعات از سوی رفتار سانسور نشده و واقعیتهای زندگی افراد جامعه جمع آوری میگردد. این مسئله در بررسی موضوعات حساسی مانند جهتگیریهای سیاسی، تحلیلهای جامعهشناسی اهمیت دو چندان دارد. دومین مولفهای که کلان دادهها را با اهمیت جلوه میدهد سرعت تحلیل و آشکار سازی حقایق است.
در این رابطه میتوان به تمایل نژاد پرستی در برخی از ایالتهای آمریکا اشاره کرد. استفسن در کتاب خود انتخابات سال 2004 آمریکا را مثال میزند. به عقیدۀ اغلب افراد، شمال و جنوب آمریکا مرز نژاد پرستی به حساب میآید اما بنابر تحلیل کلان داده ها این مرز متعلق به مناطق شرقی و غربی آمریکا است. او همچنین با بیان بررسی جوکهای نژادپرستی نتیجه گرفته است که اوباما تنها به دلیل رنگ پوست خود رایهای زیادی را از دست داده است. پیروزی اوباما در انتخابات این مسئله را به حاشیه میراند. اما رویکرد نژادپرستانه، نقش قابل توجهی در پیروزی ترامپ در سال 2016 ایفا کرده است. متخصصین داده معتقدند جوکها و مطالب نژاد پرستانه در بخشهایی از ایالات آمریکا بیشتر از سایر قسمتها سرچ شده است. این نتایج ارتباط معناداری با رنگ پوست ساکنین و نتایج انتخابات و پیروزی ترامپ داشته است.
قابلیت دیگر کلان دادهها تمرکز بر یک بخش خاص از اطلاعات بسیار بسیار زیاد در دسترس است. نویسنده در این رابطه مسئلهی اسلام هراسی را عنوان کرده است. دانشمندان داده با تحلیل سرچهای مردم در این رابطه متوجه شدند با تمرکز بر اطلاعات جدید و تحریک حس کنجکاوی مردم میتوان مسئله را از یک زاویه جدید بررسی نمود. اوباما در یکی از سخنرانیهای خود به جای بیان صحبتهای کلیشهای در مورد مسلمانان و اسلام هراسی تنها از «عبارت ورزشکاران و سربازان مسلمان» استفاده نمود که این جملات موجب افزایش جستجوهای مثبت و موثری نسبت به این موضوع شد.
دادههای کلان انجام آزمونهای علت و معلولی را بسیار آسان کردهاند. پیشترها برای انجام این دسته از آزمونها که به A/B تست شهرت دارند به زمان و هزینهی زیادی احتیاج بود. اکنون با استفاده از کلان دادهها میتوان اطلاعات زیادی را از این آزمونها استخراج نمود و رفتار کاربر را مورد تحلیل قرار داد. یکی از نکات منفی در استفاده از کلان دادهها، تنوع متغیرهای درگیر در آن است. افزایش الگوهای تصادفی موجب تحلیل غلط اطلاعات میگردد و دانشمندان در ارائه نتایج دچار اشتباه میگردند.
استفاده از کلان دادهها مزیت زیادی برای جامعه به ارمغان آورده است. اما امکان سو استفاده از این اطلاعات توسط نهادها و موسسات نیز وجود دارد. سواستفاده از حریم خصوصی مردم یکی از نگرانیهای دانشمندان علم داده است.
سث استفنز کارشناس دادهی آمریکایی در 15 سپتامبر سال 1982 به دنیا آمد. او دانش آموختهی رشتهی فلسفه از دانشگاه استنفورد بوده و مدرک دکترای خود را در رشتهی اقتصاد و در سال 2013 از دانشگاه هاروارد اخد کرده است. سث اسفنس به عنوان کارشناس داده در شرکت گوگل کار کرده است. کتاب «همه دروغ میگویند» کتاب اول اوست که حاصل تجربیات او در شرکت گوگل به شمار میآید. این کتاب برای او شهرت زیادی به همراه داشت.
در پایان یک روز معمولی در اوایل قرن بیست و یکم، با جست و جوی انسان ها در اینترنت، هشت تریلیون گیگابایت داده جمع می شود. این اطلاعات حیرت انگیز – که در تاریخ بی سابقه است – می تواند چیزهای زیادی درباره اینکه ما چه کسی هستیم به ما بگوید – ترس ها، خواسته ها و رفتارهایمان، و تصمیماتی که آگاهانه و یا ناخودآگاه می گیریم. از عمیق تا سطحی، ما می توانیم دانش شگفت انگیزی درباره ی روان آدمی به دست آوریم که در کمتر از بیست سال پیش، غیرممکن به نظر می رسید.
کتاب «همه دروغ می گویند!: اینترنت درمورد خود واقعی ما چه میگوید؟» دیگر نوشتۀ «سث استیونز داویدوویتز» با ترجمۀ «مهدی حبیب الهی، هانودین ابراهیم بابرودی، طناز کاوسی و امیرحسن نکوفر» در 368 صفحه توسط انتشارات «شفاف» با همکاری انتشارات «سمت نو» بهچاپ رسیده است.