در این مقاله قصد داریم تا در رابطه با مفهوم بیگ دیتا یا کلان داده موضوعاتی را برایتان شرح دهیم و برایتان بگویم که بیگ دیتا یا کلان داده چیست؟ پس تا انتهای این مقاله همراه ما باشید.
اجداد ما انسانها تا پیش از کشف وجود اجرام آسمانی هیچ ایدهای در مورد نقاط نورانی که در شب میدیدند نداشتند. وقتی آنها به آسمان خیره میشدند، تلاش میکردند با وصل کردن نقاط نورانی در تخیلشان موجوداتی بسازند یا آنها را به اتفاقات روزمره مرتبط کنند. هزاران هزار سال از آن شبهای مبهم میگذرد و اکنون خیلی چیزها را متوجه شدهایم. آدمها عاشق وصل کردن نقاط مبهم برای پیدا کردن معنی و ارتباط هستند.
اکنون انسانها با کمک رایانهها به آسانی میتوانند مفاهیم و اطلاعات به درد بخور را از بین انبوهی از دادههای نامفهوم و بدون ساختار به دست بیاورند. این عموم داده همان چیزی است که به آن بیگ دیتا یا کلان داده می گوییم.
بیگ دیتا یا کلان داده یک واژه باب روز برای فرایندهایی شامل استقرار، جمع آوری و تحلیل دادههای پیچیده میباشد که با ابزارهای معمول نمیشود از آنها برای دستیابی به اهداف استفاده کرد.
تعریف ساده بیگ دیتا همه ماجرا را بیان نمیکند. در حقیقت اصطلاح بیگ دیتا فقط به دادهها اشاره میکند در صورتی که بخش بزرگ علیم فرایند برعهده علم داده، استخراج داده، تحلیل داده، یادگیری ماشین و در ابعاد بزرگتر هوش مصنوعی است.
به زبان ساده مفهوم بیگ دیتا یا کلان داده چیست؟
اگر بخواهیم بیگ دیتا را خیلی ساده و خودمانی تعریف کنیم، داستان کتابفروشی آقای جعفری کار را آسان میکند.
آقای جعفری یک کتاب فروشی قدیمی در مرکز شهر دارد. او از همان دوران جوانی که کتاب فروشی را از پدرش به ارث برد، یک دفتر رو روی میز گذاشت و عنوان هر کتابی که فروخته میشود را در کنار تاریخ و قیمت کتاب مینوشت. با این دفتر هم حساب و کتابش را داشت هم موقع سفارش کتاب از آن استفاده میکرد.
آقای جعفری هر موقع که میخواست به توزیع کنندههای کتاب سفارش خرید بدهد، نگاهی به دفتر فروش میانداخت و کتابهایی را سفارش میداد که بیشتر به فروش میرفت، موضوعاتی که طرفدار بیشتری داشتند را انتخاب میکرد و حواسش به این هم بود که کتابهایی را در لیست کند که در طیف قدیمی کتابهای پرفروش باشند.
کتاب فروش داستان ما با این کار توانست تا چند سال فروش خود را زیادتر کند و نسبت به دیگر کتابفروشیها درآمد بیشتری داشته باشد. او در این مدت علایق مشتریان ثابتش را متوجه شده بود و حتی در مواردی به انتخابهای او اعتماد بیشتری داشتند.
آقای جعفری وقتی به دوران پیری رسید پسر جوانش در کتابفروشی کمکش میکرد. پسر آقای جعفری رایانهای را به کتابفروشی آورد تا جستجوی موجودی کتابها، حسابرسی مالیات، ثبت سفارش اینترنتی و غیره را با نرم افزارهای کامپیوتر انجام دهد.
علی فهمید فروش کتاب کمتر و کمتر میشود و یکی از دلایل آن تمایل مردم به خرید اینترنتی بود. بنابراین او هم به سرعت یک فروشگاه اینترنتی را آغاز کرد و فروش کتاب با فروشگاه اینترنتی بهتر شد.
علی از افزایش فروش بسیار خوشنود بود ولی فکر کرد حتماً راههای دیگری هم برای افزایش هرچه بیشتر فروش وجود دارد بنابراین شروع به جستجو و تحقیق کرد تا راهی برای افزایش فروش پیدا کند.
پیش بینی مشتریان
علی فهمید که اگر اطلاعاتی دقیق در مورد مشتریان داشته باشد، میتواند پیش بینی کند هر مشتری در آینده به خواندن چه کتابی تمایل دارد و همان کتاب را به او پیشنهاد دهد. این همان تجربه و مهارتی بود که پدرش در طول سالها به دست آورده بود.
علی که در ابتدا نمیدانستم باید چه کاری را انجام دهد ساعتها سرچ میکرد تا اینکه مطالبی در مورد داده و داده کاوی را مطالعه کرد.
او خیلی سریع یک شرکت داده کاوی پیدا کرد و درخواستش را مطرح کرد. آن ها به علی پیشنهاد دادند که با جمع آوری دادههایی از اینترنت کتاب بعدی که هر مشتری میخواهد بخواند را پیشبینی کند.
آنها دادههایی از منابع زیر جمع آوری کردند:
- آمارهایی از کتابهای پر جستجو در اینترنت
- مقالات منتشر شده با موضوع کتاب
- توییت هایی که درباره کتاب هستند
- دادههایی از فعالیت سایر مردم در شبکههای اجتماعی مثل نظر در پستهای اینستاگرام
- واکنش به تبلیغات و پیشنهادات
- علاقه مندی هایی مثل تیم فوتبال یا موسیقی مورد علاقه
- فعالیتشان در شبکههای اجتماعی مثل لایک ها
- لیست کتابهایی که خواندهاند
- مشخصات فردی مشتریان
اگر یک شخص علاقه به خواندن رمانهای علمی تخیلی دارد و در تحلیل دادههای حاصل از شبکههای اجتماعی مشخص شود مردم در حال گفتوگو در مورد کتاب علمی تخیلی جدید منتشر شده هستند، با مطابقت دادن پرسونای مشتری و کتاب جدیدی که هنوز نخواندند، میشود در قالب یک پیامک کتاب جدید را به آنها پیشنهاد داد.
علی که توانسته بود فروشگاه اینترنتی خودش را با موفقیت راه اندازی کند از وارد شدن به دنیای دادهها هم هراسی نداشت و پیشنهاد شرکت دادهکاوی را پذیرفت.
رمز موفقیت علی در مبحث بیگ دیتا یا کلان داده
پس از جمع آوری حجم زیادی از دادهها و طراحی مدلی مبتنی بر بیگ دیتا یا کلان داده، فروشگاه اینترنتی علی به یکی از پرفروشترین کتابفروشی های اینترنتی مبدل شد. رمز موفقیت علی همین پیشنهادات کتاب هوشمندی بود که از طریق بیگ دیتا یا کلان داده به دست آورد.
با استفاده از این روش هر کتاب جدیدی که منتشر میشد به صورت هدفمند به اطلاع مشتریانی که به احتمال بالای ۹۰ درصد علاقه ای به خواندنش داشتند میرسید و بالای ۵۰ درصد مشتریان کتاب پیشنهادی را خریداری میکردند.
اگر علی از همان روش پدرش برای فهرست کردن همه اطلاعات مشتریان و علایق جامعه به کتابهای جدید استفاده میکرد، قطعاً نمیتوانست با این کیفیت و در زمانی محدود راهی برای پیشنهاد کتاب به مشتریان پیدا کند.
در این مثال دو نوع از منبع برای جمعآوری دادهها استفاده شد:
- دادههایی از محتواهای تولید شده توسط مردم در فضای مجازی
- دادههایی از مشتریان سابق
ارتباط دادههای حاصل از این دو منبع مدلی ایجاد کرد که به کمک آن میتوانید پیشنهادات شخصی سازی شده و هدفمندی به مشتریان ارائه کرد.
بیگ دیتا یا کلان داده از کجا و چگونه تولید شد؟
دادهها مجموعهای از آمارها و حقایقی هستند که برای تحلیل ذخیره میشوند. این تعریف خیلی کلی میباشد.
در کلان داده منظور از داده در هر مرحله از کار فرق دارد. داده خام دادهای میباشد که بدون ترتیب و طبقه بندی جمع آوری میشوند و در آخر مفهوم خاصی را بیان نمیکنند. در صورتی که روی دادههای خام پردازش انجام شود، تبدیل به اطلاعاتی میشوند که انتقال دهی مفهومی هستند.
از صدها راه گوناگون میتوان دادهها را تولید و ذخیره کرد. همین چند دقیقه قبل که روی لینکی کلیک کردید تا این مقالهای که در حال خواندن آن هستید برایتان باز شود، دادههایی از فعالیت شما در سرورهای گوگل ذخیره شد.
دادههایی مانند مدل سیستم عامل، دستگاه موبایل یا رایانه شما و محل اتصال شما به اینترنت.
داده ها فقط از فعالیت اینترنت جمع نمیشوند. هر منبع دیگری مانند پرسشنامه کاغذی، موقعیت موبایل، فیلم دوربینهای نظارتی شهرها، بیمه خودرو و درمانی، بلیط اتوبوسی که میخرید، اطلاعات تحصیلی و غیره همه دادههای خام هستند. در آخر همه این دادهها دیجیتال میشوند تا مراحل بعدی انجام شود. اکنون چند کاربرد علمی بیگ دیتا یا کلان داده را در دنیای امروزی ببینیم و سپس به سراغ جزئیات آن برویم.
کاربردهای بیگ دیتا یا کلان داده
کاربردهای خیلی زیادی را برای بیگ دیتا میتوان تصور کرد. در ادامه این مقاله با چند مثال واقعی به کاربردهای امیدوارکننده بیگ دیتا در حوزههای گوناگون و یک نمونه ترسناک اشاره میکنیم.
بیگ دیتا در آموزش
در هر مرحله از آموزشی یعنی از کودکی تا آموزش عالی یا هر دوره اموزشی دیگر بیگ دیتا میتواند کاربرد متنوعی داشته باشد.
معمولاً میشود انتخاب رشته و کاریابی را برای دانشجویان راحتتر کرد، اجرای برنامههای همسان آموزشی برای هر دانشجو، ترتیب یادگیری دروس متفاوتی با بهره وری بالاتر پیشنهاد کرد یا با شناسایی نقطه ضعفهای دورههای آموزشی از انصراف و رد شدن دانشجویان جلوگیری کرد.
یک نمونه اجرا شده از این مثالها تغییر برنامه آموزشی در دانشگاه ایالتی جورجیا میباشد. تا چندین سال قبل میانگین دانشجویانی که موفق میشدند در این دانشگاه فارغ التحصیل شوند، ۳۲ درصد بود که درصد خیلی پایینی است. این دانشگاه برای پیدا کردن نقاط چالش برانگیز از دادهها استفاده میکرد.
آنها با تحلیل دادههای دانشجویان سابق و فعلی خود ۸۰۰ رفتار مرتبط با عدم موفقیت در دانشگاه را پیدا کردند. یکی از نشانههای عدم موفقیت این بود که اگر دانشجوی رشته علوم سیاسی در حوزه مقدماتی علم سیاست نمره c گرفت به احتمال زیاد موفقیت آن تا ۲۵ درصد کاهش می یافت.
اکنون هر دانشجویی که در این وضعیت قرار میگیرد مشاوری با او صحبت میکند و به موفقیت او کمک میکند. این فقط یکی از ۸۰۰ مشکل کشف شده بود. مدیرهای دانشگاه برای بزرگترین چالشهای دانشجویان برنامههای متعددی پیاده کردند و در عرض چند سال میانگین فارغ التحصیلی دانشجویان به ۵۴ درصد رسید.
بیگ دیتا یا کلان داده در رسانه و تلویزیون
سریالهای تلویزیونی که در سالهای قبل منتشر شدهاند، داستانهایی به مراتب جذابتر دارند. پیدا کردن یک سریال که با روحیات و علاقه هر فرد هم خوانی داشته باشد کار سختی نیست.
یک نمونه مشهور استفاده از بیگ دیتا در سریالهای تلویزیونی کمپانی نتفلیکس میباشد. این شرکت با کمک بیگ دیتا توانست علایق مردم را شناسایی کند تا در قدم اول سریالهای بهتری را به مخاطب پیشنهاد دهد و بعد از این دادهها در ساخت سریالهای جدید خود استفاده کند.
حتی همزمان با ساخت انتشار سریال House of Cards از بیگ دیتا برای نوشتن داستان فصلهای بعدی به نحوی که مخاطب بیشتری را جذب کند استفاده کردند.
بیگ دیتا در پزشکی و سلامت
در حوزه سلامت هم پروژههای خیلی زیادی با گیتار اجرا شدهاند. بیشتر این پروژهها با هدف پالایش اطلاعات سلامت شهروندان، دست یابی به دلایل بروز بیماریها و پیشگیری از بیماریها اجرا شدهاند.
شرکت AlayaCare یک نمونه خیلی خوب است کاربرد بیگ دیتا یا کلان داده در حوزه پزشکی و سلامت میباشد. این اپلیکیشن که در زمینه مراقبت از سالمندان و بیماران در خانه فعالیت میکند، با پایش اطلاعات مشتریان از راه دور و بررسی هوشمند سوابق بیماران، تعداد دفعات مراجعه پزشکان متخصص به خانه افراد را تا ۷۳ درصد کم کرده است.
یک نمونه دیگر که در حال متداول شدن در کشورهای پیشرفته میباشد، شناسایی فاکتورهای خطرناک در بدن افراد قبل از بروز بیماری است.
مثلاً با شناسایی الگوی تغییرات ضربان قلب افرادی که در معرض سکته هستند میشود از سکته قلبی جلوگیری کرد. با وجود ساعتهای هوشمند که ضربان قلب، ساعت خواب، فشار خون و غیره را ضبط میکنند، جمعآوری دادههای سلامت راحتتر از گذشته شده است.
بیگ دیتا یا کلان داده در بورس
یافتن زمان درست خرید و فروش سهام یکی از مهمترین اصول فعالیت در بازار بورس میباشد. کارگزارها سعی میکنند با نگاهی به گذشته و پیش بینی با فرضیات این زمان را تعیین کنند.
در سالهای اخیر شرکتهای سرمایهگذاری خیلی زیادی به کمک کلان داده و یادگیری ماشین توانستند سیستمهایی با دقت خیلی بالا برای تعیین میزان تأثیر گذاری اتفاقات گوناگون روی بازار بورس بسازند.
تأثیر ترسناک بیگ دیتا یا کلان داده در انتخابات
- بیگ دیتا یا کلان داده مانند هر ابزار دیگری قابل استفاده برای کارهای خلاف قانون یا اخلاق میباشد.
- مشهورترین مقال آشکار شده از استفاده نادرست بیگ دیتا در انتخاب جمهوری سال ۲۰۱۶ آمریکا اتفاق افتاد.
- البته در این موضوع هیچ کار غیرقانونی انجام نشد، در واقع آنها از خلأ قانون و ناآگاهی شهروندان سوء استفاده کردند.
- برنده شدن ترامپ در انتخابات ریاست جمهوری حاشیههای خیلی زیادی به همراه داشت. این حاشیهها در مورد استفاده از بیگ دیتا برای تبلیغات هدفمند میکرو بود.
- میکرو تارگتینگ یا تبلیغات هدفمند میکرو یعنی محتوا یا تبلیغی که بیشترین تأثیر را روی فرد دارد، به او نمایش میدهند و تبلیغاتی که تأثیر بد میگذارد را نمایش نمیدهد.
مثال
مثلاً اگر شخصی دچار بیماری خیلی خاصی شود باید به طور مداوم دارو مصرف کند. طرح کاندید ریاست جمهوری برای پوشش بیمهای داروها را به او نشان میدهند و همزمان چون این فرد به حفظ محیط زیست اهمیت زیادی میدهد هیچ حرفی از سیاست خروج از معاهدههای بین المللی محیط زیستی نمیزنند.
لازمه چنین کاری داشتن دادههای کامل از هر شهروند جامعه میباشد. با دادههای شهروندان میشود فهمید کدام شهروندان رأی میدهند، چه مشکلاتی در زندگی دارند، چه گرایش سیاسی دارند، کدام یک هنوز شک دارند به چه کسی رأی دهند و دهها اطلاعات کاربردی دیگر.
ستاد تبلیغاتی ترامپ همین کار را با کمک دادههای شهروندان آمریکایی کرد. ولی چون این اتفاق افتاد و چرا در همان دوره کسی نفهمید در بخش بعدی میخوانیم.
رئیس جمهور شدن ترامپ با کمک بیگ دیتا یا کلان داده
در انتخابات قبل از سال ۲۰۱۶ از بیگ دیتا برای پیش بینی نتایج یا شناسایی مناطق مناسب برای تبلیغات استفاده شده بود ولی اتفاقی که در سال ۲۰۱۶ رخ داد جدیدتر و وسیعتر بود.
این داستان از یک شرکت داده کاوی به نام کمبریج آنالیتیکا آغاز شد که در ابتدا با هدف تحقیقات آکادمیک شکل گرفت. ولی بعد از چند سال در چندین انتخابات به خدمت کمپینهای تبلیغاتی درآمد. اینگونه میگویند که این شرکت در ۴۴ انتخابات روی رأی دهندهها تأثیر گذاشته است.
کاری که این شرکت میکرد چندان هم پیچیده نبود. آنها و دادههای حاصل از فعالیت کاربران در شبکههای اجتماعی و سرویسهای گوناگون اینترنتی که اطلاعات حریم خصوصی را شامل نمیشوند و دسته دوم راهنمایی از طریق اپلیکیشن های تست شخصیت روانشناسی اطلاعات کاملی درباره حدود ۸۰ میلیون کاربر را تحلیل و ارزیابی کردند.
شرکت کمبریج از ستاد تبلیغاتی ترامپ ۵ میلیون دلار گرفت تا با استفاده از دادهها شهروندان را قانع کند که به ترامپ رأی بدهند.
این شرکت توانست با دادههای حاصل از متریکهای روانشناسی مانند پنج عامل بزرگ شخصیت، محل سکونت، علایق فردی، وضعیت اقتصادی و غیره مدلی بسازد که نشان میداد به احتمال خیلی زیاد به چه کسی رأی میدهد یا برای رأی دادن چقدر شک دارد.
این اطلاعات در اختیار ستادهای انتخاباتی هر شهر گذاشته شد و محتوای تبلیغاتی به شکلی کاملاً هدفمند و طبق وضعیت شهروندان پخش شد. با داشتن اطلاعاتی مانند آدرس ایمیل یا آدرس خانه کافی بود محتوای که هر شهر علاقه به شنیدن دارد را به او برساند.
حتی کارمندان این ستادها از همین اطلاعات در تبلیغات خانه به خانه استفاده میکردند. اشخاص داوطلب کمپینها به در خانهها میرفتند و با گفتگوی مستقیم شهروندان را برای رأی دادن به ترامپ قانع میکردند.
پس از انتخابات و برنده شدن ترامپ اخبار جنجالی خیلی زیادی در مورد همکاری فیسبوک که بیشترین سهم از دادههای جمع شده توسط کمبریج را داشت منتشر شد.
بعد از سر و صداهایی که شد، فیسبوک و چندین شرکت دیگر که به نوعی این دادهها را در اختیار کمپین ترامپ گذاشته بودند، سیاستهای فروش داده را تغییر دادند و دسترسی اپلیکیشن های تست شخصیت روانشناسی آنها هم قطع شد.
در آخر شرکت کمبریج در سال ۲۰۱۸ اعلام ورشکستگی کرد ولی ترامپ اکنون رئیس جمهور آمریکا است. فکر میکنید این آخرین استفاده از بیگ دیتا یا کلان داده در انتخابات بود؟
در قسمتهای بعدی ویژگیهای بیگ دیتا را مرور میکنیم و با چند نکته بیگ دیتا یا کلان داده را واضحتر تعریف میکنیم.
ویژگیهای بیگ دیتا یا کلان داده
برای بیگ دیتا یا کلان داده در ابتدا سه ویژگی گفته میشد. ولی اکنون میگویند کلان داده دارای ۵ ویژگی میباشد.
حجم زیاد
زمانی که از دادههای کلان صحبت میکنیم، معلوم است که منظورمان چند ردیف مشخصات افراد در فایل اکسل باشگاه مشتریان نمیباشد.
وقتی میشود از اصطلاح کلان داده استفاده کرد، که حجم دادههای جمع آوری شده آنقدر زیاد باشد که با ابزارهای معمولی نشود آنها را تحلیل کرد.
در ضمن توجه کنید که استفاده از واحدهای اندازهگیری مانند ترابایت یا پتابایت نیز برای تعریف حجم داده چندان درست نیست. زیرا وابسته به نوع داده میباشد. برای مثال حجم فیلم و تصویر قابل مقایسه با نوشتار نیست.
نرخ تولید بالا
در خیلی از موارد جمع آوری دادهها به صورت مقطعی نیست. یعنی این دادهها همچنان تولید میشوند و حجم اطلاعات بزرگتر و بزرگتر میشود.
به لطف اینترنت و فناوریهای جمع آوری داده، جمع آوری حجم زیاد اطلاعات کار راحتی شده است.
بهترین نمونه از نرخ تولید بالای داده، میتوان شبکههای اجتماعی را نام برد. در هر ثانیه میلیونها نفر در شبکههای اجتماعی مشغول فعالیت هستند.
تغییر پذیری و تنوع زیاد
همه این اطلاعات یک نوع و یکدست نیستند. مثلاً در شبکه اجتماعی توئیتر روزانه میلیونها نوشته ویدیو عکس و لینک به اشتراک گذاشته میشود. هر کدام از توییت ها خودشان حاوی ده ها اطلاعات دیگر هستند از اطلاعات سادهای مانند ساعت و تاریخ تولید تا اطلاعات عمیقتر مانند موضوع محتوا و چگونگی واکنش کاربران به آن. اگر یادتان باشد در داستان کتاب فروشی آقای جعفری هم از چند نوع داده گوناگون استفاده شده بود.
صحت دادهها
دادههایی را میتوان در رده بیگ دیتا یا کلان داده گذاشت که از صحت آن مطمئن باشید. این ویژگی کلان داده شاید بدیهی به نظر برسد ولی همین اطمینان از صحت منابع، استانداردها و شاخصهای پیچیده و تخصصی دارد که به تحلیل گرها کمک میکند به خطا نروند.
در مرحله فیلتر کردن دادهها اطمینان یافتن از صحت خیلی مهم و ضروری میباشد. اگر دادهها صحت کافی نداشته باشند، همه مراحل بعدی تحت تأثیر قرار میگیرد و نتایج درستی حاصل نمیشود.
ارزش
برای اینکه بفهمید داده ارزش دارد یا نه باید جواب یک سؤال مهم را پیدا کنید:
چگونه میتوان از دادهها برای استخراج چیزی با معنی در راستای اهداف افراد یا کسب و کارها استفاده کرد؟
دادهای ارزشمند است که در رسیدن به این هدف کمک کند. اگر نه بیشتر دادهها بی ارزش میباشند. در خیلی از سازمانها و شرکتها روزانه حجم زیادی داده تولید میشوند که شاید مدیران در اولین نگاه فکر کنند با ارزش هستند ولی در حقیقت دادههایی هرز باشند.
بیگ دیتا یا کلان داده چه چیزی نیست؟
تا مدتها بعد از اینکه فناوری و مفهوم جدیدی وارد بازار میشود همه میخواهند موج سواری کنند. این کوشش برای بهره برداری هرچه بیشتر از فناوری جدید موجب میشود هر شخصی بنا به نیازهایش تعریف جدیدی ارائه بدهد.
بیگ دیتا یا کلان داده هم مانند دیگر فناوریهای پیچیده و تخصصی دارای دهها تعریف درست و نادرست میباشد. در ادامه این مقاله با اشاره به سه نکته تلاش میکنیم اشتباهات متداول را از زهن پاک کنیم.
بیگ دیتا یا کلان داده فقط انبوهی از دادهها نیست
اشتباه متداول در ردیف بیگ دیتا مساوی با فرض کردن هر حجم بزرگی از داده با بیگ دیتا میباشد. اگر یک بانک با سابقه از دهها سال قبل شروع به ذخیره همه اطلاعات مشتریان خود کند و هر روز به این حجم از دادهها اضافه شود باز هم نمیشود به آن بیگ دیتا یا کلان داده گفت.
چند منبعی بودن دادهها یک ویژگی مشترک در بیگ دیتا میباشد. یعنی اطلاعات جمع آوری شده مربوط به یک دیتا بدون تنوع زیاد نیست. همانگونه که در مثال ساده کتابفروشی گفتیم شرکتی که پروژه بیگدیتا را اجرا کرد فقط از دیتا فروش یا کلید واژههای جستجو شده قبل از ورود به سایت استفاده نکرد.
در این مثال دادههای جمع آوری شده از شبکههای اجتماعی اخبار و محتوای منتشر شده با موضوع کتاب و علایق افراد در کنار اطلاعات هر مشتری بررسی میشود تا الگوی دقیق برای پیشبینی کتاب بعدی که مشتری تمایل به خواندنش دارد ساخته شود.
صحیح است که گفتیم ویژگی اول بیگ دیتا حجم زیاد آن میباشد ولی هر داده بزرگی بیگ دیتا یا کلان داده نیست.
بیگ دیتا پاسخی به همه سؤالات نیست
استفاده از بیگ دیتا همیشه مساوی با پیدا کردن جواب سؤالات نیست. اگر کسب و کار بزرگی دارید که با سوالات متعدد و مشکلاتی روبرو است و فکر میکنید میشود با تحلیل بیگ دیتا راه حل همه سؤالات و مشکلات را یافت کاملاً در اشتباهید.
خیلی وقتها هدف از بیگ دیتا یافتن سؤالات است نه جوابها. مثلاً رصد بازار یک نمونه پرکاربرد است که هر تغییر پیش بینی نشده یک سوال ایجاد میکند.
همیشه بیگ دیتا یا کلان داده یک راهکار زود بازده و تضمین شده نیست
خیلی از کسب و کارها با شنیدن وعده شرکتهای بیگ دیتا فکر میکنند در عرض چند ماه میتوانند از نتایج حاصل از کلان داده بهره مند شوند؛ ولی در حقیقت این گونه نیست. بعضی وقتها ممکن است پروژههای خیلی بزرگی مبتنی بر کلان داده به سرمایهگذاری ۱۰ ساله نیاز داشته باشد.
فکر میکنیم اکنون به طور کامل با مفهوم بیگ دیتا آشنا شده باشید. در ادامه با انواع تحلیل بیگ دیتا و اهداف آنها آشنا میشوید.
انواع تحلیل بیگ دیتا یا کلان داده
هدف تحلیل بیگ دیتا به هدف کسب و کاری که میخواهد آن را اجرا کنید وابسته میباشد. ولی به هرحال خروجی هر تحلیل باید گزارش، روند، الگو، مدل یا پیشبینی باشد.
به صورت کلی میشود انواع تحلیل مبتنی بر بیگ دیتا را به چهار نوع تقسیم کرد:
تحلیل توصیفی
نتیجه تحلیل توصیفی یک جدول نمودار یا هر نوع گزارش دیگر میباشد که به مدیران کمک میکند بفهمد در یک نقطه معین چه اتفاقی در حال رخ دادن میباشد. این نوع تحلیل بر روی رخدادهای گذشته متمرکز است.
تحلیل تشخیصی
تحلیل تشخیصی به دنبال چرای به وجود آمدن یک مشکل میباشد. این نوع تحلیل نسبت به توصیفی پیچیدهتر و عمیقتر میباشد و به همین خاطر در بیشتر موارد نیازمند سیستمهای مبتنی بر هوش مصنوعی و یادگیری ماشین میباشد.
تحلیل پیش بینی
با در کنار هم قرار گرفتن الگوریتمهای پیشرفته و هوش مصنوعی میشود قبل از وقوع مشکل آن را پیش بینی کرد. ی مشکلی قبل از وقوع پیشبینی شود میشود تا حد زیادی در هزینهها صرفه جویی کرد.
تحلیل تجویزی
این نوع از تحلیل پیچیدهترین و پرهزینهترین نوع تحلیل بیگ دیتا یا کلان داده میباشد. در این نوع تحلیل راهکار مشکلاتی که هنوز اتفاق نیفتادهاند نیز معلوم میشوند.
کاربرد بیگ دیتا یا کلان داده در دیجیتال مارکتینگ
خوب تا به اینجای مقاله از سیاست، آموزش، سلامت و غیره حرفهایی زدیم و ویژگیهای بیگ دیتا یا کلان داده را با هم مرور کردیم. اکنون میرسیم به دیجیتالمارکتینگ که بیگ دیتا یا کلان داده در آن کاربردهای خیلی زیادی دارد و مطمئناً در آینده هم بیش از اینها ما را شگفت زده میکند.
از بیگ دیتا در دیجیتال مارکتینگ برای دستیابی به اهداف گوناگونی استفاده میشود که عبارتند از:
- بهینه سازی هزینهها
- افزایش تاثیرگذاری کمپینهای تبلیغاتی
- هدف گیری شخصی سازی شده
- عقیده کاوی
- شناخت مشتریان
شناخت مشتریان در مبحث بیگ دیتا یا کلان داده
هر کسب و کاری باید پرسونای مشتریان را بداند. اگر از بیگ دیتا یا کلان داده در شناخت مشتریان استفاده کنید، میتوانید به صورت زنده تغییرات را دنبال کنید و به آنها واکنش نشان دهید.
برای مثال با استفاده از دیتاها میتوانید بدانید که کدام دسته از مشتریان را جذب میکنید؟ مشتریان چگونه شما را پیدا میکنند؟ مشتریان با ایمیلهای شما چگونه ارتباط برقرار میکنند؟ ارتباط آنلاین شما با مشتریان چطور است؟
این اطلاعات بعداً در ترسیم پرسونا به شما کمک میکند تا مخاطبان هدفتان و رفتار آنلاین مشتریانتان را بشناسید.
عقیده کاوی
در حال حاضر راههای خیلی زیادی برای کاوش در دیدگاه مشتریان موجود است. یک روش متداول در شناخت مشتریان با بیگ دیتا یا کلان داده عقیده کاوی میباشد. با عقیده کاوی میشود فهمید همین حالا مردم نسبت به برند کسب و کار نظر مثبتی دارند یا خیر؟
مثلاً اگر توییتهای مردم در مورد برند z به صورت دائم مورد ارزیابی قرار بگیرد در هر لحظه میتوان صداهای مثبت یا منفی مشتریان را شنید. فکر کنید که هر روز هزاران نظر مانند موارد زیر در مورد برندی منتشر میشود. با داشتن این دادهها عقیده کاوی کار راحتی میشود.
- قیمتهای Z آنقدر بالا است که هر بار سایتش را باز میکنم از زندگی ناامید میشوم (منفی)
- من عاشق برند Z هستم. پشتیبانی عالی، سرعت عالی اصلاً همه چی عالی (مثبت)
- امروز از Z سفارش دادم بعد از واریز پول زنگ زدن موجودی نداریم. اگر موجود نداشتید چرا برای فروش گذاشتید؟ (منفی)
با تحلیل این نوشتهها توسط نرمافزار میتوان فرصتهای جدیدی را پیدا کرد، کیفیت محصولات را بهبود بخشید، خدمات مشتریان را ارتقا داد و نقاط ضعف و قوت برند را یافت.
هدفگیری شخصی سازی شده
این روزها تبلیغ هدفمند و شخصی سازی شده به یک ضرورت برای کسب و کارها مبدل شده است. ابزارهای بیگ دیتا یا کلان داده میتوانند با بررسی موقعیت جغرافیایی، سابقه کلیکها، سابقه اینترنت گردی، سابقه خرید و لایک ها و غیره تشخیص دهند که چه تبلیغی باید به کدام کاربر نشان داده شود.
مثال
نمیدانم تا الان با گوگل ادز کار کردهاید یا نه. ولی با این غول تبلیغات گوگل آنقدر هدفمند میتوانید تبلیغاتتان را به مشتریان نشان دهید که بازدهی آن چندین برابر روشهای دیگر میشود.
مثلاً شما میتوانید یک کمپین تبلیغاتی را در گوگل اجرا کنید و از آن بخواهید تا تبلیغ شما را به مردهای ۲۳ تا ۳۸ ساله که به بازاریابی دیجیتال علاقه مند هستند نمایش دهد. گوگل با دیتاهایی که در اختیار دارد به خوبی خواسته شما را هدف قرار میدهد و تبلیغ تان را به افراد مناسب نشان میدهد.
افزایش تاثیرگذاری کمپینهای تبلیغاتی
زمانی که قرار است یک کمپین پیامکی اجرا کنید، ابتدا باید به سه سؤال مهم پاسخ دهید:
- برای چه کسانی بفرستیم؟
- چه چیز جالبی پیشنهاد کنیم؟
- چه زمانی ارسال کنیم؟
با تحلیل کلان دادهها به آسانی میتوانید به این 3 سؤال جواب دهید.
روش سنتی از طریق آزمون و خطا و تحلیل شهودی تصمیم گرفته میشود که برای مثال پیامک در ساعت ۹ شب برای مشتریان رده سنی ۲۰ تا ۳۰ سال و حاوی کد تخفیف ۱۰% ارسال شود. ولی با تحلیل بیگ دیتا یا کلان داده میشود ۱۰ پیامک هدفمند ساخت که در ده زمان گوناگون و با پیشنهادات متنوع ارسال شود.
زیرا می دانیم کدام کاربر در چه زمانی وقتش آزاد است و چه چیزی میتواند او را به یک سر نخ یا مشتری تبدیل کند.
بهینه سازی بودجه بازاریابی
تعیین و اختصاص بودجه برای مدیران بازاریابی کار چالش برانگیزی میباشد. در کدام مرحله قیف فروش باید هزینه مشتری شود؟ کدام مرحله نیازی به هزینه ندارند؟ کدام کانال ارزش هزینه دارند؟
پاسخ دادن به هر کدام از این سؤالات و دهها سؤال دیگر نیاز به ساعتها تحلیل و بررسی دارد. بعضی وقتها موضوع پیچیدهتر هم میشود. زیرا دنبال کردن سفر مشتری از چند کانال، پلتفرم و دستگاه گوناگون کار خیلی سخت و دشواری میباشد.
مثلاً اگر کاربری صبح زمانی که سرکار است با خبر شود که فردا تولد مادرش میباشد، برای خرید هدیه روز تولد با رایانه شرکت در گوگل سرچ میکند و چند پست و وبلاگ مطالعه میکند، چند محصول هم میبیند ولی چیزی را خریداری نمیکند.
زمانی که در مسیر سوار تاکسی میشود با موبایل برای چند محصول مشابه دیگر جستجو میکند و باز هم چیزی خریداری نمیکند.
در آخر وقتی شب در کنار همسرش است با او مشورت میکند و یکی از محصولات را که همسرش در اینستاگرام دیده بود را سفارش میدهند.
دنبال کردن این نوع کاربران و بهینهسازی بودجه بازاریابی در این حالت کار خیلی سختی است به دلیل اینکه چندین کلید واژه گوناگون را در چند دستگاه گوناگون سرچ کردند در شبکههای اجتماعی سرک کشیند، چند لندینگ پیج و صفحه محصول را نگاه کردند و در آخر یکی را انتخاب کردند.
یکی از ابزارهای عالی برای دستیابی به این هدف سرویس Google Attribution میباشد که با کمک بیگ دیتا یا کلان داده و یادگیری ماشین کاربران را رصد میکند.
اگر شما صاحب کسب و کاری هستید که نیاز به داده کاوی دارد تا مشکلی را حل کند یا صرفاً به دنبال پیشرفت هستید، با توجه به سطح پیچیدگی اهدافتان باید یکی از راههای موجود را برگزینید.
ابزارهای داده کاوی برای کسب و کارهای متوسط و کوچک
فهرست ابزارهای حوزه بیگ دیتا یا کلان داده آنقدر وسیع است که در این مقاله نمیشود همه آنها را معرفی کرد.
ابزارهای خیلی زیادی هستند که فقط با مشخص کردن نیازها و اهداف کار را برای کسب و کارها راحت کردهاند. ولی شاید هیچ کدام از این ابزارها نیاز شما را برطرف نکنند زیرا دادههایی دارید که میخواهید خودتان به طور مستقیم تحلیل کنید.
مثال
فرض کنید شما یک فروشگاه اینترنتی پوشاک دارید. برند شما در مجموعه شبکههای اجتماعی یک میلیون دنبالکننده دارد. میخواهید با تحلیل نظرات کاربران در سایت و شبکههای اجتماعی بدانید کاربران بیشتر دنبال چه محصولاتی هستند و نسبت به برند شما چه دیدگاهی دارند.
در جواب به این نیاز چندین راهکار گوناگون میشود پیشنهاد کرد. اگر صاحب کسب و کار کوچک یا متوسط هستید و میخواهید از دادههای موجود بهره برداری کنید، ما به شما استفاده از یک ابزار نسبتاً ساده و بدون کدنویسی مانند رپید ماینر را پیشنهاد میکنیم.
شما میتوانید با رپیدماینر از دادهها در کارهای زیر استفاده کنید:
- استخراج اطلاعات کاربردی از دادههای نوشتاری
- مدیریت ریسک
- پیش بینی خرید مشتری
- بهینه سازی قیمتها
- شناسایی تقلب و فعالیتهای مشکوک
- پیش بینی تقاضا
- تحلیل صدای مشتری
- تحلیل و دسته بندی مشتری
ابزارهای جایگزین دیگری وجود دارند که در قسمت پایین آنها را برایتان نام میبریم:
- SAS
- Orange
- Knime
- IBM SPSS Modeler
معرفی این ابزارها در همین حد که کلید واژههایی برای جستجوی راهکارهای مورد نیاز خود پیدا کنید مفید هستند.
آینده بیگ دیتا یا کلان داده
متخصصین علوم داده می گویند هر انسانی در حال حاضر در شهری پیشرفته زندگی میکند و به لوازم دیجیتال دسترسی دارد و هر ثانیه حدود یک و نیم مگابایت داده تولید میکند. این رقم هر روز بزرگتر میشود و این دادهها با سرعت بیشتری ذخیره میشوند.
بیگ دیتا یا کلان داده در معنای دقیقش چیز عجیب و غریبی نیست. در حقیقت ما انسانها میدانستیم که با داشتن دادههای بیشتر میشود ارتباط پدیدهها را کشف کرد؛ ولی امکانات و بستری برای این کار نداشتیم.
به لطف اینترنت و ظهور بقیه فناوریها این بستر فراهم شد و در آیندهای نزدیک با گسترش بیشتر اینترنت اشیا سرعت و حجم تولید داده افزایش چشمگیری پیدا میکند.
در این کسب و کارها به اینکه آنها ناچارند به سمت فرآیندهای داده محور بروند شکی نیست. ولی آنهایی موفق میشوند که هرچه زودتر وارد این عرصه شوند.
ممنون که تا پایان این مقاله همراه وبسایت استاد وب بودید. امیدواریم مطالب و نکات گفته شده برای شما مفید واقع شده باشد. شما میتوانید در صورت تمایل برای مطالعه مقالات بیشتر به لینک مقالات زیر مراجعه کنید.