مفهوم بیگ دیتا یا کلان داده + کاربردهای آن

مفهوم بیگ دیتا یا کلان داده + کاربردهای آن

در این مقاله قصد داریم تا در رابطه با مفهوم بیگ دیتا یا کلان داده موضوعاتی را برایتان شرح دهیم و برایتان بگویم که بیگ دیتا یا کلان داده چیست؟ پس تا انتهای این مقاله همراه ما باشید.

 اجداد ما انسانها تا پیش از کشف وجود اجرام آسمانی هیچ ایده‌ای در مورد نقاط نورانی که در شب می‌دیدند نداشتند. وقتی آنها به آسمان خیره می‌شدند، تلاش می‌کردند با وصل کردن نقاط نورانی در تخیلشان موجوداتی بسازند یا آنها را به اتفاقات روزمره مرتبط کنند. هزاران هزار سال از آن شب‌های مبهم می‌گذرد و اکنون خیلی چیزها را متوجه شده‌ایم. آدم‌ها عاشق وصل کردن نقاط مبهم برای پیدا کردن معنی و ارتباط هستند.

 اکنون انسان‌ها با کمک رایانه‌ها به آسانی می‌توانند مفاهیم و اطلاعات به درد بخور را از بین انبوهی از داده‌های نامفهوم و بدون ساختار به دست بیاورند. این عموم داده همان چیزی است که به آن بیگ دیتا یا کلان داده می گوییم.

بیگ دیتا یا کلان داده یک واژه باب روز برای فرایندهایی شامل استقرار، جمع آوری و تحلیل داده‌های پیچیده می‌باشد که با ابزارهای معمول نمی‌شود از آنها برای دستیابی به اهداف استفاده کرد.

 تعریف ساده بیگ دیتا همه ماجرا را بیان نمی‌کند. در حقیقت اصطلاح بیگ دیتا فقط به داده‌ها اشاره می‌کند در صورتی که بخش بزرگ علیم فرایند برعهده علم داده، استخراج داده، تحلیل داده، یادگیری ماشین و در ابعاد بزرگتر هوش مصنوعی است.

به زبان ساده مفهوم بیگ دیتا یا کلان داده چیست؟

 اگر بخواهیم بیگ دیتا را خیلی ساده و خودمانی تعریف کنیم، داستان کتابفروشی آقای جعفری کار را آسان می‌کند.

 آقای جعفری یک کتاب فروشی قدیمی در مرکز شهر دارد. او از همان دوران جوانی که کتاب فروشی را از پدرش به ارث برد، یک دفتر رو روی میز گذاشت و عنوان هر کتابی که فروخته می‌شود را در کنار تاریخ و قیمت کتاب می‌نوشت. با این دفتر هم حساب و کتابش را داشت هم موقع سفارش کتاب از آن استفاده می‌کرد.

 آقای جعفری هر موقع که می‌خواست به توزیع کننده‌های کتاب سفارش خرید بدهد، نگاهی به دفتر فروش می‌انداخت و کتابهایی را سفارش می‌داد که بیشتر به فروش می‌رفت، موضوعاتی که طرفدار بیشتری داشتند را انتخاب می‌کرد و حواسش به این هم بود که کتاب‌هایی را در لیست کند که در طیف قدیمی کتاب‌های پرفروش باشند.

 کتاب فروش داستان ما با این کار توانست تا چند سال فروش خود را زیادتر کند و نسبت به دیگر کتابفروشی‌ها درآمد بیشتری داشته باشد. او در این مدت علایق مشتریان ثابتش را متوجه شده بود و حتی در مواردی به انتخاب‌های او اعتماد بیشتری داشتند.

آقای جعفری وقتی به دوران پیری رسید پسر جوانش در کتابفروشی کمکش می‌کرد. پسر آقای جعفری رایانه‌ای را به کتابفروشی آورد تا جستجوی موجودی کتابها، حسابرسی مالیات، ثبت سفارش اینترنتی و غیره را با نرم افزارهای کامپیوتر انجام دهد.

 علی فهمید فروش کتاب کمتر و کمتر می‌شود و یکی از دلایل آن تمایل مردم به خرید اینترنتی بود. بنابراین او هم به سرعت یک فروشگاه اینترنتی را آغاز کرد و فروش کتاب با فروشگاه اینترنتی بهتر شد.

 علی از افزایش فروش بسیار خوشنود بود ولی فکر کرد حتماً راه‌های دیگری هم برای افزایش هرچه بیشتر فروش وجود دارد بنابراین شروع به جستجو و تحقیق کرد تا راهی برای افزایش فروش پیدا کند.

 پیش بینی مشتریان

علی فهمید که اگر اطلاعاتی دقیق در مورد مشتریان داشته باشد، می‌تواند پیش بینی کند هر مشتری در آینده به خواندن چه کتابی تمایل دارد و همان کتاب را به او پیشنهاد دهد. این همان تجربه و مهارتی بود که پدرش در طول سال‌ها به دست آورده بود.

علی که در ابتدا نمی‌دانستم باید چه کاری را انجام دهد ساعت‌ها سرچ می‌کرد تا اینکه مطالبی در مورد داده و داده کاوی را مطالعه کرد.

 او خیلی سریع یک شرکت داده کاوی پیدا کرد و درخواستش را مطرح کرد. آن ها به علی پیشنهاد دادند که با جمع آوری داده‌هایی از اینترنت کتاب بعدی که هر مشتری می‌خواهد بخواند را پیش‌بینی کند.

 

 آن‌ها داده‌هایی از منابع زیر جمع آوری کردند:

  •  آمارهایی از کتاب‌های پر جستجو در اینترنت
  • مقالات منتشر شده با موضوع کتاب
  •  توییت هایی که درباره کتاب هستند
  •  داده‌هایی از فعالیت سایر مردم در شبکه‌های اجتماعی مثل نظر در پست‌های اینستاگرام
  •  واکنش به تبلیغات و پیشنهادات
  •  علاقه مندی هایی مثل تیم فوتبال یا موسیقی مورد علاقه
  •  فعالیتشان در شبکه‌های اجتماعی مثل لایک ها
  •  لیست کتابهایی که خوانده‌اند
  •  مشخصات فردی مشتریان

اگر یک شخص علاقه به خواندن رمان‌های علمی تخیلی دارد و در تحلیل داده‌های حاصل از شبکه‌های اجتماعی مشخص شود مردم در حال گفت‌وگو در مورد کتاب علمی تخیلی جدید منتشر شده هستند، با مطابقت دادن پرسونای مشتری و کتاب جدیدی که هنوز نخواندند، می‌شود در قالب یک پیامک کتاب جدید را به آنها پیشنهاد داد.

 علی که توانسته بود فروشگاه اینترنتی خودش را با موفقیت راه اندازی کند از وارد شدن به دنیای داده‌ها هم هراسی نداشت و پیشنهاد شرکت داده‌کاوی را پذیرفت.

رمز موفقیت علی در مبحث بیگ دیتا یا کلان داده

 پس از جمع آوری حجم زیادی از داده‌ها و طراحی مدلی مبتنی بر بیگ دیتا یا کلان داده، فروشگاه اینترنتی علی به یکی از پرفروش‌ترین کتابفروشی های اینترنتی مبدل شد. رمز موفقیت علی همین پیشنهادات کتاب هوشمندی بود که از طریق بیگ دیتا یا کلان داده به دست آورد.

 با استفاده از این روش هر کتاب جدیدی که منتشر می‌شد به صورت هدفمند به اطلاع مشتریانی که به احتمال بالای ۹۰ درصد علاقه ای به خواندنش داشتند می‌رسید و بالای ۵۰ درصد مشتریان کتاب پیشنهادی را خریداری می‌کردند.

اگر علی از همان روش پدرش برای فهرست کردن همه اطلاعات مشتریان و علایق جامعه به کتاب‌های جدید استفاده می‌کرد، قطعاً نمی‌توانست با این کیفیت و در زمانی محدود راهی برای پیشنهاد کتاب به مشتریان پیدا کند. پس از جمع آوری حجم زیادی از داده‌ها و طراحی مدلی مبتنی بر بیگ دیتا یا کلان داده، فروشگاه اینترنتی علی به یکی از پرفروش‌ترین کتابفروشی های اینترنتی مبدل شد. رمز موفقیت علی همین پیشنهادات کتاب هوشمندی بود که از طریق بیگ دیتا یا کلان داده به دست آورد.

در این مثال دو نوع از منبع برای جمع‌آوری داده‌ها استفاده شد:

  •  داده‌هایی از محتواهای تولید شده توسط مردم در فضای مجازی
  •  داده‌هایی از مشتریان سابق

ارتباط داده‌های حاصل از این دو منبع مدلی ایجاد کرد که به کمک آن می‌توانید پیشنهادات شخصی سازی شده و هدفمندی به مشتریان ارائه کرد.

بیگ دیتا یا کلان داده از کجا و چگونه تولید شد؟

 داده‌ها مجموعه‌ای از آمارها و حقایقی هستند که برای تحلیل ذخیره می‌شوند. این تعریف خیلی کلی می‌باشد.

 در کلان داده منظور از داده در هر مرحله از کار فرق دارد. داده خام داده‌ای می‌باشد که بدون ترتیب و طبقه بندی جمع آوری می‌شوند و در آخر مفهوم خاصی را بیان نمی‌کنند. در صورتی که روی داده‌های خام پردازش انجام شود، تبدیل به اطلاعاتی می‌شوند که انتقال دهی مفهومی هستند.

 از صدها راه گوناگون می‌توان داده‌ها را تولید و ذخیره کرد. همین چند دقیقه قبل که روی لینکی کلیک کردید تا این مقاله‌ای که در حال خواندن آن هستید برایتان باز شود، داده‌هایی از فعالیت شما در سرورهای گوگل ذخیره شد.

 داده‌هایی مانند مدل سیستم عامل، دستگاه موبایل یا رایانه شما و محل اتصال شما به اینترنت.

داده ها فقط از فعالیت اینترنت جمع نمی‌شوند. هر منبع دیگری مانند پرسشنامه کاغذی، موقعیت موبایل، فیلم دوربین‌های نظارتی شهرها، بیمه خودرو و درمانی، بلیط اتوبوسی که می‌خرید، اطلاعات تحصیلی و غیره همه داده‌های خام هستند. در آخر همه این داده‌ها دیجیتال می‌شوند تا مراحل بعدی انجام شود. اکنون چند کاربرد علمی بیگ دیتا یا کلان داده را در دنیای امروزی ببینیم و سپس به سراغ جزئیات آن برویم.

کاربردهای بیگ دیتا یا کلان داده

کاربردهای خیلی زیادی را برای بیگ دیتا می‌توان تصور کرد. در ادامه این مقاله با چند مثال واقعی به کاربردهای امیدوارکننده بیگ دیتا در حوزه‌های گوناگون و یک نمونه ترسناک اشاره می‌کنیم.

 بیگ دیتا در آموزش

 در هر مرحله از آموزشی یعنی از کودکی تا آموزش عالی یا هر دوره اموزشی دیگر بیگ دیتا می‌تواند کاربرد متنوعی داشته باشد.

 معمولاً می‌شود انتخاب رشته و کاریابی را برای دانشجویان راحت‌تر کرد، اجرای برنامه‌های همسان آموزشی برای هر دانشجو، ترتیب یادگیری دروس متفاوتی با بهره وری بالاتر پیشنهاد کرد یا با شناسایی نقطه ضعف‌های دوره‌های آموزشی از انصراف و رد شدن دانشجویان جلوگیری کرد.

 یک نمونه اجرا شده از این مثال‌ها تغییر برنامه آموزشی در دانشگاه ایالتی جورجیا می‌باشد. تا چندین سال قبل میانگین دانشجویانی که موفق می‌شدند در این دانشگاه فارغ التحصیل شوند، ۳۲ درصد بود که درصد خیلی پایینی است. این دانشگاه برای پیدا کردن نقاط چالش برانگیز از داده‌ها استفاده می‌کرد.

 آن‌ها با تحلیل داده‌های دانشجویان سابق و فعلی خود ۸۰۰ رفتار مرتبط با عدم موفقیت در دانشگاه را پیدا کردند. یکی از نشانه‌های عدم موفقیت این بود که اگر دانشجوی رشته علوم سیاسی در حوزه مقدماتی علم ‌سیاست نمره c گرفت به احتمال زیاد موفقیت آن تا ۲۵ درصد کاهش می یافت.

 اکنون هر دانشجویی که در این وضعیت قرار می‌گیرد مشاوری با او صحبت می‌کند و به موفقیت او کمک می‌کند. این فقط یکی از ۸۰۰ مشکل کشف شده بود. مدیرهای دانشگاه برای بزرگ‌ترین چالش‌های دانشجویان برنامه‌های متعددی پیاده کردند و در عرض چند سال میانگین فارغ التحصیلی دانشجویان به ۵۴ درصد رسید. در هر مرحله از آموزشی یعنی از کودکی تا آموزش عالی یا هر دوره اموزشی دیگر بیگ دیتا می‌تواند کاربرد متنوعی داشته باشد.

بیگ دیتا یا کلان داده در رسانه و تلویزیون

سریال‌های تلویزیونی که در سال‌های قبل منتشر شده‌اند، داستان‌هایی به مراتب جذاب‌تر دارند. پیدا کردن یک سریال که با روحیات و علاقه هر فرد هم خوانی داشته باشد کار سختی نیست.

 یک نمونه مشهور استفاده از بیگ دیتا در سریال‌های تلویزیونی کمپانی نتفلیکس می‌باشد. این شرکت با کمک بیگ دیتا توانست علایق مردم را شناسایی ‌کند تا در قدم اول سریال‌های بهتری را به مخاطب پیشنهاد دهد و بعد از این داده‌ها در ساخت سریال‌های جدید خود استفاده کند.

حتی همزمان با ساخت انتشار سریال House of Cards از بیگ دیتا برای نوشتن داستان فصل‌های بعدی به نحوی که مخاطب بیشتری را جذب کند استفاده کردند.

 بیگ دیتا در پزشکی و سلامت

 در حوزه سلامت هم پروژه‌های خیلی زیادی با گیتار اجرا شده‌اند. بیشتر این پروژه‌ها با هدف پالایش اطلاعات سلامت شهروندان، دست یابی به دلایل بروز بیماری‌ها و پیشگیری از بیماری‌ها اجرا شده‌اند.

 شرکت  AlayaCare یک نمونه خیلی خوب است کاربرد بیگ دیتا یا کلان داده در حوزه پزشکی و سلامت می‌باشد. این اپلیکیشن که در زمینه مراقبت از سالمندان و بیماران در خانه فعالیت می‌کند، با پایش اطلاعات مشتریان از راه دور و بررسی هوشمند سوابق بیماران، تعداد دفعات مراجعه پزشکان متخصص به خانه افراد را تا ۷۳ درصد کم کرده است.

تعریف و اهمیت متا تگ ها در سئو ی وب سایت شما

 یک نمونه دیگر که در حال متداول شدن در کشورهای پیشرفته می‌باشد، شناسایی فاکتورهای خطرناک در بدن افراد قبل از بروز بیماری است.

 مثلاً با شناسایی الگوی تغییرات ضربان قلب افرادی که در معرض سکته هستند می‌شود از سکته قلبی جلوگیری کرد. با وجود ساعت‌های هوشمند که ضربان قلب، ساعت خواب، فشار خون و غیره را ضبط می‌کنند، جمع‌آوری داده‌های سلامت راحت‌تر از گذشته شده است.

 بیگ دیتا یا کلان داده در بورس

 یافتن زمان درست خرید و فروش سهام یکی از مهمترین اصول فعالیت در بازار بورس می‌باشد. کارگزارها سعی می‌کنند با نگاهی به گذشته و پیش بینی با فرضیات این زمان را تعیین کنند.

در  سال‌های اخیر شرکت‌های سرمایه‌گذاری خیلی زیادی به کمک کلان داده و یادگیری ماشین توانستند سیستم‌هایی با دقت خیلی بالا برای تعیین میزان تأثیر گذاری اتفاقات گوناگون روی بازار بورس بسازند. یافتن زمان درست خرید و فروش سهام یکی از مهمترین اصول فعالیت در بازار بورس می‌باشد. کارگزارها سعی می‌کنند با نگاهی به گذشته و پیش بینی با فرضیات این زمان را تعیین کنند.

 تأثیر ترسناک بیگ دیتا یا کلان داده در انتخابات

  •  بیگ دیتا یا کلان داده مانند هر ابزار دیگری قابل استفاده برای کارهای خلاف قانون یا اخلاق می‌باشد.
  •  مشهورترین مقال آشکار شده از استفاده نادرست بیگ دیتا در انتخاب جمهوری سال ۲۰۱۶ آمریکا اتفاق افتاد.
  •  البته در این موضوع هیچ کار غیرقانونی انجام نشد، در واقع آنها از خلأ قانون و ناآگاهی شهروندان سوء استفاده کردند.
  •  برنده شدن ترامپ در انتخابات ریاست جمهوری حاشیه‌های خیلی زیادی به همراه داشت. این حاشیه‌ها در مورد استفاده از بیگ دیتا برای تبلیغات هدفمند میکرو بود.
  • میکرو تارگتینگ یا تبلیغات هدفمند میکرو یعنی محتوا یا تبلیغی که بیشترین تأثیر را روی فرد دارد، به او نمایش می‌دهند و تبلیغاتی که تأثیر بد می‌گذارد را نمایش نمی‌دهد.

مثال

 مثلاً اگر شخصی دچار بیماری خیلی خاصی شود باید به طور مداوم دارو مصرف کند. طرح کاندید ریاست جمهوری برای پوشش بیمه‌ای داروها را به او نشان می‌دهند و همزمان چون این فرد به حفظ محیط زیست اهمیت زیادی می‌دهد هیچ حرفی از سیاست خروج از معاهده‌های بین المللی محیط زیستی نمی‌زنند.

 لازمه چنین کاری داشتن داده‌های کامل از هر شهروند جامعه می‌باشد. با داده‌های شهروندان می‌شود فهمید کدام شهروندان رأی می‌دهند، چه مشکلاتی در زندگی دارند، چه گرایش سیاسی دارند، کدام یک هنوز شک دارند به چه کسی رأی دهند و دهها اطلاعات کاربردی دیگر.

ستاد  تبلیغاتی ترامپ همین کار را با کمک داده‌های شهروندان آمریکایی کرد. ولی چون این اتفاق افتاد و چرا در همان دوره کسی نفهمید در بخش بعدی می‌خوانیم.

 رئیس جمهور شدن ترامپ با کمک بیگ دیتا یا کلان داده

 در انتخابات قبل از سال ۲۰۱۶ از بیگ دیتا برای پیش بینی نتایج یا شناسایی مناطق مناسب برای تبلیغات استفاده شده بود ولی اتفاقی که در سال ۲۰۱۶ رخ داد جدیدتر و وسیع‌تر بود.

 این داستان از یک شرکت داده کاوی به نام کمبریج آنالیتیکا آغاز شد که در ابتدا با هدف تحقیقات آکادمیک شکل گرفت. ولی بعد از چند سال در چندین انتخابات به خدمت کمپین‌های تبلیغاتی درآمد. اینگونه می‌گویند که این شرکت در ۴۴ انتخابات روی رأی دهنده‌ها تأثیر گذاشته است.

 کاری که این شرکت می‌کرد چندان هم پیچیده نبود. آن‌ها و داده‌های حاصل از فعالیت کاربران در شبکه‌های اجتماعی و سرویس‌های گوناگون اینترنتی که اطلاعات حریم خصوصی را شامل نمی‌شوند و دسته دوم راهنمایی از طریق اپلیکیشن های تست شخصیت روانشناسی اطلاعات کاملی درباره حدود ۸۰ میلیون کاربر را تحلیل و ارزیابی کردند.

 شرکت کمبریج از ستاد تبلیغاتی ترامپ ۵ میلیون دلار گرفت تا با استفاده از داده‌ها شهروندان را قانع کند که به ترامپ رأی بدهند.

 این شرکت توانست با داده‌های حاصل از متریک‌های روانشناسی مانند پنج عامل بزرگ شخصیت، محل سکونت، علایق فردی، وضعیت اقتصادی و غیره مدلی بسازد که نشان می‌داد به احتمال خیلی زیاد به چه کسی رأی می‌دهد یا برای رأی دادن چقدر شک دارد.

 این اطلاعات در اختیار ستادهای انتخاباتی هر شهر گذاشته شد و محتوای تبلیغاتی به شکلی کاملاً هدفمند و طبق وضعیت شهروندان پخش شد. با داشتن اطلاعاتی مانند آدرس ایمیل یا آدرس خانه کافی بود محتوای که هر شهر علاقه به شنیدن دارد را به او برساند.

حتی کارمندان این ستادها از همین اطلاعات در تبلیغات خانه به خانه استفاده می‌کردند. اشخاص داوطلب کمپین‌ها به در خانه‌ها می‌رفتند و با گفتگوی مستقیم شهروندان را برای رأی دادن به ترامپ قانع می‌کردند.

 پس از انتخابات و برنده شدن ترامپ اخبار جنجالی خیلی زیادی در مورد همکاری فیسبوک که بیشترین سهم از داده‌های جمع شده توسط کمبریج را داشت منتشر شد.

بعد از سر و صداهایی که شد، فیسبوک و چندین شرکت دیگر که به نوعی این داده‌ها را در اختیار کمپین ترامپ گذاشته بودند، سیاست‌های فروش داده را تغییر دادند و دسترسی اپلیکیشن های تست شخصیت روانشناسی آنها هم قطع شد.

در آخر شرکت کمبریج در سال ۲۰۱۸ اعلام ورشکستگی کرد ولی ترامپ اکنون رئیس جمهور آمریکا است. فکر می‌کنید این آخرین استفاده از بیگ دیتا یا کلان داده در انتخابات بود؟

در قسمت‌های بعدی ویژگی‌های بیگ دیتا را مرور می‌کنیم و با چند نکته بیگ دیتا یا کلان داده را واضح‌تر تعریف می‌کنیم. رئیس جمهور شدن ترامپ با کمک بیگ دیتا یا کلان داده

 ویژگی‌های بیگ دیتا یا کلان داده

برای بیگ دیتا یا کلان داده در ابتدا سه ویژگی گفته می‌شد. ولی اکنون میگویند کلان داده دارای ۵ ویژگی می‌باشد.

 حجم زیاد

 زمانی که از داده‌های کلان صحبت می‌کنیم، معلوم است که منظورمان چند ردیف مشخصات افراد در فایل اکسل باشگاه مشتریان نمی‌باشد.

 وقتی می‌شود از اصطلاح کلان داده استفاده کرد، که حجم داده‌های جمع آوری شده آنقدر زیاد باشد که با ابزارهای معمولی نشود آنها را تحلیل کرد.

در ضمن توجه کنید که استفاده از واحدهای اندازه‌گیری مانند ترابایت یا پتابایت نیز برای تعریف حجم داده چندان درست نیست. زیرا وابسته به نوع داده می‌باشد. برای مثال حجم فیلم و تصویر قابل مقایسه با نوشتار نیست.

 نرخ تولید بالا

 در خیلی از موارد جمع آوری داده‌ها به صورت مقطعی نیست. یعنی این داده‌ها همچنان تولید می‌شوند و حجم اطلاعات بزرگتر و بزرگ‌تر می‌شود.

به لطف اینترنت و فناوری‌های جمع آوری داده، جمع آوری حجم زیاد اطلاعات کار راحتی شده است.

 بهترین نمونه از نرخ تولید بالای داده، می‌توان شبکه‌های اجتماعی را نام برد. در هر ثانیه میلیون‌ها نفر در شبکه‌های اجتماعی مشغول فعالیت هستند. بهترین نمونه از نرخ تولید بالای داده، می‌توان شبکه‌های اجتماعی را نام برد. در هر ثانیه میلیون‌ها نفر در شبکه‌های اجتماعی مشغول فعالیت هستند.

 تغییر پذیری و تنوع زیاد

 همه این اطلاعات یک نوع و یکدست نیستند. مثلاً در شبکه اجتماعی توئیتر روزانه میلیون‌ها نوشته ویدیو عکس و لینک به اشتراک گذاشته می‌شود. هر کدام از توییت ها خودشان حاوی ده ها اطلاعات دیگر هستند از اطلاعات ساده‌ای مانند ساعت و تاریخ تولید تا اطلاعات عمیق‌تر مانند موضوع محتوا و چگونگی واکنش کاربران به آن. اگر یادتان باشد در داستان کتاب فروشی آقای جعفری هم از چند نوع داده گوناگون استفاده شده بود.

 صحت داده‌ها

داده‌هایی را می‌توان در رده بیگ دیتا یا کلان داده گذاشت که از صحت آن مطمئن باشید. این ویژگی کلان داده شاید بدیهی به نظر برسد ولی همین اطمینان از صحت منابع، استانداردها و شاخص‌های پیچیده و تخصصی دارد که به تحلیل گرها کمک می‌کند به خطا نروند.

 در مرحله فیلتر کردن داده‌ها اطمینان یافتن از صحت خیلی مهم و ضروری می‌باشد. اگر داده‌ها صحت کافی نداشته باشند، همه مراحل بعدی تحت تأثیر قرار می‌گیرد و نتایج درستی حاصل نمی‌شود.

 ارزش

 برای اینکه بفهمید داده ارزش دارد یا نه باید جواب یک سؤال مهم را پیدا کنید:

 چگونه می‌توان از داده‌ها برای استخراج چیزی با معنی در راستای اهداف افراد یا کسب و کارها استفاده کرد؟

 داده‌ای ارزشمند است که در رسیدن به این هدف کمک کند. اگر نه بیشتر داده‌ها بی ارزش می‌باشند. در خیلی از سازمان‌ها و شرکت‌ها روزانه حجم زیادی داده تولید می‌شوند که شاید مدیران در اولین نگاه فکر کنند با ارزش هستند ولی در حقیقت داده‌هایی هرز باشند.در خیلی از سازمان‌ها و شرکت‌ها روزانه حجم زیادی داده تولید می‌شوند که شاید مدیران در اولین نگاه فکر کنند با ارزش هستند ولی در حقیقت داده‌هایی هرز باشند.

 بیگ دیتا یا کلان داده چه چیزی نیست؟

تا مدتها بعد از اینکه فناوری و مفهوم جدیدی وارد بازار می‌شود همه می‌خواهند موج سواری کنند. این کوشش برای بهره برداری هرچه بیشتر از فناوری جدید موجب می‌شود هر شخصی بنا به نیازهایش تعریف جدیدی ارائه بدهد.

بیگ دیتا یا کلان داده هم مانند دیگر فناوری‌های پیچیده و تخصصی دارای ده‌ها تعریف درست و نادرست می‌باشد. در ادامه این مقاله با اشاره به سه نکته تلاش می‌کنیم اشتباهات متداول را از زهن پاک کنیم.

بیگ دیتا یا کلان داده فقط انبوهی از داده‌ها نیست

 اشتباه متداول در ردیف بیگ دیتا مساوی با فرض کردن هر حجم بزرگی از داده با بیگ دیتا می‌باشد. اگر یک بانک با سابقه از ده‌ها سال قبل شروع به ذخیره همه اطلاعات مشتریان خود کند و هر روز به این حجم از داده‌ها اضافه شود باز هم نمی‌شود به آن بیگ دیتا یا کلان داده گفت.

 چند منبعی بودن داده‌ها یک ویژگی مشترک در بیگ دیتا می‌باشد. یعنی اطلاعات جمع آوری شده مربوط به یک دیتا بدون تنوع زیاد نیست. همانگونه که در مثال ساده کتابفروشی گفتیم شرکتی که پروژه بیگ‌دیتا را اجرا کرد فقط از دیتا فروش یا کلید واژه‌های جستجو شده قبل از ورود به سایت استفاده نکرد.

در این مثال داده‌های جمع آوری شده از شبکه‌های اجتماعی اخبار و محتوای منتشر شده با موضوع کتاب و علایق افراد در کنار اطلاعات هر مشتری بررسی می‌شود تا الگوی دقیق برای پیش‌بینی کتاب بعدی که مشتری تمایل به خواندنش دارد ساخته شود.

 صحیح است که گفتیم ویژگی اول بیگ دیتا حجم زیاد آن می‌باشد ولی هر داده بزرگی بیگ دیتا یا کلان داده نیست.

 

 بیگ دیتا پاسخی به همه سؤالات نیست

 استفاده از بیگ دیتا همیشه مساوی با پیدا کردن جواب سؤالات نیست. اگر کسب و کار بزرگی دارید که با سوالات متعدد و مشکلاتی روبرو است و فکر می‌کنید می‌شود با تحلیل بیگ دیتا راه حل همه سؤالات و مشکلات را یافت کاملاً در اشتباهید.

 خیلی وقتها هدف از بیگ دیتا یافتن سؤالات است نه جوابها. مثلاً رصد بازار یک نمونه پرکاربرد است که هر تغییر پیش بینی نشده یک سوال ایجاد می‌کند.

 همیشه بیگ دیتا یا کلان داده یک راهکار زود بازده و تضمین شده نیست

 خیلی از کسب و کارها با شنیدن وعده شرکت‌های بیگ دیتا فکر می‌کنند در عرض چند ماه می‌توانند از نتایج حاصل از کلان داده بهره مند شوند؛ ولی در حقیقت این گونه نیست. بعضی وقت‌ها ممکن است پروژه‌های خیلی بزرگی مبتنی بر کلان داده به سرمایه‌گذاری ۱۰ ساله نیاز داشته باشد.

سئو و بهینه سازی وب سایت و افزایش میزان ترافیک ورودی سایت

 فکر می‌کنیم اکنون به طور کامل با مفهوم بیگ دیتا آشنا شده باشید. در ادامه با انواع تحلیل بیگ دیتا و اهداف آنها آشنا می‌شوید. خیلی از کسب و کارها با شنیدن وعده شرکت‌های بیگ دیتا فکر می‌کنند در عرض چند ماه می‌توانند از نتایج حاصل از کلان داده بهره مند شوند؛ ولی در حقیقت این گونه نیست. بعضی وقت‌ها ممکن است پروژه‌های خیلی بزرگی مبتنی بر کلان داده به سرمایه‌گذاری ۱۰ ساله نیاز داشته باشد.

 انواع تحلیل بیگ دیتا یا کلان داده

 هدف تحلیل بیگ دیتا به هدف کسب و کاری که می‌خواهد آن را اجرا کنید وابسته می‌باشد. ولی به هرحال خروجی هر تحلیل باید گزارش، روند، الگو، مدل یا پیش‌بینی باشد.

 به صورت کلی می‌شود انواع تحلیل مبتنی بر بیگ دیتا را به چهار نوع تقسیم کرد:

تحلیل توصیفی

نتیجه تحلیل توصیفی یک جدول نمودار یا هر نوع گزارش دیگر می‌باشد که به مدیران کمک می‌کند بفهمد در یک نقطه معین چه اتفاقی در حال رخ دادن می‌باشد. این نوع تحلیل بر روی رخدادهای گذشته متمرکز است.

 تحلیل تشخیصی

 تحلیل تشخیصی به دنبال چرای به وجود آمدن یک مشکل می‌باشد. این نوع تحلیل نسبت به توصیفی پیچیده‌تر و عمیق‌تر می‌باشد و به همین خاطر در بیشتر موارد نیازمند سیستم‌های مبتنی بر هوش مصنوعی و یادگیری ماشین می‌باشد.

 تحلیل پیش بینی

 با در کنار هم قرار گرفتن الگوریتم‌های پیشرفته و هوش مصنوعی می‌شود قبل از وقوع مشکل آن را پیش بینی کرد. ی مشکلی قبل از وقوع پیش‌بینی شود می‌شود تا حد زیادی در هزینه‌ها صرفه جویی کرد.

تحلیل تجویزی

 این نوع از تحلیل پیچیده‌ترین و پرهزینه‌ترین نوع تحلیل بیگ دیتا یا کلان داده می‌باشد. در این نوع تحلیل راهکار مشکلاتی که هنوز اتفاق نیفتاده‌اند نیز معلوم می‌شوند. این نوع از تحلیل پیچیده‌ترین و پرهزینه‌ترین نوع تحلیل بیگ دیتا یا کلان داده می‌باشد. در این نوع تحلیل راهکار مشکلاتی که هنوز اتفاق نیفتاده‌اند نیز معلوم می‌شوند.

 کاربرد بیگ دیتا یا کلان داده در دیجیتال مارکتینگ

خوب تا به اینجای مقاله از سیاست، آموزش، سلامت و غیره حرف‌هایی زدیم و ویژگی‌های بیگ دیتا یا کلان داده را با هم مرور کردیم. اکنون می‌رسیم به دیجیتال‌مارکتینگ که بیگ دیتا یا کلان داده در آن کاربردهای خیلی زیادی دارد و مطمئناً در آینده هم بیش از اینها ما را شگفت زده می‌کند.

 از بیگ دیتا در دیجیتال مارکتینگ برای دستیابی به اهداف گوناگونی استفاده می‌شود که عبارتند از:

  •  بهینه سازی هزینه‌ها
  •  افزایش تاثیرگذاری کمپین‌های تبلیغاتی
  •  هدف گیری شخصی سازی شده
  •  عقیده کاوی
  •  شناخت مشتریان

 شناخت مشتریان در مبحث بیگ دیتا یا کلان داده

 هر کسب و کاری باید پرسونای مشتریان را بداند. اگر از بیگ دیتا یا کلان داده در شناخت مشتریان استفاده کنید، می‌توانید به صورت زنده تغییرات را دنبال کنید و به آنها واکنش نشان دهید.

 برای مثال با استفاده از دیتاها می‌توانید بدانید که کدام دسته از مشتریان را جذب می‌کنید؟ مشتریان چگونه شما را پیدا می‌کنند؟ مشتریان با ایمیل‌های شما چگونه ارتباط برقرار می‌کنند؟ ارتباط آنلاین شما با مشتریان چطور است؟

 این اطلاعات بعداً در ترسیم پرسونا به شما کمک می‌کند تا مخاطبان هدفتان و رفتار آنلاین مشتریانتان را بشناسید.

 عقیده کاوی

 در حال حاضر راه‌های خیلی زیادی برای کاوش در دیدگاه مشتریان موجود است. یک روش متداول در شناخت مشتریان با بیگ دیتا یا کلان داده عقیده کاوی می‌باشد. با عقیده کاوی می‌شود فهمید همین حالا مردم نسبت به برند کسب و کار نظر مثبتی دارند یا خیر؟

مثلاً اگر توییت‌های مردم در مورد برند z به صورت دائم مورد ارزیابی قرار بگیرد در هر لحظه می‌توان صداهای مثبت یا منفی مشتریان را شنید. فکر کنید که هر روز هزاران نظر مانند موارد زیر در مورد برندی منتشر می‌شود. با داشتن این داده‌ها عقیده کاوی کار راحتی می‌شود.

  • قیمت‌های Z آنقدر بالا است که هر بار سایتش را باز می‌کنم از زندگی ناامید می‌شوم (منفی)
  • من عاشق برند Z هستم. پشتیبانی عالی، سرعت عالی اصلاً همه چی عالی (مثبت)
  • امروز از Z سفارش دادم بعد از واریز پول زنگ زدن موجودی نداریم. اگر موجود نداشتید چرا برای فروش گذاشتید؟ (منفی)

با تحلیل این نوشته‌ها توسط نرم‌افزار می‌توان فرصت‌های جدیدی را پیدا کرد، کیفیت محصولات را بهبود بخشید، خدمات مشتریان را ارتقا داد و نقاط ضعف و قوت برند را یافت.

 هدف‌گیری شخصی سازی شده

این روزها تبلیغ هدفمند و شخصی سازی شده به یک ضرورت برای کسب و کارها مبدل شده است. ابزارهای بیگ دیتا یا کلان داده می‌توانند با بررسی موقعیت جغرافیایی، سابقه کلیک‌ها، سابقه اینترنت گردی، سابقه خرید و لایک ها و غیره تشخیص دهند که چه تبلیغی باید به کدام کاربر نشان داده شود.این روزها تبلیغ هدفمند و شخصی سازی شده به یک ضرورت برای کسب و کارها مبدل شده است. ابزارهای بیگ دیتا یا کلان داده می‌توانند با بررسی موقعیت جغرافیایی، سابقه کلیک‌ها، سابقه اینترنت گردی، سابقه خرید و لایک ها و غیره تشخیص دهند که چه تبلیغی باید به کدام کاربر نشان داده شود.

 مثال

 نمیدانم تا الان با گوگل ادز کار کرده‌اید یا نه. ولی با این غول تبلیغات گوگل آنقدر هدفمند می‌توانید تبلیغاتتان را به مشتریان نشان دهید که بازدهی آن چندین برابر روش‌های دیگر می‌شود.

 مثلاً شما می‌توانید یک کمپین تبلیغاتی را در گوگل اجرا کنید و از آن بخواهید تا تبلیغ شما را به مردهای ۲۳ تا ۳۸ ساله که به بازاریابی دیجیتال علاقه مند هستند نمایش دهد. گوگل با دیتاهایی که در اختیار دارد به خوبی خواسته شما را هدف قرار می‌دهد و تبلیغ تان را به افراد مناسب نشان می‌دهد.

 افزایش تاثیرگذاری کمپین‌های تبلیغاتی

 زمانی که قرار است یک کمپین پیامکی اجرا کنید، ابتدا باید به سه سؤال مهم پاسخ دهید:

  •  برای چه کسانی بفرستیم؟
  •  چه چیز جالبی پیشنهاد کنیم؟
  •  چه زمانی ارسال کنیم؟

با تحلیل کلان داده‌ها به آسانی می‌توانید به این 3 سؤال جواب دهید.

روش سنتی از طریق آزمون و خطا و تحلیل شهودی تصمیم گرفته می‌شود که برای مثال پیامک در ساعت ۹ شب برای مشتریان رده سنی ۲۰ تا ۳۰ سال و حاوی کد تخفیف ۱۰% ارسال شود. ولی با تحلیل بیگ دیتا یا کلان داده می‌شود ۱۰ پیامک هدفمند ساخت که در ده زمان گوناگون و با پیشنهادات متنوع ارسال شود.

 زیرا می دانیم کدام کاربر در چه زمانی وقتش آزاد است و چه چیزی می‌تواند او را به یک سر نخ یا مشتری تبدیل کند.

 بهینه سازی بودجه بازاریابی

 تعیین و اختصاص بودجه برای مدیران بازاریابی کار چالش برانگیزی می‌باشد. در کدام مرحله قیف فروش باید هزینه مشتری شود؟ کدام مرحله نیازی به هزینه ندارند؟ کدام کانال ارزش هزینه دارند؟

 پاسخ دادن به هر کدام از این سؤالات و ده‌ها سؤال دیگر نیاز به ساعت‌ها تحلیل و بررسی دارد. بعضی وقت‌ها موضوع پیچیده‌تر هم می‌شود. زیرا دنبال کردن سفر مشتری از چند کانال، پلتفرم و دستگاه گوناگون کار خیلی سخت و دشواری می‌باشد.

 مثلاً اگر کاربری صبح زمانی که سرکار است با خبر شود که فردا تولد مادرش می‌باشد، برای خرید هدیه روز تولد با رایانه شرکت در گوگل سرچ می‌کند و چند پست و وبلاگ مطالعه می‌کند، چند محصول هم می‌بیند ولی چیزی را خریداری نمی‌کند.

 زمانی که در مسیر سوار تاکسی می‌شود با موبایل برای چند محصول مشابه دیگر جستجو می‌کند و باز هم چیزی خریداری نمی‌کند.

 در آخر وقتی شب در کنار همسرش است با او مشورت می‌کند و یکی از محصولات را که همسرش در اینستاگرام دیده بود را سفارش می‌دهند.

 دنبال کردن این نوع کاربران و بهینه‌سازی بودجه بازاریابی در این حالت کار خیلی سختی است به دلیل اینکه چندین کلید واژه گوناگون را در چند دستگاه گوناگون سرچ کردند در شبکه‌های اجتماعی سرک کشیند، چند لندینگ پیج و صفحه محصول را نگاه کردند و در آخر یکی را انتخاب کردند.

یکی از ابزارهای عالی برای دستیابی به این هدف سرویس Google Attribution می‌باشد که با کمک بیگ دیتا یا کلان داده و یادگیری ماشین کاربران را رصد می‌کند.

 اگر شما صاحب کسب و کاری هستید که نیاز به داده کاوی دارد تا مشکلی را حل کند یا صرفاً به دنبال پیشرفت هستید، با توجه به سطح پیچیدگی اهدافتان باید یکی از راه‌های موجود را برگزینید. اگر شما صاحب کسب و کاری هستید که نیاز به داده کاوی دارد تا مشکلی را حل کند یا صرفاً به دنبال پیشرفت هستید، با توجه به سطح پیچیدگی اهدافتان باید یکی از راه‌های موجود را برگزینید.

ابزارهای داده کاوی برای کسب و کارهای متوسط و کوچک

 فهرست ابزارهای حوزه بیگ دیتا یا کلان داده آنقدر وسیع است که در این مقاله نمی‌شود همه آنها را معرفی کرد.

 ابزارهای خیلی زیادی هستند که فقط با مشخص کردن نیازها و اهداف کار را برای کسب و کارها راحت کرده‌اند. ولی شاید هیچ کدام از این ابزارها نیاز شما را برطرف نکنند زیرا داده‌هایی دارید که می‌خواهید خودتان به طور مستقیم تحلیل کنید.

 مثال

 فرض کنید شما یک فروشگاه اینترنتی پوشاک دارید. برند شما در مجموعه شبکه‌های اجتماعی یک میلیون دنبال‌کننده دارد. می‌خواهید با تحلیل نظرات کاربران در سایت و شبکه‌های اجتماعی بدانید کاربران بیشتر دنبال چه محصولاتی هستند و نسبت به برند شما چه دیدگاهی دارند.

 در جواب به این نیاز چندین راهکار گوناگون می‌شود پیشنهاد کرد. اگر صاحب کسب و کار کوچک یا متوسط هستید و می‌خواهید از داده‌های موجود بهره برداری کنید، ما به شما استفاده از یک ابزار نسبتاً ساده و بدون کدنویسی مانند رپید ماینر را پیشنهاد می‌کنیم.

 شما می‌توانید با رپیدماینر از داده‌ها در کارهای زیر استفاده کنید:

  •  استخراج اطلاعات کاربردی از داده‌های نوشتاری
  •  مدیریت ریسک
  •  پیش بینی خرید مشتری
  •  بهینه سازی قیمت‌ها
  •  شناسایی تقلب و فعالیتهای مشکوک
  •  پیش بینی تقاضا
  •  تحلیل صدای مشتری
  •  تحلیل و دسته بندی مشتری

 ابزارهای جایگزین دیگری وجود دارند که در قسمت پایین آن‌ها را برایتان نام می‌بریم:

  • SAS
  • Orange
  • Knime
  • IBM SPSS Modeler

معرفی این ابزارها در همین حد که کلید واژه‌هایی برای جستجوی راهکارهای مورد نیاز خود پیدا کنید مفید هستند.معرفی این ابزارها در همین حد که کلید واژه‌هایی برای جستجوی راهکارهای مورد نیاز خود پیدا کنید مفید هستند.

آینده بیگ دیتا یا کلان داده

 متخصصین علوم داده می گویند هر انسانی در حال حاضر در شهری پیشرفته زندگی می‌کند و به لوازم دیجیتال دسترسی دارد و هر ثانیه حدود یک و نیم مگابایت داده تولید می‌کند. این رقم هر روز بزرگتر می‌شود و این داده‌ها با سرعت بیشتری ذخیره می‌شوند.

‌بیگ دیتا یا کلان داده در معنای دقیقش چیز عجیب و غریبی نیست. در حقیقت ما انسان‌ها می‌دانستیم که با داشتن داده‌های بیشتر می‌شود ارتباط پدیده‌ها را کشف کرد؛ ولی امکانات و بستری برای این کار نداشتیم.

 به لطف اینترنت و ظهور بقیه فناوری‌ها این بستر فراهم شد و در آینده‌ای نزدیک با گسترش بیشتر اینترنت اشیا سرعت و حجم تولید داده افزایش چشمگیری پیدا می‌کند.

 در این کسب و کارها به اینکه آنها ناچارند به سمت فرآیندهای داده محور بروند شکی نیست. ولی آنهایی موفق می‌شوند که هرچه زودتر وارد این عرصه شوند.

 

ممنون که تا پایان این مقاله همراه وبسایت استاد وب بودید. امیدواریم مطالب و نکات گفته شده برای شما مفید واقع شده باشد. شما می‌توانید در صورت تمایل برای مطالعه مقالات بیشتر به لینک مقالات زیر مراجعه کنید.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا
Scroll to Top