بهره گیری از کلان داده ها ، تجزیه و تحلیل آنها به عنوان تکنیکی برای طراحی خط مشی گذاری عمومی

مقدمه :

در اقتصادهای مدرن ، داده ها به عنوان یکی از مهمترین عوامل تولید محسوب می شوند به طوری که امروزه حجم داده های تولید شده از ظرفیت موجود و فیزیکی برای ذخیره سازی آنها به مراتب بیشتر است و این مورد به وضوح نشان می دهد که ما امروزه در عصر حکمرانی داده ها زندگی می کنیم. ( پاتریسیو رودریگرز و همکاران ، 2017 : 1 )

بنابراین این روند و ظرفیت پیش رو ، ایجاد تخصص های مختلف را به منظور بهره گیری بیشتر از ارزش واقعی داده ها را می طلبد.در یک نگاه رادیکالی ، تولید داده ها را سناریوی تولید دانش می دانند و بدین معنی است که روش های سنتی علمی دیگر ضرورت و کاربردی در این عصر ندارند زیرا داده ها با هویتی جدید، حرف های جدیدی دارند و انگار برای خودشان صحبت می کنند ( آندرسون ، 2016) از این رو است که محققین به هویت مستقل و ناشناخته داده ها اشاره می کنند. 

اما نکته این است که در عمل چنین اتفاق نمی افتتد، انگار به نوعی در شرح هویت کلان داده ها غلو شده است.در یک مثال، آنها نتوانستند بیماری چون آنفولانزا را پیش بینی کنند ( بالتر ، 2013 : 155 ) یا اگر امرزو به آن بلوغ رسیده و در پیشگویی رخدادها موفق بوده اند حداقل ما بی اطلاع هستیم اما تجربه کوید19 بیان گر همان نکته آقای بالتر است. خلاصه این که این تفاسیر و نقدها این نکته را گوشزد می کند که برای شناسایی پتانسیل واقعی کلان داده ها ، درک بیشتر از هویت و جایگاه آن ضروری می باشد.

از طرفی هم این موضوع را می دانیم که این درک بدون توسعه ابزارهای فناوری اطلاعات و ارتباطات امکان پذیر نیست و نتیجه مورد انتظار حاصل نمی آید. لذا اگر سازمانی ، دولتی یا حاکمیتی بخواهد پس از این تصمیم گیری های خود را مبتنی بر شواهد حاصله از تجزیه و تحلیل کلان داده ها بدست آورد، بایستی راهبرد ایجاد زیرساخت های لازم و ابزارهای متنوع فناوری را در برنامه سازمان و دولت خود قرار دهد.

استفاده از کلان داده ها و تکنیک های تحلیلی آنها برای طراحی و اجرای خط مشی های عمومی در آمریکای لاتین و کارائیب

جدول زیر ماحصل یافته های تحقیقات پاتریسیو رودریگرز و همکارانش در سال 2017 می باشد.

روش شناسی
شرح
کاربرد
بهینه سازی
استفاده از تکنیک های مدل سازی عددی برای طراحی مجدد و فرآیندهای بهبود یافته در سیستم های پیچیده و چند بعدی
در سطح بهینه سازی تخصیص منابع در بیمارستان ها ، مدارس ،
مراکز تولید و انبارها

آزمون A/B
تکنیکی شامل یک گروه کنترل و چندین گروه آزمون برای تعیین اینکه چه تغییراتی می تواند در جوامع مختلف حاصل شود. 
تعداد تست ها باید در حدی بزرگ باشد که اطمینان لازم از نتایج حاصله ایجاد شود.
آزمایش اثربخشی یک شیوه درمان خاص 
شبیه سازی
روشی برای پیش بینی و برنامه ریزی یک سناریو.
پیش بینی عملکرد مالی سازمان های مختلف در مناطق جغرافیایی مختلف.
تجسم تحلیلی از دادها
راهی برای کشف و درک الگوها از مجموعه داده ها. 
پیش بینی تغییرات اقلیمی و آب و هوایی، با هدف اتخاد بهترین تصمیم گیری و خط مشی گذاری
تجسم داده ها
نمایش واضح و موثر حاصل از ارتباط داده ها ، روشی گرافیکی   – تعاملی از نمایندگی داده ها.
ایجاد انواع اینفوگرافیک های خاص حاصل از ردیابی یک سوژه خاص یا   حاصل از ترکیب یا ظهور نمایندگی های مختلف.

اما برای انجام این امور از فناوری هایی استفاده شده است که بصورت خلاصه به برخی از آنها اشاره می شود:

  • بسترهایی که حاوی این اطلاعات و کدها هستند نظیر ابزاری چون هدوپ و اسپارک
  • مخازنی جهت نگهداشت داده های ساختار یافته ، نیمه ساختار یافته و یا بدون ساختار نظیر ابزاری چون بانک اطلاعاتی های : SQL Server ، Azure SQL و No SQL  و سیستم های مدیریت پایگاه داده نظیر ابزارهایی چون My SQL و اوراکل
  • مخازنی برای نگهداشت داده های غیر مرتبط ، نظیر ابزاری چون MongoDB و کاساندرا 
  • ابزارهایی برای تجسم داده ها با هدف ایجاد نتایج سفارشی و خاص ، نظیر ابزارهایی چون D3jsGoogle ، Charts و Tableau, Vega 
  • سیستم های برای ذخیره سازی ، پردازش و تجزیه و تحلیل انواع داده های جغرافیایی نظیر ابزارهای چون : Leaflet ، PostGIS, Esri 
  • و در نهایت سیستم هایی تعامل برای دسترسی آسان و تحت وب به اطلاعات و داده ها با استفاده از ابزارهایی نظیر Amazon Web,  Google Cloud, Microsoft Azure,

استفاده از تجزیه و تحلیل های پیشرفته کلان داده در خصوص خط مشی های عمومی و همچنین طراحی  ، پیاده سازی و ارزیابی آنها

هدف از علم داده ها تولید شواهد مرتبط ، با کیفیت و به موقع برای شناسایی مشکلات و راهنمای تصمیم گیری درست و به موقع است که بدون توجه به این عوامل به نظر می رسند تصمیم گیری درست اتفاق نیافتد و یا اینکه از آن، طرح عملیاتی مطلوبی حاصل نشود. لذا و از این رو ، چنین فرایندی به عنوان تصمیم گیری مبتنی بر داده شناخته می شود. شواهد قویی وجود دارد که نشان می دهد برنامه های کاربردی کلان داده ها می توانند نقش های مهمی در اجرای خط مشی ایفا کنند.( پرووست و فائوکت ، 2013 : 51)

در یک مثال خاص ، بانک جهانی اولین چالش نوآوری در کلان داده ها را آغاز کرد و در این خصوص به یک سری ابتکارات در جهت و حمایت از ارزش داده محوری اقدام نمود که در زیر به برخی از آنها اشاره شده است:

  • فقر: به عنوان مثال در بیش از 60 هزار روستا از کشورهای هند ، سریلانکا و پاکستان ، از تصاویر ماهواره ای شبانه برای تحلیل دسترسی عموم مردم به برق استفاده شد و یا استفاده از همین فناوری با هدف اندازه گیری متغیرهای دیگری از شاخص های فقر نظیر تعداد اتومبیل ، متراژ و نوع خانه های ساخته شده ، پوشش کف خیابان ( آسفالت یا خاکی بودن ) ، تعداد خیابان های طراحی شده تا رابطه فقر با آن مسئله خاص از کشور مد نظر را تحت نظر و بررسی قرار دهد.
  • جرم و امنیت: در بوگوتا پایتخت کلمبیا ، یک مطالعه تحقیقاتی با کمک تجزیه و تحلیل کلان داده ها با هدف بررسی رابطه بین جرم و جنایت و مکان و زمان احتمالی آن حملات و قتل ها صورت پذیرفت، در این مثال خاص از اطلاعات حاصل از زیرساخت های شهری ایجاد شده نظیر اطلاعات حاصل از مسیر اتوبوس های تندرو یا همان BRT و مدل سازی آنها برای تجزیه و تحلیل داده در مناطق خاصی در نزدیکی بیمارستان ها ، مدارس ، داروخانه ها و ایستگاه های اتوبوس که مستعد حمله و قتل در این شهر هستند؛ استفاده گردید تا مشخص شود ساعات اوج این حملات چه زمانی است و احتمالا در چه مکان هایی رخ می دهند،که پس از این سازمان های مرتبط با تامین امنیت شهروندان بتواند در پیش بینی های جرم و آسیب شناسی شهری برای مقابله با مجرمان بالقوه از این داده ها استفاده و خط مشی های امنیتی مناسب را طراحی و پیشنهاد دهند. 
  • حمل و نقل: در یک مثال کاربردی دیگر و در کشور فیلیپین شاهد توسعه دو برنامه کاربردی ،با هدف ایجاد یک پرتال تعاملی باز برای روان سازی ترافیک بودیم که امکان بررسی وضعیت ترافیکی را به شهروندان گزارش بدهد.در این مثال با نصب سخت افزرهای ردیاب یا همان GPS Tracker ها بروی تاکسی های این شهر و همچنین اطلاعات بدست آمده از گوشی های رانندگان تاکسی ، داده های لازم برای تجزیه و تحلیل کلان داده ها در آزمایشگاه ایجاد شد و محققین مشغول به تجزیه و تحلیل داده های ترافیکی شدند ، ماحصل این تحقیقات منجر به تولید دو برنامه کاربردی و عمومی گردید که هم به شهروندان اطلاعات ترافیکی را نمایش دهد و هم به سازمان ها دولتی و خصوصی که می خواهند بر اساس این داده ها خط مشی های دیگری را ایجاد یا توسعه دهند. 
  • سلامت: در آفریقای جنوبی ، در یک ابتکار عمل در استفاده از کلان داده های مرتبط با سلامت عمومی برای شهروندان امکان شناسایی مکان هایی که بالاترین تعداد بیماران مبتلا به ایدز را دارند فراهم آمد. همچنین از این داده ها ، بر اساس اطلاعات و داده های های حاصل از تحلیل گراف های حرکتی بیماران در سایر سطوح ملی ، استانی برای خط مشی گذاری های مقابله و یا ایجاد کلینیک های درمانی و پیش گیری های زود هنگام استفاده شد.

از دیگر مثال های مشابه و عملیاتی شده توسط دیگر سازمان ها ، نهادهای تحقیقاتی و دولت ها در به کار گیری از کلان داده ها برای ایجاد خط مشی گذاری می توان به موارد زیر اشاره نمود:

  • در شیکاگو و ایندیانا از ایالات متحده آمریکا برای ریشه کنی و مقابله با آفات گیاهی و همچنین مقابله با جوندگان.
  • تحقق یکی از شاخص های شهر پایدار با استفاده از کلان داده ها برای خط مشی گذاری عمومی در شهر روزآریو آرژانتین با مطالعه و بررسی اطلاعات حاصل از دوچرخه سواری از یک محله خاص این شهر با هدف شناسایی علل حوادث مرتبط به سوانح جرح و فوتی دوچرخه سواران در جهت نظارت بیشتر ، کنترل و کاهش میزان خسارات و تلفات احتمالی و آتی آنها در این شهر و توسعه همین مورد در قالب یک الگوی کاربردی برای سایر شهرها. 

کلان داده مسیری جدید برای تقویت حکمرانی : نمونه هایی از به کار گیری و  نوآوری های کلان داده در آمریکای لاتین و کارائیب

  • در شهر باهیا بلانکا از کشور آرژانتین و استفاده از کلان داده های بدست آماده از مجتمع های تولید محصولات پتروشیمی در جهت کاهش تنش های مابین دوست داران محیط زیست و واحدهای آلوده کننده محیط زیست.
  • کوردوبا از آرژانتین ، در مثالی از سیستم حمل نقل عمومی برای شناسایی صحت اطلاعات بدست آمده زمانی ، مکانی و طول سفر برای محاسبه نرخ کرایه دقیق و شناسایی الگوی دقیق محاسبه زمان و میزان هزینه سفر.
  • سائو برناردو از آرژانتین ، توسعه یک برنامه کاربردی شهروندی در جهت جمع آوری اطلاعات مربوط به آلودگی هوا ، زباله ها و سر و صداهای ناشی از ماشین های در حال تردد ، در جهت پیگیری و شناسایی نیازهای دقیق شهری برای برنامه ریزی آتی شهری – شهروندی در معاونت های مختلف شهرداری ها.
  • فورتالزا از آرژانتین ، استفاده از کلان داده ها در جهت توسعه برنامه کاربردی و هوشمند کنترل ترافیک شهری و ارائه انواع خدمات شهروندی و حاکمیتی به شهروندان.

موارد به شرح زیر، روش شناسی کلی و به کار گرفته شده در مثال های بالا از شهرهای مختلف کشور آرژانتین را نشان می دهد.

  • داده های باز: تهیه داده های مورد نیاز و ایجاد بسترها و زیرساخت های لازم و کافی برای تولید کلان داده ها با هدف تحقق حکمرانی مبتنی بر داده ها و در اختیار قرار دادن این داده ها و اطلاعات به شرکت ها و سازمان و مراکز تحقیق.
  • ساخت اکوسیستم های داده: ایجاد جوامع نمونه تولید کننده داده های شهری و کاربست به اشتراک گذاری آن ها و ایجاد فرهنگ استفاده از داده ها ، به ویژه در بین تصمیم گیرندگان و ذینفعان.
  • تجزیه و تحلیل کلان داده ها: استفاده از فنون مختلفی برای تجزیه و تحلیل ، جمع بندی و تجسم اطلاعات. 
  • تصمیم گیری مبتنی بر کلان داده: شامل به کارگیری مهارت های فردی و نهادی و همچنین اقدامات فرهنگی لازم برای استفاده از آن داده ها در جهت بهبود خط مشی های عمومی.
  • مشارکت شهروندان و انتشار داده ها و نتایج آن.

درس هایی برای خط مشی گذاری عمومی

براساس موارد ارزیابی شده و ابزارهای تحلیلی ارائه شده ، در هنگام استفاده از کلان داده ها برای پشتیبانی از خط مشی عمومی، نکات بسیاری وجود دارد که باید در نظر گرفته شوند. طیف متنوعی از اهداف و نیازها و سطح بلوغ های مختلف هر طرح ، چالش ها و تنش های مختلف و موارد بسیار نادیده و تجربه نشده دیگر ، همگی بیانگر وجود عوامل بسیار و پیچیده ای در مقوله خط مشی گذاری هستند که می توان از این نتایج ، برای خط مشی گذاری های آتی درس هایی را آموخت.

  1. ایجاد یک چارچوب نهادی که بایستی ایجاد و مدیریت شود و در عین حال هم پایدار باشد. این امر مستلزم بهره گیری از منابع مورد نیاز جدید ، زیرساخت های متفاوت و فناورانه و کارمندان متخصص است. به عنوان مثال در طرح فورتالزا. احتیاج به ایجاد چارچوب مدیریتی بود که در تعیین مالکیت داده و سطح دسترسی داده ها ، مسائل امنیتی پروژه را حل کند.
  2. دستیابی به ارتباطات شفاف و یکپارچه مابین تمامی نهادها ، سازمان های دولتی و شهروندان ، از نمونه های موفق این طرح ها، می توان به شهرهای باهیا و برناردو اشاره نمود، که میزان مشارکت عالی مردم و نهادهای حاکمیتی بهترین نتایج حاصله را رقم زد و در شهر کوردوبا از آرژانتین پیوند دهنده این اشتراک بازگیران آکادمیک و دانشگاهی بودند که ارتباط بین شهروندان و نهادها و سازمان های دولتی را بوجود آورند.
  3. در دسترس بودن سرمایه های انسانی لازم ( نسل جدیدی از کارمندان متخصص در سازمان ها و نهادهای عمومی و خصوصی ) متشکل از تحلیلگران داده های حرفه ای ، تصمیم گیرندگان و ذینفعان کلیدی که تواما توانایی ایجاد سوال ها و پاسخ به آنها را داشته باشند و بتوانند به درستی اهداف را تعیین کنند. همچنین در این میان ذینفعان اصلی باید ظرفیت هدایت کار دانشمندان و پژوهشگران داده را داشته باشند، تا اطمینان حاصل شود که تحقیقات و اقدامات با نیازهای واقعی شهروندان (مردم) مطابقت دارد. سرمایه انسانی مورد نیاز ممکن است در خارج از بخش عمومی یافت شوند به عنوان مثال ، در ابتکار عملی در شهر کوردوبا که مثال آن قبل تر گفته شد تمامی آن طرح به یک بخش خصوصی واگذار گردید آن شرکت وظیفه جمع آوری ، تمیز دادن  و تجزیه و تحلیل داده ها را به عهده داشت.

محدودیت های اجرایی پروژه های کلان داده در کشورهای آمریکای لاتین

  • عدم تطابق داده ها با نمایندگی های واقعی آنها ( قبل تر در مورد ویژگی نمایندگی کلان داده ها توضیح داده شده است)
  • کانال های دیجیتال اشتراک رسانی داده ها ،که فقط افراد خاصی به آن کانال ها دسترسی دارند.
  • تدوین استنتاج های عمومی سخت به خاطر نامشخص بودن سطح نمایندگی داده ها و طرح این سوال که آیا داده ها به اندازه کافی بزرگ هستند یا صرفا بزرگ خطاب می شوند.
  • عدم وجود تکنیک هایی جهت جلوگیری از سوگیری و ایجاد انحراف در نتایج و تصمیم گیری ها.
  • عدم وجود زیرساخت های دیجیتال و فناوری اطلاعات و ارتباطات کافی و لازم و برای تحقق حکمرانی داده.
  • موضوع مالکیت های داده های بزرگ ، حقوق  و مجوزهای لازم جهت بررسی و مدیریت داده های بزرگ ناشی از ورود به حریم شخصی افراد.
  • و در نهایت وجود ده مشکل ذاتی مرتبط به داده ها که فرآیند تصمیم گیری را سخت و پیچیده می کند که عبارتند از: 
  • مشکل در تحلیل داده ها و نبود روش و ابزار مناسب ، (2) عدم اطمینان به ابزار جامع در جمع آوری داده از جمعیت مناسب موضوع و مسئله مورد بررسی ، (3) عدم اطمینان به منابع داده ای مناسب از آن موضوع یا مسئله ، (4) عدم اطمینان به نمونه داده های صحیح ، (5) عدم اطمینان به مدل و نسخه های صحیح نتیجه گیری ، (6) عدم اطمینان به متغیرهای پیش بینی درست ، (7) عدم اطمینان به روش و الگوریتم های مدل سازی صحیح ، (8) عدم اطمینان به فراگرد و مدل ارزیابی صحیح ، (9) عدم اطمینان به شاخص یا روشی برای شناسایی میزان اهمیت هر جز از مسئله ، و (10) عدم اطمینان به انواع ابزار صحیحی برای تجسم داده ها.

توصیه ها

در انتهای این تحقیق ( مطالعه موردی ) ، نویسندگان ، سایر محققین و سازمان های دولتی را توصیه به تحقیق در سه حوزه از موضوع می شود که آنها عبارتند از:

  • سرمایه های انسانی :  از جهت شناسایی و تربیت نیروهای های متخصص برای تجزیه و تحلیل داده ها ، بطوری که فقط در آمریکا تخمین زده می شود کمبود استعداد و متخصص این حوزه عددی بین 140 هزار تا 190 هزار نفر باشد. 
  • فناوری : شناسایی و به کار گیری و توسعه فناوری های موجود در جهت رسیدن به اهداف تجزیه و تحلیل کلان داده ها.
  • تدوین برنامه های راهبردی : برای عملیاتی سازی و گسترش زیرساخت های لازم و کافی کلان داده ها و همچنین اتحادهای راهبردی سازمان ها مختلف در جهت توسعه و نگهداری کلان داده ها.

برگرفته از مقاله تحقیقاتی از : پاتریسیو رودریگرز و همکاران ، 2017