شرکت نتماین، در یک مسابقه با کمک ۳۶ گروه برنامهنویسی توانست نتایج انتخابات ریاستجمهوری را روز انتخابات و با کمتر از یک درصد اختلاف پیشبینی کند.
نوپانا: پیشبینی نتیجه انتخابات ریاست جمهوری کار سادهای نیست، اما همه سیاستمداران، فعالان عرصه تبلیغات، اصحاب رسانه و مهمتر از همه، نامزدهای انتخاباتی و طرفداران آنها، به دنبال ابزاری برای سنجش دیدگاههای مردم هستند که بتواند تشخیص دهد اکثریت رأی به کدام سمت تمایل بیشتری دارد. این کار به آنها کمک میکند با شرایط جامعه، وضعیت تبلیغات انتخاباتی را تغییر دهند و شانس برد را برای خود بیشتر کنند.
سیستمهای فعلی، هیچگاه دقت لازم را ندارند و سایتهای نظرسنجی هم نمیتوانند تصویر دقیقی از نظر واقعی جامعه ارائه کنند. با این حال، همزمان با انتخابات ریاست جمهوری دوازدهم، مسابقهای برگزار شد که توانست نتایج انتخابات را قبل از ظهر روز برگزاری، پیشبینی و منتشر کند. این برآورد با نتایج حقیقی تنها 0.7 اختلاف داشت، یعنی کمتر از یک درصد. اما ماجرای این مسابقه چه بود و چگونه برگزار شد؟
تلگرام، انبار ارزشمند اطلاعات
«نتماین»، یک شرکت ایرانی است که صاحبانش، آن را موتور تولید دانش از شبکههای اجتماعی نامیدهاند. این شبکه که اردیبهشت سال گذشته راهاندازی شد، با دسترسی به صدها هزار پیام در شبکههای اجتماعی به سوالاتی پاسخ میدهد که پاسخگویی به آن از راههای معمول، ممکن نیست. به عنوان مثال نگرش مردم به دولت چیست؟ مردم چه نظری درباره نامزدهای انتخاباتی دارند و سوالاتی از این دست از طریق این سامانه، قابل بررسی است. «نتماین» همچنین سرویسی به نام «تلماین» راهاندازی کرده است که به صورت انحصاری، پیامرسان تلگرام را بررسی میکند، این شرکت همچنین قصد دارد در آینده سراغ پیمایش سایر شبکههای اجتماعی نیز برود.
شش روز پیش از دوازدهمین دوره انتخابات ریاست جمهوری، نتماین فراخوان مسابقه هوش مصنوعی را در بین گروههای تلگرامی منتشر کرد. در این مسابقه، اطلاعات کلانی که از تلگرام دریافت شده بود، در اختیار شرکتکنندگان قرار میگرفت و آنها باید بر پایه الگوریتمهای هوش مصنوعی، برنامهای مینوشتند که بتواند نتیجه انتخابات را پیشبینی کند.
مجید زرین، بنیانگذار نتماین و برگزارکننده مسابقه در گفتوگو با خبرنگار نوپانا گفت: ایده را از پنج ماه پیش داشتیم و میخواستیم مسابقهای برگزار کنیم که بتواند پیشبینی کند برنده انتخابات چه کسی است. با یک شرکت دیگر هم هماهنگ کردیم و آنها موافقت کردند برگزاری مسابقه و مسائل اجرایی ان را به عهده بگیرند. اما متاسفانه یک هفته پیش از انتخابات منصرف شدند. در نتیجه خود گروه نتماین دست به کار شد و فراخوان را در گروههای مجازی تلگرام دست به دست نشر داد. تا اندازهای موفق بودیم و توانستیم در عرض یک روز توانستیم فراخوان را به نیم میلیون بازدید برسانیم. در نهایت تا سهشنبه 330 گروه ثبتنام کرده بودند که از بین آنها 36 گروه توانستند الگوریتمی طراحی کنند که بتواند 2 میلیون پیام مرتبط با انتخاباتی را که به آنها ارائه کرده بودیم مورد تجزیه تحلیل احساسی قرار دهند. ما روزانه اطلاعات روز قبل را در اختیار آنها قرار میدادیم. تا اینکه تا روز جمعه نتایج همه اطلاعات کدگذاری شده جمعآوری شد.
(همچنین بخوانید: استفاده از هوش مصنوعی در بحثهای انتخاباتی)
اما هرکدام از این قطعهکدهای برنامهنویسی برای تحلیل پیامها در تلگرام، درصدی خطا در خود داشت. راهکار برگزارکنندگان مسابقه برای به حداقل رساندن درصد خطا، جالب بود.
خردجمعی، ابزاری برای رسیدن به حقیقت
مهدی فریمانی، مشاور توسعه کسبوکار و یکی از برگزارکنندگان این مسابقه، در تعریف خردجمعی به نوپانا گفت: شاید نظرات مختلف و فرد به فرد انسانها با واقعیت متفاوت باشد، اما مجموع نظرات آنها بیش از هرچیز به حقیقت نزدیک است. در حقیقت، میانگین مجموع نظرات یک جامعه، بهتر از تکتک نظرات آنها است.
او درباره راهاندازی چنین روشی در نظرسنجی گفت: سال 1906 در یک روستای کوچک در هلند، گاوی جلوی اهالی روستا قرار دادند و از آنها خواسته شد در مورد وزن گاو حدس بزنند. تقریبا همه اشتباه حدس زدند. اما زمانی که رقمهایی پیشنهاد شده را جمع کردند و به تعداد افراد تقسیم شد، عدد به دست آمده با وزن حقیقی گاو، تفاوت ناچیزی داشت.
اما این ابزار سنجش برای تفکر انسانی استفاده میشد. بنابراین سوالی که برای برگزارکنندگان مسابقه پیش میآمد این بود که آیا میتوان آن را در هوش مصنوعی نیز استفاده کرد؟
برای رسیدن به پاسخ این پرسش، آنها تحلیلهای جمعآوری شده را از همه گروهها دریافت کردند و میانگینی از نتایج الگوریتمهای آنها به دست آوردند، نتیجه نهایی روز انتخابات روی سایت قرار گرفت و در نهایت با اعلام نتایج اصلی انتخابات امکان مقایسه با نتایج پیشبینی شده به وجود آمد. اختلاف، زیر یک درصد بود.
مقایسه نتیجه اصلی انتخابات با نتایج پیشبینی شده از طریق هوش مصنوعی
فریمانی درباره این نتایج به دست آمده میگوید: این نتایج نشان داد میتوان با بررسی پیامهای موجود در تلگرام به برآیندی دقیقی از کل جامعه دست پیدا کرد. پیامرسان تلگرام میتواند معرف خوبی برای بررسی اکثریت نظرها و نگرشهای جامعه باشد و در نتیجه بررسی پیامهای موجود در آن، غیر از مسئلهای مانند انتخابات هم میتواند مفید و جالب باشد.
او درباره چگونگی استفاده از این اطلاعات میافزاید: در بررسی پیامهای تلگرام از کلیدواژه استفاده شد. یک سری واژههای اصلی بود، مانند کلمه انتخابات، رای و اسامی خود نامزدها، بعد از آن هم واژههای مرتبط بهکار برده شد، مانند اسامی رئیسجمهورهای قبلی، کلمههای دولت و مردم و سیاست و چیزهایی شبیه به این. با محدود کردن این حجم از اطلاعات، نتیجه سریعتر مشخص میشد.
فریمانی که کارشناسی ارشد مدیریت خود را از دانشگاه شریف دریافت کرده است، درباره علل دقیق نبودن سیستمهای نظرسنجی تلگرام میگوید: من با استفاده از دو «بات» تلگرامی پی بردیم اشکال کار کجاست. مشکل این بود هر کدام از آنها به یک گروه و جناح سیاسی تمایل داشت. یکی از دلایل پایین بودن دقت نتیجه نیز همین است. فردی که به جناح سیاسی الف تمایل بیشتری دارد، نظرسنجی را برای دوستان خود که آنها نیز همان نگرشها را دارند به اشتراک میگذارد. اگر فردی از جناح سیاسی ب، به این نظرسنجی دست پیدا کند، یا آن را انجام نمیدهد و یا برای کسی ارسال نمیکند. در نتیجه دقت این دادهها به شدت پایین میآید. نکته بعدی تفاوت بین نظرسنجی و نظرکاوی است. گاهی ما از کسی درباره نگرش او به چیزی میپرسیم و به صورت خودآگاه، پاسخ آن را میدهد. اما زمانی که از مجموعه رفتارهای او، برآیند مشخصی داشته باشیم، آنگاه نظرکاوی کردهایم که دقت بسیار بالایی دارد و به همان اندازه مشکلتر است. همچنین در نظر بگیریم نظرکاوی که از طریق هوش مصنوعی به دست میآید دقیقتر است. چرا که ذهن انسان قضاوت میکند و با احساسات درگیر است، به همین علت میزان خطای بالایی دارد. اما زمانی که اطلاعات به دست آمده را به ماشین بدهیم و طی الگوریتم مشخصی از آن بخواهیم، این اطلاعات را برای ما تفسیر کند، به نتیجه دقیقتری خواهیم رسید.
آینده روشن کلاندادهها در ایران
به گفته زرین، پیش از مشخص شدن نزدیک بودن نتایج اصلی با نتایج بسیاری از شرکتها دقیق بودن چنین خدماتی را باور نمیکردند و اکنون خواهان همکاری با نتماین هستند. این مسئله نشاندهنده آینده روشن استفاده از کلاندادههایی است که از شبکههای اجتماعی به دست میآید. اگر تا پیش از این، استفاده و استخراج آماری از شبکههای اجتماعی غیرممکن بود و دقت کافی نداشت، اکنون میتوان با کمک هوش مصنوعی و راهکار خردجمعی، به نتایج دقیقی رسید که به تولیدکنندگان، صاحبان صنایع و حتی مسئولین اجرایی و سیاستگذاران کمک میکند بتوانند نگرش مردم را نسبت به موضوعات مورد نظر آنها به دست بیاورند.
او درباره نتیجه این مسابقه گفت: داوری هنوز به پایان نرسیده است، اما ما تلاش داریم میزان اعمال سلیقه داور را تا اندازه ممکن کاهش دهیم. برای رتبهبندی نتایج اصلی با نتیجه به دست آمده آنها 50 امتیاز در نظر گرفته شده، برای کدهایی که انتخاب و از آن استفاده کردهاند، 40 امتیاز و برای داوری هم 10 امتیاز گذاشته شده است. بر همین اساس، سه گروه برتر از بین 36 گروهی که الگوریتم طراحی کردهاند، انتخاب و معرفی میشوند.
(همچنین بخوانید: تاثیرات فناوری بر انتخابات در جهان)
چراغ قوهای کوچک در غاری بزرگ
موسس سایت نتماین، درباره دادهکاوی در نرمافزارها و شبکههای اجتماعی میگوید: دادهگیری از سایتهای خبری ساده است، اما این مسئله در مورد شبکههای اجتماعی صدق نمیکند و شبیه این است که با چراغ قوه بخواهید درون غار بزرگ و تاریکی را ببینید و بیشترین دقت را داشته باشید. این کار به کمی زرنگی و هوشمندی نیز احتیاج دارد. بازار کار این تحلیل داده، گسترده است و بسیاری از شرکتهای فعال در زمینه بورس میتوانند از نتایج تحلیل این دادهها استفاده کنند. با این حال ما در تلاش هستیم داده بیشتری از تلگرام استخراج کنیم و با موسسان این پیامرسان نیز در ارتباط باشیم. در آینده نیز سراغ سایر پیامرسانها یا شبکههای اجتماعی خواهیم رفت و این بازار را گسترش میدهیم.
او هدف دیگر این دادهگیری را اینگونه بیان میکند: بخش دیگر ماجرا، وجود یک موتور تولید دانش است. این مسئله که بتوان نگرش و احساس مردم را نسبت به شخص، گروه، محصول یا هر چیزی بسنجیم، میتواند برای سیاستگذاری بسیار کارساز باشد.
(همچنین بخوانید: وضعیت استارتآپها در دولت جدید)