پیشبینی آینده در زمینههای مختلف همواره برای انسان جالب و جذاب بوده است. با اطمینان میتوان گفت که پیشبینی آینده و روند تغییرات در همهی حوزهها از دغدغههای اصلی و همیشگی مدیران سطح بالا و میانی میباشد. اما همواره مشکلات فراوانی در برابر آن وجود داشته است که انجام پیشبینیهای دقیق و قابل اعتماد را تقریباً غیرممکن نموده است (توحیدی- مقدم و فرهادی، 1391). در سالهای اخیر با توجه به جذابیتهایی که در زمینه دادهکاوی و همچنین پیشبینی که یکی از اهداف دادهکاوی میباشد وجود دارد،تحقیقات زیادی در این حوزه انجام شده است.
در حال حاضر در اکثر دانشگاهها بانکهای اطلاعاتی وسیعی از ویژگیهای دانشجویان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی و تحصیلی را شامل میشود و از آنجایی که امروزه فضای رقابتی شدیدی در دانشگاههای مختلف حاکم شده است. مدیران باید سریعتر و درستتر از قبل تصمیم بگیرند. لازمه چنین امری، دستیابی سریع و دقیق به دانش است و برای دستیابی به دانش، وجود ابزارهای کارا و موثری نظیر داشبوردهای مدیریتی ضرورت دارد. ارزش داشبورد در اتصال ویژگیها و کاربرد مناسب آن در سازمان است. گرچه تا به امروز توافق خاصی در اینکه داشبورد باید دقیقا چگونه باشد و چه کارهایی را انجام دهد، وجود ندارد اما به طور کلی انتظار میرود داشبورد، امکان جمع آوری، خلاصهسازی و ارائه اطلاعات مناسب از منابع مختلفی را داشته باشد تا بدین وسیله کاربر بتواند وضعیت شاخصها را به طور یکجا ملاحظه نماید.
هدف از انجام این تحقیق، دادهکاویآموزشی جهت مقاصد پیشبینی پیشرفت تحصیلی دانشجویان به همراه داشبورد آن میباشد، دادهکاویآموزشی یک حوزه علمی نوظهور است که به توسعه روش هایی برای کاوش و اکتشاف دانش در محیطهای آموزشی میپردازد. پیشرفت تحصیلی دانشجویان یکی از اموری است که در امر آموزش مطرح است و از مسائل مورد توجه مدیران آموزشی دانشگاههاست. در این تحقیق سعی شده از دادهکاوی و فنون آن استفاده شود و با بهره گرفتن از دادههایی که در دانشگاهها موجود است پیشرفت تحصیلی را پیشبینی نمود. پس از آشنایی با ادبیات مسئله و مرورکلی بر ویژگیهای اصلی یک داشبورد مدیریتی کارا، روش های دادهکاوی و پیشبینی به عنوان مطالعه موردی کار پیشبینی در امور آموزش را انجام دادهایم. معدل دانشجویان بهصورت تصادفی تغییر نمیکند، بلکه تغییرات بر اساس یک روند تکرار پذیر و قابل تشخیص صورت میگیرد، پس قابل پیشبینی است. برای این منظور پس از گردآوری دادهها جهت دادهکاوی، با بهره گرفتن از روش های شبکهعصبی و درختتصمیم C5، کار پیشبینی را انجام داده ایم و بعد از پیشبینی، طراحی و پیادهسازی داشبورد آن صورت گرفت.
2-1- تعریف مسأله و بیان سوال های اصلی تحقیق
از هنگامی که رایانه در تحلیل و ذخیرهسازی دادهها بهکار رفت (1950) پس از حدود 20 سال، حجم دادهها در پایگاهدادهها دو برابر شد ولی پس از گذشت دو دهه و همزمان با پیشرفت فنآوری اطلاعات(IT) هر دو سال یکبار حجم دادهها، دو برابر شد. همچنین تعداد پایگاهدادهها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل دادهها و آمارشناسان با این سرعت رشد نكرد. حتی اگر چنین امری اتفاق میافتاد، بسیاری از پایگاهدادهها چنان گسترش یافتهاند که شامل چندصدمیلیون یا چندصدمیلیارد رکورد ثبت شده هستند و امکان تحلیل و استخراج اطلاعات با روشهای معمول آماری از دل انبوه دادهها مستلزم چند روز کار با رایانههای موجود است. حال با وجود سیستمهای یکپارچه اطلاعاتی، سیستمهای یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم دادهها در پایگاهدادههای مربوط اضافه شده و باعث بهوجود آمدن انبارهای ( تودههای ) عظیمی از دادهها شده است بهطوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاهدادهها بیش از پیش نمایان شده است. دادهکاوی یا استخراج و کشف سریع و دقیق اطلاعات باارزش و پنهان از این پایگاهدادهها از جمله اموری است که هر کشور، سازمان و شرکتی به منظور توسعه علمی، فنی و اقتصادی خود به آن نیاز دارد. با توجه به فصول دهم و یازدهم قانون برنامه سوم توسعه در خصوص داد و ستدهای الکترونیکی و همچنین تأکید بر برخورداری کشور از فنآوریهای جدید اطلاعات برای دستیابی آسان به اطلاعات داخلی و خارجی، دولت مکلف شده است امکانات لازم برای دستیابی آسان به اطلاعات، زمینهسازی برای اتصال کشور به شبکههای جهانی و ایجاد زیرساختهای ارتباطی و شاهراههای اطلاعاتی فراهم کند. واضح است این امر باعث ایجاد پایگاههای عظیم دادهها شده و ضرورت استفاده از دادهکاوی را بیش از پیش نمایان می سازد.
دادهکاوی فرایندی تحلیلی است که برای کاوش دادهها(معمولا حجم عظیمی از دادهها) صورت میگیرد و یافتهها با بهکارگیری الگوهایی، احراز اعتبار میشوند. این تکنولوژی امروزه دارای کاربرد بسیاروسیعی در حوزههای مختلف است بهگونهای که حدومرزی برای کاربرد این دانش درنظر نگرفته و زمینههای کاری این دانش را از ذرات کف اقیانوسها تا اعماق فضا میدانند. امروزه، بیشترین کاربرد دادهکاوی در بانکها، مراکز درمانی، بیمارستآن ها، بازاریابی هوشمند، مراکز تحقیقاتی و زمینههایی که در آن مقدار زیادی از دادهها در حال جمع آوری و ذخیره میباشد. هدف اصلی دادهکاوی پیشبینی است. یکی از عناصر کلیدی در مدیریت و تصمیمگیری، پیشبینی پارامترها و متغیرهای لازم در یک محدوده سیستمی میباشد.
پیشبینی به عنوان یکی از مهمترین شاخههای علمی مطرح شده است و روز به روز توسعه و پیشرفت می نماید و در بخش های مختلف به کار گرفته میشود. پیشرفتهای اخیر در تکنولوژیهای جمع آوری و ذخیرهسازی داده، موجب شده که سازمانها، حجم زیادی از دادههای مربوط به فعالیتهای روزانهی خود را انباشته کنند. دادههایی که توسط سازمانها جمع آوری شده است بسیار ارزشمند است و برای اهداف مختلف میتواند مورد استفاده قرار گیرد. یکی از این اهداف پیشبینیهایی میباشد که جهت بهبود عملکرد و برنامهریزیهایشان از آن ها استفاده مینمایند.
مدیران سازمانهای مختلف به دلیل عدم قطعیت و پیچیدگی محیط سعی بر آن دارند تا مکانیزمی را در اختیار داشته باشند که بتوانند آن ها را در امر تصمیمگیریشان یاری و مشاوره دهد و به همین دلیل سعی در استفاده از روشهای پیشبینی دارند که به واسطهی آن ها تخمینهایشان به واقعیت نزدیک و خطاهایشان بسیارکم باشد. این امر باعث توجه بسیاری به روشهای نوین پیشبینی شده است.
دادهکاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوشمصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده میباشد. دادهکاوی فرایندی پیچیده جهت شناسایی الگوها، مدلهای صحیح و بالقوه مفید در حجم وسیعی از داده است، به طوریکه این الگوها ومدلها برای انسآن ها قابل درک باشند(Han et al,2006). دادهکاوی بهصورت یک محصول قابل خریداری نیست، بلکه یک رشته علمی و فرایندی است که باید بهصورت یک پروژه پیادهسازی شود. در گذشته موسسات آموزشی از مزیت دادهکاوی به خوبی بعضی حوزههای دیگر توجه نداشتهاند اما در سالهای اخیر تحقیقات زیادی در زمینه بكارگیری فرایند دادهكاوی در امر آموزش صورت میگیرد. این زمینه تحقیقاتی جدید، دادهكاویآموزشی نامیده میشود كه به امر توسعه روشهای كشف دانش از دادههای محیطهای آموزشی خصوصاً دانشجویان میپردازد(Romero et al,2007). دادههای جمع آوری شده در مورد دانشجویان میتواند شخصی یا آموزشی باشد كه از طریق دفاتر و پایگاه دادههای موجود در مدارس یا دانشكدهها جمعآوری میشوند. این نوع دادهها همچنین از طریق سیستمهای آموزش الكترونیكی قابل دستیابی هستند. با بهكارگیری تكنیکهای شبکهعصبی و درختتصمیم روی دادههای آموزشی می توان اطلاعات و دانش مفیدی را از آن ها استخراج كرد كه این دانش نیز به نوبه خود میتواند برای درك و فهم رفتار دانشجویان، كمك در امر آموزش و تدریس، ارزیابی و بهبود برنامهآموزشی، افزایش بازدهی و كارایی دانشجویان و اهداف دیگری بكار گرفته شود.
امروزه فضای رقابتی شدیدی در دانشگاههای مختلف حاکم شده است. دانشگاهها برای رسیدن به اهداف خود و سبقت گرفتن از یکدیگر در تلاشند. دانشگاهها نیاز به داشبورد دارند تا اطلاعات جزیی را در یک لحظه داشته باشند و این چیزی فراتر از یک نگاه کلی است. داشبوردها جهت نمایش حجم بزرگی از دادهها در یک نمایش گرافیکی قابل فهم هستند که کاربران با بهره گرفتن از آن ها قادر به تحلیل اطلاعات از طریق دادهها باشند (LogiXML,2011).
داشبوردهای مدیریتی سیستمهای نرمافزاری نوینی هستند که به سازمانها در جهت غنیسازی اهداف با بهره گرفتن از اطلاعات و تجزیه و تحلیل آن ها کمک میکند. داشبورد به مدیران این امکان را میدهد تا با تعریف، نظارت و تحلیل شاخصها در ایجاد تراز بین اهداف و فعالیتها و ایجاد یک محیط نمایش مشترک بین اهداف و فعالیتها برای تصمیمگیری درست و کارامد اقدام نمایند. یک نکته که معمولا به اشتباه گرفته میشود این است که داشبورد تنها برای مدیران ارشد به منظور ارائه اطلاعات جامع از عملکرد سازمان به آن ها مورد استفاده قرار می گیرد. امروزه تکنولوژی داشبورد سازمانی بهگونهای است که میتواند در سطوح مختلف سازمان استقرار یابد(زرین،1388).
در این تحقیق سعی شده است تا با بهره گرفتن از اطلاعات مربوط به دانشجویان از جمله سال و ترم ورود به دانشگاه، نوع تاهل، معدلهای دریافتی در هر ترم، نوع تحصیل، نوع شغل و دیگر اطلاعات دانشجویان دانشگاههای سراسری و آزاد اسلامی استان قم و امکانات موجود در محیط نرمافزارهای Sql server، Matlab ، Qlick view ، Clementine ، Excelو همچنین با خوشهبندی دادهها و بکار بردن تکنیکهای دادهکاوی به پیشبینی پیشرفت تحصیلی دانشجویان بپردازیم و با بهره گرفتن از نتایج پیشبینی و نظر خبرگان، شاخصها را تعیین کرده و طراحی و پیادهسازی داشبورد مربوطه را انجام دهیم.
در راستای موضوع ارائه شده ما به دنبال آن هستیم تا به سوالات زیر پاسخ دهیم:
1- چه تکنیک دادهکاوی برای دادههایمان پیشبینی بهتری دارد؟
2- متغیرهای تاثیرگذار در تعیین شاخصها کداماند؟
مشخص کردن اینکه کدام روش نتایج بهینه و دقیقتری ارائه میکند و پاسخ به این پرسشها، پیشبینیها به طور مناسب انجام شده و این کار فواید زیادی را برای دانشگاه به همراه خواهد داشت.
3-1- ضرورت انجام تحقیق
یکی از چالشهای جدی در مدیریت امور آموزشی دانشگاهها، پیشبینی وضعیت تحصیلی دانشجویان در نیمسالهای آینده به منظور شناسایی دانشجویانی است كه دچار پیشرفت یا افت تحصیلی شده و ادامه تحصیل آن ها با مشكل روبرو خواهد شد. در این تحقیق با بهره گرفتن از تكنیكهای داده كاوی وضعیت تحصیلی آتی دانشجویان پیشبینی شده است. با بكارگیری این تکنیکها و تجزیه و تحلیل و تفسیر دادهها مدیران آموزشی میتوانند مشاورههای لازم را برای پیشگیری از رسیدن دانشجویان به وضعیت بحرانی بكار گیرند و همچنین مدیران به استفاده از ابزارهای کارا و موثر مصورسازی داشبورد مدیریتی نیاز دارند تا با نمودارها و اشکال مختلف تفسیر دادهها را بهتر درک کنند و بتوانند تصمیمگیری صحیحتری داشته باشند بنابراین میتوان این ابزارهای پشتیبان تصمیمگیری در سیستمهای آموزشی را مورد بهرهبرداری قرار داد و نقش مهمی را در ارتقاء سطح علمی دانشگاهها داشت.