پایان نامه ارشد رایگان درباره دانشجویان، شبکه عصبی، درخت تصمیم، یادگیری ماشین

و ورودیهای دوتایی شده (نمره تمرین ضعیف/خوب) بوده است؛ لذا متغیرهای پیشبین را به حالت دوتایی نیز تبدیل کرده‌اند.
الگوریتمهای بکار رفته برای پیشبینی با داده‌های عددی، رگرسیون خطی و SVM بوده و برای داده‌های اسمی (دوتایی) از سه نوع شبک? بیزی ۱) Bayes Naive،۲) شبکه بیزی۲۶۷TAN و ۳) بیزی چند شبکهای۲۶۸ استفاده شده است.
نتایج مقایسه الگوریتمها نشان داد که SVM با داده‌های اندک و ورودیهای واقعی (عددی) بهترین عملکرد پیشبینی را دارد (صحت طبقهبندی ۸۸%). با داده‌های اسمی نیز Bayes Naive از قدرت پیشبینی بیشتری برخوردار بوده است (صحت طبقهبندی ۸۶%). پژوهشگران بر آنند که Bayes Naive با داده‌های اندک، بر الگوریتمهای متداول چون درخت تصمیمگیری و شبکههای بیزی معمولی برتری دارد. مضاف اینکه، این نوع شبکه در برابر مسئله بیشبرازش۲۶۹ نیز مقاوم است. SVM نیز برای داده‌های اندک مناسب است اما بزرگ‌ترین مشکل آن عدم ارائه اطلاعاتی قابل فهم به کاربر (عدم شفافیت) است.
– رومرو و همکاران۲۷۰(۲۰۰۸) در یکی از دانشگاههای اسپانیا، داده‌های ۴۳۸ دانشجو را در هفت درس الکترونیکی ارائه شده در بستر مودل دادهکاوی کردند. درونداد یا متغیرهای پیشبین در این پژوهش ۱۰ متغیر بوده که بدین قرار است: کد درس، تعداد تکالیفی که انجام داده، تعداد کویزی که دانشجو شرکت کرده، تعداد کویز پاس کرده، تعداد کویز افتاده، تعداد پیامهایی که در فروم ارسال کرده، تعداد پیامهایی که در فروم خوانده، میزان وقتی که برای تکالیف صرف کرده، میزان زمانی که برای کویزها صرف کرده و میزان وقتی که در فرومها صرف کرده است. این متغیرها علاوه بر اینکه به صورت عددی مورد استفاده قرار گرفتهاند، تبدیل به متغیرهای طبقهای نیز شدهاند. به این صورت که همه به قوی/متوسط و/ ضعیف تبدیل شدهاند تا عملکرد الگوریتمها در داده‌های عددی و طبقهای با هم مقایسه شود. متغیر ملاک یا برونداد، نمره پایانی دانشجو بوده که به مقیاس چهار درجهای افتاده/ گذرنده/ خوب و/ عالی تبدیل شده است.
این پژوهش از ۲۴ الگوریتم طبقهبندی استفاده کرده است. این پژوهشگران روش‌هایی پیشبینی را در پنج دسته کلی طبقهبندی کردند:۱) روش‌هایی آماری مانند رگرسیون؛ ۲) درخت تصمیمگیری مانند الگوریتم c4.5 و CART؛ ۳) استنتاج قانون مانند الگوریتم AprioriC؛ ۴) استنتاج قانون فازی مانند LogitBoost؛ ۵) شبکههای عصبی چون پرسپترون چند لایه. در این پژوهش هیچ کدام از الگوریتمها به صحت طبقهبندی بیشتر از ۷۰% نرسیدهاند. الگوریتم CART از خانواده درخت تصمیمگیری با ۶۷.۰۲% صحت طبقهبندی با داده‌های واقعی (عددی) و ۶۶.۸۶% با داده‌های طبقهبندی شده، بهترین الگوریتم بوده است. پس از بالانس کردن داده‌ها، سه الگوریتم Corcoran, XCS ,AprioriC از خانواده استنتاج قانون و الگوریتم MaxLogicBoost از خانواده استنتاج قانون فازی با صحت طبقهبندی بالای ۶۰% بیشترین دقت پیشبینی را داشتهاند. این پژوهش نشان میدهد، بالانس کردن داده‌ها بر عملکرد برخی از الگوریتمها تأثیری ندارد و بر روی برخی الگوریتمها چون دو الگوریتم درخت تصمیمگیری اثر منفی دارد و بر روی ۱۷ الگوریتم دیگر اثر مثبت داشته است. در این تحقیق برای انتخاب بهترین الگوریتم، دو شاخص معرفی شده است. یکی صحت پیشبینی و دیگری قابل فهم بودن برای کاربر (استاد، دانشجو). از آنجا که درخت تصمیمگیری و الگوریتمهای استنتاج قانون از داده‌ها قاعده “اگر-پس” استخراج میکنند. بهترین گزینه برای این منظور محسوب میشوند. از طرفی کار و فهم با متغیرهای پیشبین طبقهبندی شده بسیار قابل فهمتر است. بنابراین الگوریتمهای درخت تصمیمگیری پیشنهاد نهایی این پژوهش است.
– کاراموزیز و ورتوز۲۷۱(۲۰۰۸) داده‌های یک هزار و ۴۰۷ دانشجوی آمریکایی را به دو دسته تقسیم کرده و یک هزار و صد داده را برای آموزش و ۳۰۷ داده را برای تست شبکه عصبی مصنوعی استفاده کردند؛ شبکه از نوع پرسپترون سه لایه بوده و از الگوریتمهای “آموزش پس انتشار” برای آموزش شبکه استفاده شده است. متغیرهای پیشبین یا درونداد در این پژوهش ۱۱ عامل بوده که در بدو ورود به دانشگاه جمعآوری شده است. دروندادها شامل متغیرهایی چون جنسیت، قومیت، سن، کد پستی دانشجو و … بوده است. در لایه خروجی نیز موفقیت و عدم موفقیت دانشجو کد شده و در لایه پنهان نیز از چهار نورون استفاده شده است.
در این پژوهش، صحت طبقهبندی کل برای شبکه پرسپترون بر روی داده‌های آموزش ۷۷% و بر روی داده‌های تست ۶۸% گزارش شده است. صحت طبقهبندی مدل برای دانشجویان موفق ۷۰.۲۷% و برای دانشجویانی که موفق به دانشآموختگی نشدهاند، ۶۶.۲۹% گزارش شده است.
-ایمبری، لین و مالیسچف۲۷۲(۲۰۰۸) در یکی از دانشگاههای آمریکا برای پیشبینی ماندگاری دانشجویان مهندسی از شبکه عصبی مصنوعی پیشخور با الگوریتم آموزش پس انتشار Levenberg-Marquardt استفاده کردهاند. داده‌های چهار هزار و ۹۰۰ دانشجوی جدیدالورود در سالهای تحصیلی ۲۰۰۴، ۲۰۰۵ و ۲۰۰۶ مورد بررسی قرار گرفت. متغیرهای پیشبین یا دروندادهای شبکه عصبی در دو دسته کلی متغیرهای شناختی و متغیرهای غیر شناختی تقسیم شده و در قالب چهار مدل متفاوت به شبکه وارد شدند.
در مدل اول متوسط نمرات دانشجویان در ۹ متغیر غیر شناختی به مدل وارد شدند. این متغیرها عبارتند از: رهبری، یادگیری عمیق در برابر یادگیری سطحی، کار تیمی، خودکارآمدی، انگیزش، فراشناخت، ارزش انتظار و تصمیم اصلی۲۷۳ . این متغیرها روان‌شناختی بوده که به وسیله پرسشنامه برخط بدست آمدهاند. مدل شبکه عصبی (۱،۹،۹) بوده است؛ به عبارتی این شبکه نه نورون ورودی، ۹ نورن در لایه پنهان و ۱ نورون خروجی داشته است. بر روی داده‌های دانشجویان ورودی سال ۲۰۰۴، درصد صحت طبقه بندی کلی ۶۷.۳% برای این مدل گزارش شده است.
در مدل دوم نیز متغیرهای غیر شناختی (روان‌شناختی) وارد شدهاند با این تفاوت که در این مدل ۶۰ آیتم از سؤالات پرسشنامه وارد مدل شده و شبکهای با ۶۰ نورون در لایه ورودی، ۳۰ لایه پنهان و یک لایه خروجی (۱، ۳۰، ۶۰) آموزش داده شده است. بر روی داده‌های دانشجویان ورودی سال ۲۰۰۴، درصد صحت طبقه بندی کلی ۷۰.۵% برای این مدل گزارش شده است.
مدل سوم در برگیرنده یازده متغیرهای شناختی به عنوان پیشبین بوده است. متغیرهای شناختی در این پژوهش به متغیرهای تحصیلی اشاره دارد که معدل دیپلم، نمرات استاندارد دانش آموز در ریاضی، علوم و زبان نمونههایی از این ۱۱ متغیر است. مدل سوم معماری (۱۱،۱۱،۱) بوده است. بر روی داده‌های دانشجویان ورودی سال ۲۰۰۴، درصد صحت طبقه بندی کلی ۶۹.۷% برای این مدل گزارش شده است.
مدل چهارم ترکیبی از متغیرهای غیر شناختی و شناختی یعنی مدل دوم و سوم بوده است. بنابراین مدل چهارم معماری (۷۱،۳۶،۱) را دارد. بر روی داده‌های دانشجویان ورودی سال ۲۰۰۴، درصد صحت طبقه بندی کلی ۷۱.۳% برای این مدل گزارش شده است.
آزمون مدل شبکه عصبی بر روی داده‌های سه سال متوالی نشان داد که پیشبینی شبکه از پایایی قابل قبولی برخوردار است. به عنوان مثال درصد صحت طبقهبندی مدل دوم (۱، ۳۰، ۶۰) در سال ۲۰۰۴؛ ۷۰.۵% در سال ۲۰۰۵ معادل ۷۰.۳% و در سال ۲۰۰۶ معادل ۷۱.۸% بوده است. نزدیکی این پیشبینیها به هم نشانی از پایایی یافتههای شبکه عصبی در پیشبینی موفقیت دانشجویان است.
– لیکارنتزو و همکارانش۲۷۴(۲۰۰۹) در یونان، برای پیشبینی تکمیل یا عدم تکمیل دو دوره آنلاین تحت عناوین شبکه و طراحی وب از سه روش یادگیری ماشین استفاده کردند. تعداد ۱۹۳ دانشجوی الکترونیکی در این دو دوره شرکت کرده بودند که ۴۴% (۸۴ نفر) آن‌ها دوره را کامل نکردند. روش‌هایی یادگیری ماشینی به کار رفته در این پژوهش عبارتند از: شبکه عصبی پیشخور، SVM و Fuzzy ARTMAP.
این پژوهش تعداد ۹ متغیر پیشبین داشته که عبارتند از: جنسیت، محل اقامت (مرکز، استان)، تجربه کاری با رایانه (?۰ به سال)، سطح تحصیلات (پایه، متوسطه، عالی، کارشناسی، دکتری)، سطح زبان (مقدماتی، پایه، بالا، مسلط)، نمره کویز (۰-۲۰)، نمره پروژه (۰ تا ۱۰۰)، تأخیر در ارسال پروژه (?۰ به روز) و فعالیت در سامانه مدیریت یادگیری (?۰ تعداد لاگ فعالیت دانشجو).
با مجموع ۹ متغیر پیشبین، ۹۶% صحت طبقهبندی برای شبکه عصبی؛ ۹۷% برای SVM و ۹۴% برای Fuzzy ARTMAP گزارش شده است. محققین پژوهش بر این عقیدهاند، یک روش یادگیری ماشینی به تنهایی نمیتواند مفید باشد؛ لذا سه طرح تصمیمگیری برای گزارش نتایج پیشبینی طرحریزی کردهاند. طرح تصمیمگیری ۱: اگر از مجموع سه روش یک روش دانشجو را مشمول افت پیشبینی کند، دانشجو مشمول افت گزارش خواهد شد. در طرح تصمیم گیری ۲، دو روش و در طرح تصمیمگیری ۳، هر سه روش دانشجو را مشمول افت پیشبینی میکنند. بر این اساس دانشجویی که مطابق طرح تصمیمگیری ۳ در معرض خطر شناخته شود احتمال افت بیشتری دارد.
– راماس وامی و باسکاران۲۷۵(۲۰۰۹) پژوهش خود را بر مقوله انتخاب ویژگی۲۷۶ متمرکز کردهاند. انتخاب ویژگی مقوله مهمی در تشخیص الگو، یادگیری ماشینی، آمار و دادهکاوی است. هدف انتخاب ویژگی عبارت است از حذف متغیرهایی که کمترین ارتباط یا قدرت پیشبین را دارند و شناسایی متغیرهایی که بیشترین قدرت طبقهبندی یا پیشبینی را دارند. انتخاب ویژگی کارایی یادگیری را ارتقاء میدهد، صحت پیشبینی را بالا برده و پیچیدگی نتایج یادگیری را کم میکند. با توجه به اهمیت کاهش متغیرها در کارآیی الگوریتمهای پیشبینی؛ پژوهشگران شش روش انتخاب ویژگی را بر روی ۳۲ مشخصه از داده‌های یک هزار و ۹۶۹ دانش آموز متوسطه در هندوستان آزمون کردهاند. این روشها عبارت بودند از CB277، CH278، ۲۷۹GR،۲۸۰ IG،۲۸۱ RF،۲۸۲ SU. پس از اعمال روش‌هایی مختلف و انتخاب ویژگی IG تعداد ویژگی را از ۳۲ به ۷ مورد کاهش داد. در نهایت بر اساس مهم‌ترین متغیرهای انتخاب شده، الگوریتمهای پیشبینی VotedPerceptron، NaiveBayes، OneR و PART مقایسه شدند. نتایج نشان داد: VotedPerceptron و OneR با صحت پیشبینی ۸۹ % بیشترین دقت پیشبینی را دارند. به عبارتی این پژوهش ثابت میکند با کاهش متغیرها و انتخاب مهم‌ترین متغیرها میتوان قدرت پیشبینی را افزایش داد.
– کوپر۲۸۳(۲۰۰۹) برای پیشبینی ادامه تحصیل یا عدم ادامه تحصیل دانشجو در کالج حضوری فورت لویز۲۸۴ آمریکا از شبکه عصبی مصنوعی استفاده کرد. این پژوهش برای بررسی قابلیت تعمیم نتایج شبکه، آن را روی داده‌های دانشجویان طی چند سال متوالی آزموده است. ابتدا شبکه بر روی داده‌های دانشجویان در سال ۲۰۰۷ تست شده که صحت طبقهبندی این شبکه ۷۶.۷% بوده است. درصد صحت طبقهبندی برای ادامه تحصیل ۷۶.۹ و برای دانشجویانی که ادامه تحصیل ندادهاند ۷۶.۵ بوده است. در ادامه این پژوهش طولی شبک? ایجاد شده بر روی داده‌های دانشجویان جدیدالورود سال ۲۰۰۸ تست شد که ۷۰%

این مطلب مشابه را هم بخوانید :   پایان نامه ارشد رایگان دربارهدانشجویان، روش تحقیق، یادگیری الکترونیک، تحقیق کیفی

دیدگاهتان را بنویسید