پایان نامه ارشد رایگان درباره دانشجویان، شبکه عصبی، درخت تصمیم، پژوهشگران

صحت طبقهبندی در این دوره بدست آمد. در مرحله سوم شبکه ایجاد شده برای داده‌های سال ۲۰۰۸ بر روی داده های سال ۲۰۰۹ به کار رفت که میزان صحت طبقهبندی کلی شبکه ۷۳.۳% بوده است. محقق قابلیت تکرار نتایج شبکه بر روی داده‌های دانشجویان طی سالهای مختلف را نشان قابل تعمیم بودن مدل شبکه عصبی برای پیشبینی وضعیت دانشجو میداند. یازده متغیر در این پژوهش به عنوان درونداد شبکه یا متغیر پیشبین به کار رفته که از معماری و نوع شبکه در گزارش پژوهش جزئیاتی ارائه نشده است.
– کواکیک۲۸۵(۲۰۱۰) داده‌های ۴۵۳ دانشجو را در یکی از دانشگاههای الکترونیکی نیوزلند با استفاده از مدل درخت طبقه بندی (CHAID) و مدل درخت تصمیمگیری ((CART بررسی کرد. ۹ متغیر پیشبین این پژوهش عبارت بودند از: جنسیت (باینری)، سن (رتبهای)، نژاد (اسمی)، ناتوانی دانشجو (باینری)، مقطع متوسطه (اسمی: سطح پیشرفت دانشآموز بر اساس گزارش‌های نیوزلند)، وضعیت اشتغال (باینری)، ثبتنام به موقع (باینری: ثبتنام به موقع / ثبت نام با تأخیر)، رشته (اسمی: کارشناسی تجارت یا کارشناسی علوم کاربردی)، ترم ارائه (اسمی: ترم ۱، ترم ۲ و ترم ۳) . متغیر ملاک نیز باینری بود و گذراندن یا عدم گذراندن درس را شامل میشد. این پژوهش در گام اول با استفاده از روش مجذور کای، مهم‌ترین ویژگیها را شناسایی کرده که نژاد، رشته و ترم ارائه مهم‌ترین متغیرهای مرتبط با افت دانشجو شناسایی شدند.
نتایج مقایسهای این پژوهش نشان داد: مدل درخت طبقهبندی CHAID، ۵۹.۴% صحت طبقه بندی کلی را داشته است (۴۹% برای دانشجویان ناموفق و ۷۱% برای دانشجویان موفق)؛ مدل درخت تصمیمگیری CART، ۶۰.۵% صحت طبقهبندی کلی را داشته است (۶۲.۳% برای دانشجویان ناموفق و ۵۸.۴% برای دانشجویان موفق). همان‌گونه که مشخص است، مدل درخت تصمیمگیری CART علاوه بر این که از قدرت پیشبینی بیشتری برخوردار بوده، نتیجه پیشبینی متوازنتری نیز داشته است.
– یو و همکاران۲۸۶(۲۰۱۰) داده‌های تعداد شش هزار و ۶۹۰ دانشجو را در دانشگاه ایالتی آریزونا با روش شبکه عصبی، درخت تصمیمگیری و MARS287 تحلیل کردند. MARS یک روش دادهکاوی برای حل مسائل از نوع رگرسیون است. روشی ناپارامتریک که قبل از تحلیل، نیازی به روابط تابعی بین متغیر وابسته و مستقل ندارد. MARS این مفروضه را میپذیرد که اغلب متغیرها به روش‌هایی پیچیده پیامدها را تحت تأثیر قرار میدهند. هدف این پژوهش شناسایی افت تحصیلی دانشجویان در سال سوم تحصیلی بر اساس داده‌های سال دوم آنان بوده است. مشخصههای (متغیرهای پیشبین) این تحقیق متغیرهای دموگرافیک، پیشینه تحصیلی و درصد شرکت در کلاسهای آنلاین بوده است. هر چند گزارشی مبنی بر مقایسه روش‌هایی مختلف در این تحقیق وجود ندارد اما درصد صحت طبقه بندی روش MARS،۷۳.۵۳% گزارش شده است.
– ونگ کامدی و سره سانگ تاکول۲۸۸(۲۰۱۰) قدرت طبقهبندی شبکه عصبی را با تحلیل تشخیص مقایسه کردند. آن‌ها اطلاعات حاصل از ۵۹۴ دانشجوی حضوری را در یکی از دانشگاههای تایلند با استفاده از مدل شبکه عصبی مصنوعی مورد تحلیل قرار دادند. در این پژوهش مدل شبکه عصبی سه لایهای پیشخور۲۸۹ به کار رفته که ۵۰ نورون درونداد و ۳۴ نورون در لایه پنهان و سه نورون در برونداد این مدل به کار رفته است. نورون اول به دانش آموختگی دانشجو در موعد مقرر چهار سال، نورون دوم به تأخیر و ماندگاری در سیستم آموزشی بیش از چهار سال و نورون سوم به دانشجویان مشمول افت تحصیلی مربوط است. در این بررسی، الگوریتم یادگیری پس انتشار۲۹۰ برای آموزش شبکه و تابع فعالسازی لجستیک۲۹۱ در لایه پنهان شبکه عصبی مصنوعی به کار رفته است. نتیجه تحلیل نرخ طبقهبندی صحیح نشان داد: شبکه عصبی ۹۳.۳% افراد را به درستی در طبقات مختلف طبقهبندی کرده، حال اینکه درصد صحت طبقهبندی تحلیل تشخیص ۸۱.۵% بوده است.
– دلن۲۹۲ (۲۰۱۰) در یکی از دانشگاه های آمریکا، ثبتنام یا عدم ثبت نام تعداد شانزده هزار و ۶۶ دانشجوی حضوری را با استفاده از روش‌هایی یادگیری ماشینی پیشبینی کرده. مدلهای یادگیری ماشینی به کار رفته در این پژوهش شبکه عصبی مصنوعی (MLP)، درخت تصمیمگیری (C5) و SVM بوده است. نتایج مقایسهای این بررسی نشان داد: مدل ترکیبی RandomForest در پیشبینی عدم ثبتنام دانشجویان موفقتر از سایر روش‌ها بوده و SVM با ۸۷.۲۳% صحت طبقهبندی کلی بهترین دقت پیشبینی را داشته است. توضیح بیشتر در مورد RandomForest اینکه، این روش ترکیبی از تعداد زیادی درخت تصمیمگیری است. از دیگر نتایج این پژوهش مقایسه نتایج روشها بعد از بالانس کردن داده‌ها است. از آنجا که در داده‌های این تحقیق تعداد نمونه ثبت نام کرده ۸۰% بوده و تعداد افرادی که ثبتنام نکرده‌اند ۲۰% بوده است، محقق نمونه را بالانس کرده و نتایج را مقایسه کرده است. نتایج از بالا رفتن دقت پیشبینی مدلها بعد از بالانس کردم داده‌ها حکایت دارد. محقق با استفاده از روش تحلیل حساسیت مهم‌ترین عوامل موثر را نیز شناسایی کرده که عوامل آموزشی و اقتصادی جزء مهم‌ترین عوامل عدم ثبتنام دانشجویان حضوری شناسایی شده است.
– کُتسیانتیس، پاتریارچیز و اگزنوس۲۹۳(۲۰۱۰) روش ترکیبی۲۹۴ را برای پیشبینی عملکرد دانشجویان از راه دور به کار بردهاند. این پژوهشگران سه الگوریتم، WINNOW، ۱-Nearest Neighbour و Naive Bayes را با بهرهگیری از روش رأیگیری۲۹۵ ادغام کردهاند. در این پژوهش داده‌های یک هزار و ۳۴۷ دانشجوی یونانی تحلیل شده است. دروندادها (مشخصهها) نمرات ثبت شده در چهار تمرین درس و برونداد یا طبقهها، دو کلاسه (ارزشی) بوده است (پاس کردن درس/ افتادن درس). نتایج این بررسی برتری نسبی روش ترکیبی را در مقابل سایر روش‌هایی طبقهبندی نشان داده است. همچنین متوسط صحت طبقهبندی در این پژوهش ۷۸.۹۵% گزارش شده است.
– افندی و همکاران۲۹۶ (۲۰۱۰) از روش‌هایی دادهکاوی برای پیشبینی عملکرد تحصیلی دانشجویان استفاده کردند. برای این هدف داده‌های دو هزار و ۴۲۷ دانشجوی مالزیایی تحلیل شد. این پژوهش از روشها و الگوریتمهای بیز۲۹۷، درخت تصمیمگیری و توابعی۲۹۸(شبکه عصبی، SVM، رگرسیون لجستیک) برای این هدف بهره برده است. نتایج این بررسی نشان داد که الگوریتمهای Naïve Bayes و AODE از روش‌هایی بیز و RBFNNetwork از روش‌هایی شبکه عصبی مصنوعی بیشترین دقت پیشبینی (۹۵.۲۹%) را داشتهاند.
– کومار و ام. ان۲۹۹(۲۰۱۱) در یکی از دانشگاههای هندوستان، نمره نهایی ۱۱۷ دانشجو را با استفاده از درخت تصمیمگیری پیشبینی کردند. دو الگوریتم C4.5 و ID3 در این پژوهش مقایسه شد. درونداد این مدل، نمره دانشجو در دوره قبل بوده که تبدیل به یک متغیر ترتیبی شده و متغیر ملاک آن گذراندن یا عدم گذراندن درس (متغیر دو ارزشی) بوده است. پژوهشگران برای مقایسه دو الگوریتم علاوه بر صحت طبقهبندی، زمان یادگیری را نیز شاخص قرار دادهاند. نتایج پژوهش نشان داد الگوریتم درخت تصمیمگیری C4.5 علاوه بر اینکه از صحت طبقهبندی بالایی برخوردار است (۱۱۶ مورد از ۱۱۷) در مدت زمان صفر ثانیه به استنتاج رسیده، حال اینکه برای ID3 این فرایند ۰.۰۲ ثانیه طول کشیده است.
-گارسیا سایز و زوریلا۳۰۰(۲۰۱۱) در یکی از دانشگاههای اسپانیا برای پیشبینی وضعیت دانشجویان در یک درس (مقدمهای بر روش‌هایی چندرسانهای) از روش‌هایی یادگیری ماشینی استفاده کردند. در این پژوهش سه مجموعه داده به کار رفته است:
در مجموعه اول، تعداد دانشجو ۶۵ و در مجموعه دوم تعداد دانشجو ۱۶۴ نفر بوده است. در این دو مجموعه داده، فعالیتهای دانشجو در طول ترم به عنوان متغیرهای پیشبین به کار رفته است. برونداد یا متغیر ملاک نمره نهایی دانشجو بوده که تبدیل به یک متغیر دو ارزشی “گذراندن/عدم گذراندن” درس شده است. در مجموعه سوم، علاوه بر متغیرهای مربوط به فعالیت دانشجو در طول ترم، پنج متغیر سبک یادگیری دانشجو به عنوان متغیر پیشبین اضافه شده است؛ تعداد دانشجویان در این مجموعه داده ۶۵ نفر بوده است. چهار روش ماشینی متداولِ به کار رفته عبارتند از: الگوریتمهای مبنی بر قاعده، درخت تصمیمگیری، الگوریتمهای بیزی و الگوریتمهای یادگیری مورد مبنا۳۰۱. از نرم افزار دادهکاوی ویکا۳۰۲ برای اجرای دادهکاوی استفاده شده است. پژوهشگران علت عدم استفاده از SVM و شبکه عصبی مصنوعی را عدم وجود ارائه بصری مناسب از یافتهها گزارش کرده‌اند.
نتیجه پیشبینی الگوریتمهای مختلف بر روی داده‌های مجموعه اول (۶۵ دانشجو) نشان داد، الگوریتم Nave Bayes با ۷۷.۲۹% صحت طبقهبندی بیشترین قدرت پیشبینی را دارد و OneR با ۶۵.۷۹ ضعیفترین روش برای تعداد نمونه (داده) اندک است. به اعتقاد این پژوهشگران OneR با تعداد داده‌های کم با مشکل بیش برازش۳۰۳ مواجه میشود، لذا برای داده‌های اندک این روش مناسب نیست. با افزایش تعداد دانشجوها به ۱۶۴ نفر در مجموعه دوم، BayesNet TAN با ۸۱.۲۶% صحت طبقهبندی بیشترین قدرت پیشبینی را داشته است. در مجموعه سوم داده‌ها که پنج متغیر سبک یادگیری اضافه شده، الگوریتم Nave Bayes با ۸۰.۹۰% صحت طبقهبندی بیشترین قدرت پیشبینی را داشته است.
بنا بر آنچه گذشت مشخص می‌شود، صحت طبقهبندی تا حد زیادی به اندازه نمونه و نوع مشخصهها (متغیرها) بستگی دارد. وقتی اندازه نمونه کوچک است (کمتر از ۱۰۰) و مشخصهها از نوع عددی هستند Nave Bayes مناسب است؛ در مقابل وقتی تعداد نمونه زیاد است BayesNet TAN جایگزین مناسبی است. الگوریتم J48 (درخت تصمیمگیری c4.5) برای داده‌های زیاد یا با دادهای اسمی که در آن داد? گم شده وجود دارد، مناسبتر است. هر چند برای این نوع داده‌ها Nave Bayes بهترین قدرت پیشبینی را دارد اما قابلیت تفسیر آن برای مدرس سخت است.
این پژوهشگران در راستای ارتقاء قدرت پیشبینی یک فرا الگوریتم۳۰۴ ارائه داده‌اند. در این فرا الگوریتم موردهایی که برونهشته۳۰۵ محسوب شده از پایگاه داده حذف میشود. به عنوان مثال، مصداق موردهای برونهشته، دانشجویانی هستند که با یک جلسه حضور در کلاس میتوانند درس را به موفقیت بگذرانند و یا در مقابل فردی با شرکت در تمام جلسات موفق به گذراندن درس نمیشود، به این گونه دانشجوها، موارد برونهشته گفته میشود. در این پژوهش با به‌کارگیری روش‌هایی انتخاب مهم‌ترین ویژگیها و حذف موارد برون هشته عملکرد روش‌هایی پیشبین ماشینی به طور قابل توجهی بهبود یافته است. به عنوان مثال حذف موارد برونهشته از مجموعه داده دوم (۱۶۴ دانشجو) نشان داد در الگوریتم Nave Bayes صحت طبقهبندی دانشجویان موفق از ۶۳.۷۵% به ۷۵% و دانشجویان ناموفق از ۸۵.۰۹% به ۸۶.۸۴% افزایش یافته است.
– جین، ایمبِری و لین۳۰۶(۲۰۱۱) با استفاده از شبکه عصبی پس انتشار، داده‌های یک هزار و ۴۷۰ دانشجوی آمریکایی را بررسی کردند. این مدل ۵۰ نورون در لایه پنهان داشته و از تابع لگاریتمی۳۰۷برای

این مطلب مشابه را هم بخوانید :   دانلود پایان نامه ارشد درموردقانون مدنی، حق مالکیت، دارایی ها، نظم عمومی

دیدگاهتان را بنویسید