<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Tehran University Medical Journal</title>
<title_fa>مجله دانشکده پزشکی، دانشگاه علوم پزشکی تهران</title_fa>
<short_title>Tehran Univ Med J</short_title>
<subject>Medical Sciences</subject>
<web_url>http://tumj.tums.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>1683-1764</journal_id_issn>
<journal_id_issn_online>1735-7322</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.18869/acadpub.tumj</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>000</journal_id_sid>
<journal_id_nlai>000</journal_id_nlai>
<journal_id_science>000</journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1398</year>
	<month>5</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2019</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<volume>77</volume>
<number>5</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>other</language>
	<article_id_doi></article_id_doi>
	<title_fa>مقایسه کارایی روش‌های داده‌کاوی در پیش‌بینی ابتلا به بیماری دیابت نوع 2</title_fa>
	<title>Comparison of the efficiency of data mining methods in predicting type 2 diabetes</title>
	<subject_fa></subject_fa>
	<subject></subject>
	<content_type_fa>مقاله اصیل</content_type_fa>
	<content_type>Original Article</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family:yekanyw;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;زمینه و هدف:&lt;/span&gt;&lt;/strong&gt; &lt;span style=&quot;font-size:10.0pt;&quot;&gt;دیابت بیماری مزمنی است که شایع&#8204;ترین بیماری اختلالات متابولیسم و یکی از عمده&#8204;ترین مسایل بهداشتی-درمانی در سرتاسر دنیا است. امروزه تکنیک&#8204;های داده&#8204;کاوی&lt;/span&gt; &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(Data mining techniques)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; با توجه به توانمندی آن&#8204;ها، در حوزه&#8204;های مختلف به&#8204;کار برده می&#8204;شوند. بنابراین در این پژوهش به مقایسه کارایی روش&#8204;های داده&#8204;کاوی در پیش&#8204;بینی ابتلا به بیماری دیابت نوع ۲ پرداخته شد.&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;روش بررسی: &lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در این مطالعه تحلیلی-مقطعی، از مجموع ۷۰۰۰ نفر شرکت&#8204;کننده در طرح غربالگری دیابت سال ۱۳۹۵ در منطقه ثامن مشهد که شامل بررسی میزان قند&#8204;خون، چشم&#8204;ها، آسیب کلیوی و سلامت پاها بود، تعداد ۵۴۰ نفر مبتلا به بیماری دیابت (درمان نشده) بودند و برای حفظ توازن ۶۰۰ فرد سالم به&#8204;صورت نمونه&#8204;گیری متناسب با حجم انتخاب شدند (حجم کل نمونه ۱۱۴۰ نفر). در این مطالعه مبتلایان به دیابت بالای ۳۰ سال وارد مطالعه گردیدند و افرادی که از پیش سابقه&#8204;ی دیابت نوع ۲ داشتند و اکنون به&#8204;سبب استفاده از دارو و یا رعایت سایر نکات مقدار قند&#8204;خون طبیعی داشتند از مطالعه حذف گردیدند.&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;یافته&#8204;ها:&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt; &lt;span style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;صحت هر سه مدل برابر بود (۸۶%) اما از نظر سطح زیرمنحنی راک &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(Receiver operating characteristic, ROC&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;،&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; مدل&#8204;های رگرسیون لجستیک &lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(Logistic regression model)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; و بیزین ساده &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(Simple Bayesian model)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; با۹۰% سطح زیرمنحنی راک عملکرد بهتری داشتند. در مدل بیزین ساده و رگرسیون لجستیک به&#8204;ترتیب متغیرهای شاخص توده &lt;span style=&quot;letter-spacing:-.1pt;&quot;&gt;بدنی و سن دارای بیشترین میزان اهمیت بودند، در&#8204;حالی&#8204;که در مدل ماشین&#8204;بردار پشتیبان &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot; style=&quot;letter-spacing:-.1pt;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;(Support vector machine, SVM)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;، متغیرهای شاخص توده بدنی و فشارخون دارای بیشترین اهمیت بودند.&lt;/span&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;نتیجه&#8204;گیری: &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;صحت هر سه مدل برابر &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بود.&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; از نظر سطح زیرمنحنی راک، مدل&#8204;های رگرسیون لجستیک و بیزین ساده مناسب&#8204;تر بودند. در مجموع هر سه مدل عملکرد مشابهی داشتند. &lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در هر سه مدل شاخص توده بدنی دارای بیشترین اهمیت بود.&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;letter-spacing:-.2pt;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/div&gt;
</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Background&lt;/strong&gt;: Diabetes mellitus as a chronic disease is the most common disease caused by metabolic disorders and it is one of the most important health issues all around the world. Nowadays, data mining methods are applied in different fields of sciences due to data mining methods capability. Therefore, in this study, we compared the efficiency of data mining methods in predicting type 2 diabetes.&lt;br&gt;
&lt;strong&gt;Methods&lt;/strong&gt;: In this cross-sectional study, the data of 7,000 participants in the Diabetes Screening Project in Samen, Mashhad City, Iran, were considered in 2016. There were 540 untreated diabetic patients. The Samen Project was included in the routine examinations of diabetes patients like blood glucose, eyes health, nephropathy, and legs health. So, in order to maintain balance, 600 healthy individuals were selected in a proportional volume sampling in this study. Therefore, the total sample size was 1140 people. In this study, people with diabetes aged over 30 years old were enrolled and participants with the previous history of type 2 diabetes, with normal blood glucose due to drug use or other issues at the time of the study, were excluded.&lt;br&gt;
&lt;strong&gt;Results&lt;/strong&gt;: All three models (Logistic regression, simple Bayesian and support vector machine models) had the same test accuracy (86%), however, in terms of area under the receiver operating characteristic (ROC) curve (AUC), logistic regression and simple Bayesian models had better performance (AUC=90% against AUC=88%). In the simple Bayesian model and logistic regression, body mass index (BMI) and age variables were the most important variables, while BMI and blood pressure variables were the most important factors in the support vector machine model.&lt;br&gt;
&lt;strong&gt;Conclusion&lt;/strong&gt;: According to the results, all three models had the same accuracy. In terms of area under the curve (AUC), logistic and simple Bayes models had better performance than the support vector machine model. Totally all three models had almost the same performance. Based on all three models, BMI was the most important variable.&lt;/div&gt;
</abstract>
	<keyword_fa>داده‌کاوی, دیابت شیرین, بیماری‌های متابولیک, حساسیت و ویژگی</keyword_fa>
	<keyword>data mining, diabetes mellitus, metabolic diseases, sensitivity and specificity</keyword>
	<start_page>301</start_page>
	<end_page>307</end_page>
	<web_url>http://tumj.tums.ac.ir/browse.php?a_code=A-10-4258-3&amp;slc_lang=other&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Hossein </first_name>
	<middle_name></middle_name>
	<last_name>Tireh </last_name>
	<suffix></suffix>
	<first_name_fa>حسین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>تیره</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Epidemiology and Biostatistics, Faculty of Health, Mashhad University of Medical Sciences, Mashhad, Iran.</affiliation>
	<affiliation_fa>گروه اپیدمیولوژی و آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد، مشهد، ایران.</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Taghi </first_name>
	<middle_name></middle_name>
	<last_name>Shakeri </last_name>
	<suffix></suffix>
	<first_name_fa>محمدتقی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شاکری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Epidemiology and Biostatistics, Faculty of Health, Mashhad University of Medical Sciences, Mashhad, Iran.</affiliation>
	<affiliation_fa>مرکز تحقیقات عوامل اجتماعی موثر بر سلامت، دانشگاه علوم پزشکی مشهد، مشهد، ایران.</affiliation_fa>
	 </author>


	<author>
	<first_name>Sadegh </first_name>
	<middle_name></middle_name>
	<last_name>Rasoulinezhad </last_name>
	<suffix></suffix>
	<first_name_fa>صادق</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>رسولی‌نژاد</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Epidemiology and Biostatistics, Faculty of Health, Mashhad University of Medical Sciences, Mashhad, Iran.</affiliation>
	<affiliation_fa>گروه اپیدمیولوژی و آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد، مشهد، ایران.</affiliation_fa>
	 </author>


	<author>
	<first_name>Habibollah </first_name>
	<middle_name></middle_name>
	<last_name>Esmaily </last_name>
	<suffix></suffix>
	<first_name_fa>حبیب‌اله</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>اسماعیلی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code></code>
	<orcid></orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Epidemiology and Biostatistics, Faculty of Health, Mashhad University of Medical Sciences, Mashhad, Iran.</affiliation>
	<affiliation_fa>مرکز تحقیقات عوامل اجتماعی موثر بر سلامت، دانشگاه علوم پزشکی مشهد، مشهد، ایران.</affiliation_fa>
	 </author>


	<author>
	<first_name>Razieh </first_name>
	<middle_name></middle_name>
	<last_name>Yousefi </last_name>
	<suffix></suffix>
	<first_name_fa>راضیه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>یوسفی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>yousefir9@mums.ac.ir</email>
	<code></code>
	<orcid></orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Department of Epidemiology and Biostatistics, Faculty of Health, Mashhad University of Medical Sciences, Mashhad, Iran.</affiliation>
	<affiliation_fa>گروه اپیدمیولوژی و آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی مشهد، مشهد، ایران.</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
