نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار گروه مهندسی طبیعت و گیاهان دارویی، دانشکده کشاورزی و منابع طبیعی، دانشگاه تربتحیدریه، خراسان رضوی، ایران
2 کارشناس ارشد آبخیزداری، شرکت سامانه آب کومش، خراسان رضوی، ایران
3 کارشناس گروه آموزشی مدیریت مناطق بیابانی، مرکز تحقیقات بینالمللی بیابان، دانشگاه تهران، ایران
چکیده
گسل از فرآیندهای اصلی زمینریختی است که با پدیدههایی همچون زمینلرزه ارتباط دارد. لذا آگاهی از اثر عوامل محیطی در بروز گسل و شناخت مناطق پرخطر اهمیت زیادی دارد که این اهداف در پژوهش حاضر بررسی شدهاند. عرصه پژوهش حوضه قرهقوم است که پس از تعیین گسلهای آن، متغیرهای ارتفاع، شیب، جهت، اقلیم، کاربری، ژئومورفولوژی، سنگشناسی، فرسایش، بارش، پهنههای سیلابی، خاکشناسی، شاخصهای قدرت جریان، ناهمواری زمین و فاصله از جاده، آبراهه، تاقدیس و ناودیس آن استخراج گردید. سپس الگوریتمهای دادهکاوی شامل درختتصمیم، جنگلتصادفی، تجمیعیبوستینگ، ماشینبردارپشتیبان، رگرسیونلوجیستیک و شبکهعصبی در نرمافزار R جهت شناسایی ارزش متغیرها و روشهای آماری دومتغیره شامل ارزش اطلاعات و تراکم سطح برای شناسایی ارزش کلاسهای هر متغیر در وقوع گسل برازش شد. ارزیابی دقت طبقهبندی الگوریتمها با منحنی ROC نشان داد الگوریتمهای جنگلتصادفی و ماشینبردارپشتیبان به ترتیب با سطح زیر منحنی 88 و 86 درصد بهترین عملکرد را در طبقهبندی وقوع گسل بر مبنای متغیرهای ورودی دارند. در نهایت با ضرایب جینی در الگوریتم جنگل تصادفی، نقشههای پهنهبندی بهدست آمده از ترکیب این الگوریتم با روشهای آماری دومتغیره،تهیه و اعتبارسنجی شد. طبق این الگوریتم، بهترتیب متغیرهای ارتفاع، خاکشناسی و شاخص ناهمواری زمین مهمترین پارامترها در وقوع گسل شناخته شدند. طبق ارزیابی نقشههای پهنهبندی، در روش ارزش اطلاعات و تراکم سطح بهترتیب حدود 52 و 35 درصد گسلها در کلاس خطر خیلیزیاد واقع شدند. لذا روش ارزش اطلاعات در تعیین پهنههای حساس به وقوع گسل دقت بیشتری داشت. با توجه به نتایج، روشهای دادهکاوی به عنوان ابزاری مفید در مدیریت ریسک گسل معرفی گردید. همچنین لزوم توجه به متغیرهای محیطی بهویژه توپوگرافی در مراحل مدیریت و تغییر کاربری حوضه ضرورت مییابد.
کلیدواژهها
عنوان مقاله [English]
Evaluation of data mining and bivariate statistical methods in risk zoning of fault occurrence (Case study: Qara-Qum watershed)
نویسندگان [English]
- Mehdi Bashiri 1
- Seyedeh Maedeh Kavosi Davodi 2
- Ali Afzali 3
1 Assistant Professor, Department of Nature Engineering and Medicinal Plants, Faculty of Agriculture and Natural Resources, University of Torbat Heydarieh, Razavi-Khorasan, Iran
2 M.Sc. in Watershed Management, Samane-Ab-Koomesh Company, Razavi-Khorasan, Iran
3 M.Sc. in Watershed Management, Department of Management of Desert Regions, International Desert Research Center, Tehran University, Iran
چکیده [English]
Fault is one of the main processes in tectonics which has relationship with phenomena such as earthquake. Therefore, awareness of the effect of environmental factors on fault occurrence and recognition of high risk areas is very important, that these goals in the present study have been investigated. The research area is Qara-Qum where after determining its faults, altitude, slope, direction, climate, land use, geomorphology, geology, erosion, precipitation, flood zones, pedology, stream power, topographic ruggedness index, distance from road, waterway, anticline and syncline were extracted. Then, data mining algorithms including of decision tree, random forest, cumulative, backing machine, logistic regression and neural network in R software are used to identify the value of variables and bivariate statistical methods including of information value and area density for identification of the values for each variable class fitted in fault occurrence. The accuracy of classification algorithms with ROC curve showed that based on input variables, random forest and support vector machine algorithms with 88% and 86% area under a curve had the best performance in classifying fault occurrence, respectively. Finally, according to the Gini coefficients in random forest algorithm, the zoning maps obtained by combining this algorithm were prepared and validated by bivariate statistical methods. According to this algorithm, the height, pedology and topographic ruggedness index variables, identified as the most important parameters in the fault occurrence respectively. Based on the zoning maps evaluation, information value and area density methods, around 52 and 35 percent of faults placed in very high risk class respectively. Therefore, the information value method was more accurate in identifying fault-sensitive zones. According to the results, data mining methods were introduced as a useful tool in fault risk management. It is also necessary to pay attention to environmental variables, especially topography, during the basin management and land use change stages.
کلیدواژهها [English]
- Density Area
- Information Value
- ROC Curve
- Classification Algorithm