در سالهای اخیر محتوای منتشرشده بر روی وب به طور چشمگیری افزایش یافته است. بخش عمدهای از این اطلاعات بهصورت نیمهساختاریافته در اختیار عموم قرار دارند. علاوه بر این، حجم عظیمی از اطلاعات مرتبط با محل هستند. این گونه اطلاعات به یک مکان بر روی زمین اشاره دارند، اما دارای مختصات صریح آن محل نیستند. در این مقاله به مکانمرجعسازی منابع نیمهساختاریافته در وب با استفاده از یادگیری ماشین پرداخته شده است. مزیت این روش عدم نیاز به استفاده از روشهای پیچیده متنکاوی جهت مکانمرجعسازی است. بدین منظور، از آگهیهای تبلیغاتی تارنمای دیوار مرتبط با املاک و مستغلات در شهر تهران استفاده شده است. به منظور جمعآوری داده از روش خزیدن در وب بهره برده شده است. همچنین، جهت دستیابی به هدف تحقیق، الگوریتم جنگلهای تصادفی به عنوان یک روش یادگیری ماشین مناسب بکار گرفته شده است. نتایج تحقیق نشان میدهد که با استفاده از این روش، آگهیهای تبلیغاتی تارنمای دیوار با دقت مناطق تهران قابل مکانمرجعسازی است. به طور کمّی، دقت بدست آمده در این تحقیق حدود 6 کیلومتر در راستای طول جغرافیایی و حدود 2 کیلومتر در راستای عرض جغرافیایی است. همچنین، نتایج این تحقیق نشان میدهد که متغیر قیمت ملک نسبت به دیگر متغیرها از اهمیت و تاثیر بیشتری در تعیین مکان آگهی برخوردار است. علاوه بر این، از نتایج این تحقیق میتوان نتیجه گرفت که قیمت املاک در شهر تهران در راستای شمالی – جنوبی دارای الگوی مکانی بیشتری نسبت به راستای شرقی – غربی هستند.
Abbasi O R, Alesheikh A A. Georeferencing Semi-Structured Place-Based Web Resources Using Machine Learning. JGST 2020; 10 (2) :119-129 URL: http://jgst.issgeac.ir/article-1-927-fa.html
عباسی امیدرضا، آل شیخ علی اصغر. مکان مرجع سازی منابع محل مبنای نیمه ساختاریافته در وب با استفاده از یادگیری ماشین. علوم و فنون نقشه برداری. 1399; 10 (2) :119-129