استخراج دیتا سایت booking.com

پخش
تاریخ

تاریخ و مدت

12 آبان 1402  |  15

توضیحات پروژه:

در این پروژه، هدف استخراج و جمع‌آوری اطلاعات جامع و دقیقی از هتل‌های موجود در سایت Booking.com بوده است. به منظور دستیابی به این هدف، فعالیت‌های مختلفی انجام شده که شامل موارد زیر می‌باشد:

  1. استخراج اطلاعات و بخش‌های مختلف هر هتل:
    • جزئیات کامل هتل‌ها شامل آدرس، تعداد اتاق‌ها، قیمت‌ها، امکانات و خدمات ارائه شده، و فاصله هتل تا مکان‌های تفریحی و گردشگری نزدیک.
    • اطلاعاتی همچون تمامی خدماتی که هتل در بخش های متخلف خود ارائه میدهد.
    • قوانین و مقررات وضع شده برای ورود، خروج و استفاده از خدمات هتل.
    • سوالات پر تکراری که ممکن است برای مسافران راجع به این هتل به وجود آمده باشد.
  2. خارج کردن عکس‌های هتل:
    • دریافت و ذخیره تمامی تصاویر مربوط به هر هتل که در سایت قرار داده شده‌اند تا کاربران بتوانند دید بهتری از محیط و شرایط هتل داشته باشند.
  3. استخراج کامنت‌ها و نظرات کاربران:
    • جمع‌آوری تمامی نظرات و بازخوردهای کاربران به همراه نکات مثبت و منفی‌ای که هر کاربر مطرح کرده است. هر نظر با تمامی جزئیات شامل تاریخ نظر، امتیاز داده شده، و تجربه کاربر از اقامت در هتل ذخیره شده است.

تکنولوژی‌های استفاده شده در پروژه:

  • re: برای پردازش و استخراج الگوهای متنی مختلف از صفحات وب.
  • selenium: برای خودکارسازی مرورگر و دسترسی به داده‌های داینامیک موجود در صفحات وب.
  • sqlite3: برای ذخیره‌سازی و مدیریت داده‌های استخراج شده به صورت ساخت‌یافته.
  • sys: برای مدیریت پارامترها و اجرای عملیات سیستم.
  • pyautogui: برای انجام برخی از عملیات‌های اتوماتیک نیازمند شبیه‌سازی تعاملات انسانی با سیستم.

این پروژه با ترکیب تکنولوژی‌های مذکور توانسته است یک سیستم کارآمد و قابل اعتماد برای استخراج، ذخیره و تحلیل داده‌های مربوط به هتل‌ها از سایت Booking.com ارائه دهد. با بهره‌گیری از این اطلاعات، می‌توان به تحلیل‌های دقیق‌تری در زمینه‌های مختلفی مانند کیفیت خدمات هتل‌ها، نظرات کاربران و تجربه‌های آنان دست یافت.

آپدیت نرم افزار :

در آپدیت بعدی نرم افزار این پروژه بر روی کروم پیاده سازی شد و به کمک یک اکستنشن دیتا به صورت خودکار برای کاربر بر روی سطح وب ترجمه میشد و سپس در دیتابیس ذخیره سازی انجام میگرفت.

همچنین در این پروژه پس از استخراج این دیتا به صورت دقیق، ربات دیگری طراحی شد که به کمک آن دیتای خارج شده از سایت بوکینگ با تغییرات اندکی بر روی وب سایت مقصد که متعلق به کارفرما بود آپلود میشد.