با توجه به افزایش حجم داده ها در عصر اطلاعات وقت و هزینه قابل توجهی جهت دسته بندی و جستجوی داده ها صرف می گردد که نیاز به روش ها و مدل های جدید داده کاوی بیش از پیش مشهود است، خصوصا این نیاز در مورد وب که بزرگترین پایگاه اطلاعات عمومی است ضروری تر می نماید. در این خصوص دو عامل حجم و تنوع اطلاعات به همراه تعداد رو به رشد کاربران چالش بزرگی را در زمینه فرایند داده کاوی بوجود آورده است شایان ذکر است که یکی از فرآیندهای اصلی در سیستم های جستجوگر شاخص گذاری اطلاعات است که ارتباط مستقیم با تعداد اسناد موجوددر پایگاه دارد. تحقیقات اخیر نشان میدهد که زمان شاخص گذاری با افزایش تعداد اسناد موجود در پایگاه داده به شدت افزایش می یابد تحقیق حاضر به بررسی خصوصیات اسناد یک پایگاه داده بزرگ و استاندارد شامل پرونده های جمع آوری شده از وب پرداخته است این خصوصیات شامل تعداد، نوع، و اندازه اسناد که تاثیر آن ها بر ساختار فایل شاخص و فرآیند شاخص گذاری مورد بررسی قرارگرفته است.
کلمات کلیدی: داده کاوی، بازیابی اطلاعات، شاخص گذاری، ساختار فایل معکوس، حجم پایگاه داده
تعداد مشاهده: 3106 مشاهده
کد فایل:7275
انتشار در:۱۳۹۸/۲/۲۶
حجم فایل ها:226.5 کیلوبایت
تعداد صفحات: 8
زبان: فارسی
سال انتشار: 1388
محل انتشار: سومین کنفرانس داده کاوی
فرمت: (PDF) غیر قابل ویرایش
منابع و مآخذ: دارد
جدول و نمودار: دارد
عکس و تصویر: ندارد
مقاله درباره هوش مصنوعی
قیمت : 50,000 تومان
توضیحات بیشتر دریافت فایل
ترجمه مقاله الگوریتم لانه مورچگان مبتنی بر استراتژی تعادل بار در رایانش ابری
قیمت : 30,000 تومان
ترجمه مقاله انگلیسی استراتژی هوشمند زمانبندی وظیفه برای تعادل بار در محاسبات ابری
قیمت : 33,000 تومان
ترجمه مقاله ارزیابی کاربرد پذیری تکنولوژی های وب معنایی
قیمت : 40,000 تومان
ترجمه مقاله ارزیابی عملکرد متریک های مسیریابی IBETX بر روی پروتکل های مسیریابی DSDV در شبکه
قیمت : 45,000 تومان
مقاله آشنایی با لینوکس و طریقه نصب دو نسخه مختلف بر روی ماشین مجازی
قیمت : 5,000 تومان
مقاله ارائه روشی برپایه کاوش معنایی به منظور بالا بردن دقت نتایج جستجو در نرم افزارهای قرآنی
قیمت : 2,500 تومان
مقاله بررسی انواع موتورهای جستجو ، قوانین و الگوریتم های آن ها