بیاموزید TF-IDF چیست، چگونه کار میکند، چرا بخشی از واژگان SEO است، و مهمتر از همه – آیا گوگل از آن به عنوان یک فاکتور رتبهبندی استفاده میکند یا خیر.
TF-IDF چیست و آیا واقعاً می تواند به استراتژی SEO شما کمک کند؟
اگر فکر کنید، “آن افراد دیوانه سئو… بعد به چه چیزی فکر خواهند کرد؟”
اما این مورد مربوط به این رهبر فکری یا تلاش برای ایجاد یک عبارت جدید نیست.
ادعا: TF-IDF یک عامل رتبه بندی است
اگر به دنبال کسب اطلاعات بیشتر در مورد این موضوع هستید، برخی از عناوین وحشی را خواهید دید که به شما این احساس را می دهند که با عدم تخصیص بودجه به TF-IDF در سال جاری، از دست داده اید:
- TF-IDF برای سئو: چه چیزی کار می کند و چه چیزی کار نمی کند.
- TF-IDF: بهترین ابزار بهینه سازی محتوا که سئوکاران از آن استفاده نمی کنند.
- SEO TF IDF: چگونه رقبای خود را با TF-IDF شکست دهیم.
- آیا TF-IDF تاکتیک سئوی است که شما از دست داده اید؟
تبلیغ خدمات رخ نت : طراحی سایت اصفهان
شواهد برای TF-IDF به عنوان یک عامل رتبه بندی
بیایید با این شروع کنیم: TF-IDF چیست؟(Term frequency–inverse document frequency)
فرکانس اصطلاح-فرکانس معکوس سند اصطلاحی از حوزه بازیابی اطلاعات است.
این رقمی است که اهمیت آماری هر کلمه ای را برای مجموعه اسناد به عنوان یک کل بیان می کند.
به زبان ساده، هرچه یک کلمه بیشتر در مجموعه اسناد ظاهر شود، اهمیت آن بیشتر است و وزن آن عبارت سنگینتر میشود.
چه ربطی به جستجو دارد؟
خوب، گوگل یک سیستم غول پیکر بازیابی اطلاعات است.
فرض کنید مجموعهای از 500 سند دارید و میخواهید آنها را به ترتیب ارتباط با اصطلاح [تحرک و چرخش] رتبهبندی کنید.
بخش اول معادله، فرکانس مدت (TF)، به صورت زیر است:
- اسنادی که شامل هر سه کلمه نیستند را نادیده بگیرید.
- تعداد دفعاتی که هر عبارت در هر سند باقی مانده ظاهر می شود را بشمارید.
- فاکتور در طول سند.
چیزی که سیستم به پایان می رسد یک رقم TF برای هر سند است.
اما این رقم به تنهایی می تواند مشکل ساز باشد.
بسته به اصطلاح، همچنان میتوانید با انبوهی از اسناد و مدارک مواجه شوید و هیچ سرنخ واقعی در مورد اینکه کدام یک به درخواست شما مرتبط است، وجود ندارد.
مرحله بعدی، فرکانس معکوس سند (IDF)، زمینه TF شما را کمی بیشتر می کند.
فراوانی سند = شمارش عبارات در مجموعه سند.
معکوس = معکوس کردن اهمیت اصطلاحاتی که اغلب ظاهر می شوند.
در اینجا، سیستم عبارت [and] را از معادله حذف میکند، زیرا میتوانیم ببینیم که در تمام 500 سند به قدری مکرر رخ میدهد که به این جستار خاص بیربط است.
ما نمی خواهیم اسنادی که بیشترین موارد [و] در بالاترین رتبه داشته باشند.
اسنادی که بیشترین وزن را برای [تکان دادن] و [غلتان] دارند، در حالی که برای طول متن عادی می شوند، به احتمال زیاد مربوط به افرادی هستند که به دنبال اطلاعات در مورد [تکان و چرخش] هستند.
شواهد علیه TF-IDF به عنوان یک عامل رتبه بندی
با افزایش اندازه و تنوع مجموعه اسناد، کاربرد این متریک کاهش می یابد.
جان مولر از گوگل در این مورد صحبت کرده و توضیح داده است
«این یک معیار نسبتاً قدیمی است و همه چیز در طول سالها کمی تکامل یافته است. معیارهای بسیار دیگری نیز وجود دارد.»
فکر نمیکنم این بگوید که این یک عامل نیست. من فکر میکنم که او به وضوح میگوید این دیگر آنقدرها مهم نیست.
و به همان اندازه که مردم دوست دارند باور کنند که مولر سعی میکند یکی از آنها را تحت فشار قرار دهد، هیچ راهی وجود ندارد که او در این مورد ایراد بگیرد.
شناسایی اینکه کدام اسناد حاوی کلماتی است که جستجوگر در حال پرس و جو است، اولین قدم ضروری در بازگشت پاسخ است.
اما با این گفته، این یک معیار قدیمی است که به تنهایی مفید نیست.
در ایندکس به اندازه گوگل، بهترین کاری که TF-IDF می تواند انجام دهد این است که میلیون ها یا میلیاردها نتیجه را به ارمغان بیاورد.
آیا می توانید برای آن بهینه سازی کنید؟
خیر.
آشنایی بیشتر با خدمات رخ نت : طراحی کارت ویزیت در اصفهان
تلاش برای بهینه سازی برای TF-IDF به معنای تلاش برای دستیابی به چگالی کلمه کلیدی خاصی است و به آن پر کردن کلمات کلیدی می گویند.
این کار را نکن
با این حال، این بدان معنا نیست که این مفهوم برای متخصصان سئو اهمیتی ندارد.
TF-IDF به عنوان یک عامل رتبه بندی: حکم ما
آیا گوگل از TF-IDF در الگوریتم رتبه بندی جستجوی خود استفاده می کند – حتی به طور بالقوه به عنوان بخشی اساسی از الگوریتم خود؟
ما می گوییم قطعا نه.
چرا؟ زیرا این یک مفهوم قدیمی (در سالهای تکنولوژیک) بازیابی اطلاعات است.
امروزه، گوگل روش های بسیار برتری برای ارزیابی صفحات وب دارد (به عنوان مثال، بردار کلمات، شباهت کسینوس، و دیگر روش های پردازش زبان طبیعی).
دانستن اینکه آیا کلمه ای که کاربر در جستجوی آن است در یک سند ظاهر می شود یا خیر، تنها اولین قدم است.
TF-IDF بدون هزاران لایه دیگر از تجزیه و تحلیل برای تعیین چیزهایی مانند تخصص، اقتدار و اعتماد، برای مبتدیان چیز زیادی را به حساب نمی آورد.
این بدان معناست که TF-IDF ابزار یا تاکتیکی نیست که بتوانید از آن برای بهینه سازی سایت خود استفاده کنید.
شما نمی توانید هیچ نوع تجزیه و تحلیل مفیدی با TF-IDF انجام دهید یا از آن برای بهبود سئوی خود استفاده کنید، زیرا برای اجرای محاسبات به کل مجموعه نتایج جستجو نیاز دارد.
بعلاوه، ما فراتر از این که بخواهیم بدانیم از چه کلمات کلیدی برای نحوه استفاده از آنها استفاده میشود و چه موضوعات مرتبطی مطرح میشوند، فارغالتحصیل شدهایم تا مطمئن شویم که زمینه و هدف با ما مطابقت دارد.
متخصصان سئو که از اصطلاحات TF-IDF و جستجوی معنایی به جای یکدیگر استفاده می کنند، TF-IDF را اشتباه درک می کنند.
این فقط معیاری است برای اینکه یک کلمه چند بار در مجموعه اسناد ظاهر می شود.
خط آخر: درک نحوه ارزیابی محتوا بسیار مهم است، اما این دانش همیشه نباید به آیتم دیگری در چک لیست SEO شما منجر شود.
مگر اینکه سیستم بازیابی اطلاعات خود را بسازید، TF-IDF سیستمی است که می توانید آن را به عنوان یک واقعیت جالب از روزهای گذشته معرفی کنید و ادامه دهید.
منبع : searchenginejournal.com