محتوای تکراری چیست؟ آیا تاثیر در سئو سایت دارد؟

محتوای تکراری چیست؟ آیا محتوای تکراری به سئو سایت اسیب می زند؟ ایا وب سایت هایی که سئو بالایی دارند دارای محتوای کپی شده هستند؟

محتوای تکراری چیست؟

محتوای تکراری به محتوایی گفته می شود که بیش از یک مکان در اینترنت پیدا می شود. منظور از «یک مکان» یک محلی با آدرس وب سایت منحصر به فرد URL است، پس به این صورت اگر محتوای شما بیشتر از یک آدرس وب ظاهر شده است شما محتوای تکراری دارید.

در حالی که محتوای تکراری معمولا سایت شما را با پنالتی مواجه نمی کند ولی اغلب بر روی رنکینگ موتور جستجوی شما یا سئو تاثیر می گذارد. هر زمانی که چندین قطعه‌ی «خیلی مشابه» به گفته‌ی گوگل، در بیش از یک محل در اینترنت وجود داشته باشد، تصمی گیری برای موتور های جستجو مشکل می شود که کدام یک مناسب تر است تا آن را به عنوان نتیجه جستجوی کاربر انتخاب و عرضه کنند.

چرا محتوای تکراری در سئو تاثیر دارد؟

برای موتور جستجو

محتوای تکراری می تواند سه مشکل اصلی را برای موتور های جستجو یا سئو سایت به وجود آورد:

  1. آن ها نمی دانند کدام یکی را به شاخص خود وارد یا خارج کنند.
  2. آن ها نمی دانند که آیا می توان معیارهای لینک(اعتماد، اعتبار، متن لنگر، حقوق لینک، و غیره) را به یک صفحه هدایت کنند یا آن را بین چندین نسخه تقسیم کنند.
  3. آن ها نمی دانند به کدام نسخه(ها) به عنوان نتیجه جستجو کاربر رنک دهی کنند

برای صاحبان سایت

وقتی محتوای تکراری وجود داشته باشد، صاحبان سایت ممکن است شاهد از دست فتن رنک و ترافیک باشند. این تلفات ممکن است ۲ دلیل اساسی داشته باشد:

  1. برای ارائه بهترین تجربه جستجو، موتورهای جستجو به ندرت چند نسخه از یک محتوا مشابه را نشان می دهد، و آن ها بر روی محتوای تمرکز می کنند که بتوانند آن را به عنوان بهترین نتیجه به کاربر نشان دهند. محتوای تکراری نمی گذارند موتور های جستجو متوجه اهمیت و کیفیت این محتوا بشوند.
  2. ارزش لینک ها ممکن است کاهش داشته باشد، زمانی که سایت های دیگر به محتوای شما لینک می دهند این ارزش لینک دهی به محتوا های تکراری تقسیم می شود و همه ی ارزش ها متوجه یک صفحه نمی شود و این کار باعث کاهش ارزش لینک های و در نتیجه رنک داده شده به محتوا و سایت شما بشود. چون لینک های ورودی یک از فاکتور های رنک دهی به سایت شما هستند.

چگونه مشکل محتوای تکراری اتفاق می افتد؟

در بیشتر مواقع صاحبان وبسایت بصورت عمد محتوای تکراری ایجاد نمی کنند. اما این دلیلی نیست که بگوییم آن ها بی تقصیر هستند. در واقع بر اساس برآورد ها ۲۹٪ وب را محتوای تکراری تشکیل می دهد!

بیایید نگاهی به برخی از رایج ترین روش هایی که محتوای تکراری ایجاد می کند نگاهی بیاندازیم.

۱. تغییرات URL

پارامترهای URL، مانند ردیابی کلیک و برخی از کدهای تجزیه و تحلیل، می توانند موجب ایجاد مشکل محتوای تکراری شوند. این مشکل نه تنها توسط خود پارامتر ها ایجاد می شوند، بلکه این مشکلات در نحوه ای که این پارامتر ها در URL به نمایش در می آیند نیز ایجاد می شوند.

برای مثال:

  • www.widgets.com/blue-widgets?color=blue is a duplicate of www.widgets.com/blue-widgets
  • www.widgets.com/blue-widgets?color=blue&cat=3 is a duplicate of www.widgets.com/blue-widgets?cat=3&color=blue

به طور مشابه، شناسه جلسه یک سازنده ی محتوای تکراری رایج است. زمانی این اتفاق می افتد که هر کاربری که از سایت بازدید می کند، یک شناسه جلسه مختلفی اختصاص داده می شود که در URL ذخیره می شود.

صفحاتی که قابلیت پرینت در ان ها اورده می شود، زمانی که نسخه های مختلف صفحه ایندکس می شود، ممکن است با مشکل محتوای تکراری مواجه شوند.

درسی که در اینجا وجود دارد این است که در صورت امکان بهتر است از اضافه کردن پارامتر و یا نسخه های متناب به URL خودداری کنید(اسکریپت ها معمولا می توانند این اطلاعات را با خودشان حمل کنند).

۲. HTTP در مقابل HTTPS یا WWW در مقابل صفحات غیر WWW

اگر سایت شما دارای نسخه های جداگانه مانند “www.site.com” و “site.com” (همراه و یا بدون پیشوند “www”) باشند، و محتوای مشابه بر روی هر دوی آن ها وجود داشته باشد، شما توانسته اید با موفقیت یک صفحه ی تکراری از هر محتوای خود ایجاد کنید.همین امر در مورد سایت هایی که نسخه های http: // را همزمان با https: // حفظ می کنند وجود دارد.اگر هر دو نسخه از یک صفحه برای موتورهای جستجو آنلاین و قابل مشاهده باشد، ممکن است مشکل محتوای تکراری را تجربه کنید.

۳. محتوای کپی شده

محتوای نه تنها شامل پست های وبلاگ و محتوای سرمقاله، بلکه صفحه های اطلاعات محصولات نیز هست. دزدیدن محتوای وبلاگ و وب سایت شما و انتشار ان بر روی سایت خودشان یکی از بارز ترین روش ها و منبع های ایجاد محتوای تکراری است، البته این مشکل بیشتر در سایت های فروشگاهی به دلیل مشابه  بودن اطلاعات محصول وجود دارد. اگر تعدادی فروشگاه یک محصول مشابه را به فروش برسانند، همه ی آن ها توضیحات مربوط به شرکت سازنده را استفاده می کنند، محتوای تکراری در چندین قسمت مختلف در سراسر اینترنت به وجود می آیند.

چگونه مشکلات محتوای تکراری را رفع کنیم

رفع مشکلات مربوط به محتوای تکراری همگی با یک ایده اصلی قابل حل هستند: مشخص کردن اینکه کدام یک محتوای تکراری «اصلی» می باشد.

هر زمان که یک محتوا می تواند در چندین URL پیدا شود، آن ها باید برای موتور جستجو، کانونی سازی شوند. برای این کار ۳ ابزار وجود دارد: استفاده از 301 redirect به سمت URL  صحیح، ویژگی rel = canonical، یا با استفاده از ابزار رسیدگی به پارامتر در کنسول جستجوی گوگل.

301 redirect

در بسیاری از موارد، بهترین راه برای مقابله با محتوای تکراری، تنظیم 301 redirect از صفحه “تکراری” به صفحه محتوای اصلی است.

هنگامی که چندین صفحه با پتانسیل رنکینگ خوب به یک صفحه متصل می شوند،  نه تنها رقبت ان ها با یکدیگر تمام می شود بلکه به طور کلی باعث ایجاد سیگنال قوی تر و محبوبیت بیشتری می شوند. این تاثیرات مثبت و رنک ها برای صفحه ی صحیح شما است.

Rel=”canonical”

گزینه دیگری برای برخورد با محتوای تکراری استفاده از ویژگی rel = canonical است. این به موتورهای جستجو می گوید که این صفحه ی داده شده باید همانند یک کپی از یک آدرس مشخص شده رفتار شود و تمام لینک ها، معیارهای محتوا و “قدرت رنکینگ” که موتورهای جستجو برای این صفحه اعمال می شود باید در واقع به URL مشخص شده منتقل شوند.

ویژگی rel = canonical قسمتی از هِد HTML صفحه وب است و مانند زیر است:

فرمت کلی:

<head>
...[کد هایی دیگری که ممکن است در مستندات هِد HTML شما باشد]...
<link href="URL OF ORIGINAL PAGE" rel="canonical" />
...[کد هایی دیگری که ممکن است در مستندات هِد HTML شما باشد]...
</head>

ویژگی rel = canonical باید به هِد HTML هر نسخه تکراری یک صفحه اضافه شود، باید قسمت «URL OF ORIGINAL PAGE» در بالا با لینک صفحه ی اصلی محتوا جایگزین شود. مطمئن باشید که علامت نقل قول ها(” “) را می نویسید. این ویژگی تقریبا همان مقدار صلاحیت لینک (قدرت رنکینگ) 301 redirect را به همراه دارد، و چون در سطح صفحه به جای سرور انجام می شود، مدت زمان کمتری را برای پیاده سازی و توسعه نیاز دارد.

در زیر می توانید نمونه ای از ویژگی canonical را در زیر مشاهده کنید:

در اینجا می توانیم ببینیم BuzzFeed از ویژگی های rel = canonical برای استفاده از پارامترهای URL استفاده می کند(در اینجا برای ردیابی کلیک استفاده شده است). اگر چه این صفحه توسط دو URL قابل دسترسی است، ویژگی rel = canonical تضمین می کند که تمام امتیازات پیوند و معیارهای محتوا به صفحه اصلی هدایت می شوند.(کمتر کسی امروزه این کار را انجام می دهد)

Noindex متا ربات ها

متا تگی که می تواند برای رسیدگی به محتوای تکراری مفید باشد، روبات های متا است، زمانی که با مقادیر “noindex، follow” استفاده می شود. به طور رایج Meta Noindex,Follow نامیده می شوند و بصورت فنی به عنوان محتوا = “noindex، follow” شناخته می شود، این تگ ها باید منحصرا به همه ی صفحه های HTML که می خواهید از ایندکس شدن آن ها توسط موتور های جستجو جلوگیری کنید، اضافه شوند.

فرمت کلی:

<head>
...[کد هایی دیگری که ممکن است در مستندات هِد HTML شما باشد]...
<meta name="robots" content="noindex,follow">
...[کد هایی دیگری که ممکن است در مستندات هِد HTML شما باشد]...
</head>

تگ های متا ربات به موتور های جستجو این امکان را می دهد که لینک های موجود در صفحه های را کراول کنند بدون اینکه ان لینک ها را در شاخص حود نگه دارند. مهم است که صفحه های تکراری نیز کراول شوند، جتی زمانی که شما به موتور های جستجو می گوید که ان ها را ایندکس نکنند، زیرا گوگل به صراحت در برابر محدود کردن دسترسی ;کراولر ها به محتوای تکراری در وب سایت شما هشدار می دهد. موتور های جستجو دوست دارند که بتوانند همه چیز را ببینند در صورتی که شما یک مشکل در کد های خود داشته باشید. این امکان به آن ها داده می شود که بصورت خودکار در مورد مسائلی که مبهم هستند قادر به قضاوت باشند.

استفاده از تگ های متا روبات راه حل مناسبی برای مسائل بخصوص محتوای تکراری هستند.

رسیدگی به پارامتر های و دامنه های مورد نظر در کنسول جستجوی گوگل

کنسول جستجوی گوگل به شما اجازه می دهد که دامنه دلخواه سایت خود را تنظیم کنید(برای مثال استفاده از http://yoursite.com به جای http://www.yoursite.com) و مشخص کنید که آیا کراولر ها باید پارامتر های URL را بصورت متفاوت کراول کنند یا نه.

بسته به ساختار URL شما و علت مشکلات مربوط به محتوای تکراری شما، تنظیم دامنه یا پارامتر مورد نظر خود را انجام دهید(یا هر دو)تا زمانی که یک راه حل به دست می اورید.

مانع اصلی استفاده از پارامتر به عنوان روش اصلی برای رسیدگی به محتوای تکراری این است که تغییراتی که شما ایجاد می کنید تنها مختص به گوگل است. تغییراتی که شما در کنسول جستجوی گوگل انجام می دهید برای موتور های جستجوی دیگر مانند بینگ اثری ندارد. شما مجبور هستید این کار را در ابزار وبمستر های موتور جستجوی دیگر نیز انجام بدید.

روش های دیگر برای مقابله با محتوای تکراری

  1. در زمان لینک دهی داخلی وب سایت ثبات خود را حفظ کنید. برای مثال، اگر یک وبمستر تعیین می کند که نصخه ی کانونی یک دامنه www.example.com استُ همه ی لینک های داخلی باید به
    http://www.example.com/example به جای
    http://example.com/page بروند(به حذف www دقت کنید)
  2. هنگامی که محتوایی را به اشتراک می گذارید، دقت کنید که همه ی بازدید های شما به URL و محتوای اصلی می رسد نه به نسخه های دیگر آن.
  3. برای اضافه کردن یک محافظ دیگر در برابر افرادی که می خواهند اعتبار و محتوای شما را بدزدند، بهتر است که لینک خود ارجاعی rel=canonical را برای محتوای خود در نظر بگیرید. این ویژگی کانونی است که به URL هایی که هم اکنون هستید اشاره می کند، نکته ای که تلاش برخی از دزد های محتوا(اسکرپرها) را خنثی می کند.

در حالی که همه اسکرپرها بر روی کد کامل HTML از منابع اصلی خود پورت نخواهند کرد، بعضی از آن ها این کار را خواهد کرد. برای آنهایی که انجام می دهند، برچسب خود ارجاعی rel=canonical این اطمینان را به سایت شما می دهد که اعتبار اصلی این محتوا را دریافت می کند.