فایل robots txt چست؟ چه تاثیر بر روی سئو دارد؟ با دستورات و نحوه ساخت- پارس‌پک-جان مولر


برای مثال اگر نمی‌خواهید موتورهای جستجو، تصاویر وب‌سایت‌تان را ایندکس کنند، می‌توانید تمام تصاویر سایت را درون یک پوشه در هاستینگ خود قرار دهید و از دسترس موتورهای جستجو خارج سازید. از آن جایی که فایل Robot.txt یک فایل متنی ساده است، ایجاد کردن آن کار دشواری نیست؛ برای انجام این کار نیاز به یک ویرایشگر متن ساده مانند Notepad دارید. در این ویرایشگر صفحه ای را باز کنید و یک برگه خالی را با نام robots.txt ذخیره کنید؛ سپس وارد cPanel شوید و بعد public_html را برای دسترسی به دایرکتوری روت سایت، باز کنید.

  • برای استفاده از نرم افزاروکلاهرچیزی که میخوام استفاده کنم اول پشتیبانیش رومیسنجم.پشتیبانی نرم افزارکاربرمجازی واقعابه موقع وسریع…
  • برای اینکار کافیست در هدر صفحه مورد نظر به صورت زیر عمل کنید.
  • به این معنی که اگر شما به ریشه هاست سایت خودتان مراجعه کنید فایلی تحت عنوان robots.txt را پیدا نخواهید کرد.
  • چرا؟ ربات خزنده موتور جستجوی گوگل (همان Googlebot خودمان!) دارای ویژگی به نام Crawl Budget است.
  • به طور کلی شما می توانید به دو روش نقشه سایتتان را به گوگل معرفی کنید؛ برای این کار می توانید از سرچ کنسول یا فایل robots.txt استفاده کنید.

طبق ماده 12 فصل سوم قانون جرائم رایانه ای هر گونه کپی برداری به هر نحو از محتوای سایت ، توسط تیم یاس وب پیگیرد قانونی دارد. تا‌به‌حال به این فکر کرده‌اید که مطالب قدیمی و بی‌کیفیت وب‌سایت‌تان که به ظاهر هیچ ارزش سئویی ندارد و گوگل هیچ اعتباری برای آن قائل نیست، می‌تواند به رنکینگ سایت‌ شما صدمه بزند؟! این نوشته را بخوانید تا ببینید با این‌گونه نوشته‌ چه باید کرد. خود را بررسی و تست کنید تا مطمئن شوید بخش مهمی از سایت شما از طریق آن مسدود نشده باشد.

چند نکته که اگر به آن‌ها توجه نکنید خرابکاری می‌کنید!

نردبان قصد دارد به شکلی حرفه‌ای، جایگاه مشتری را در فضای وب دگرگون کند. می‌خواهیم با طراحی وب‌سایت‌های کاربرپسند، تولید محتوای مفید و خدمات سئو حرفه‌ای به فضای وب فارسی خدمتی کرده باشیم. امیدواریم این نگاه حرفه‌ای به رقابتی سالم دامن بزند که در نهایت به پیشرفت وب فارسی منجر شود.

شروع ماجراجویی در وب

این اطلاعات به وبسایت‌ها کمک می‌کند اطلاعات سازگار با سیستم کاربر را نمایش دهند. تصویر زیر فایل robots.txt سایت یوتیوب به عنوان نمونه نمایش داده شده‌است. معمولا موتورهای جستجو محتویات فایل robotx.txt را ذخیره می‌کنند تا به دانلود مجدد آن نیاز نداشته باشند، با این حال روزانه چندبار نسخه جدید فایل را بارگذاری می‌کنند. پس انعکاس تغییرات اعمال شده در فایل Robots.txt زمان زیادی نخواهد برد و سریعا اعمال می‌شود. دقت کنید که دستور disallow باید در خط بعد از user-agent قرار بگیرد. این یعنی در ابتدا باید ربات های مورد نظر را فراخوانی کنید سپس به آنها دستور ایندکس کردن یا نکردن صفحات را بدهید.

به عنوان نکته بعدی کاملا توجه داشته باشین که مراحل اولیه بهتره تعداد سرچ روزانتون رو خورد خورد افزایش بدین و به گوگل شک وارد نکنید. مثلا اگر شما در صفه ای از سایتتون روزانه یک سرچ هم نداشتین یک دفعه اون از رو صفر به ده یا بیست تا نرسونین. اول با روزی سه الی چهارتا سرچ شروع بکنید و بعد از دو روز بکنیدش هفت تا یا هشت تا حالا همینطور خورد خورد تعدادش رو افزایش بدین تا گوگل شک نکنه. در نهایت همینطور که سئو سایتتون رشد میکنه کلمات کلیدی بهتر و قوی تری مد نظر قرار بدین و تعداد جست و جو های روزانه رو بیشتر بکنید. یکی دیگر روش‌های ویرایش فایل robots.txt به صورت دستی می‌باشد که می‌توانید از طریق سی پنل هاست و یا FTP به هاست خود متصل شده و فایل را ویرایش و سفارشی‌سازی کنید.

در این مقاله به 9 نکته مهم و ابتدایی سئو برای کسب رتبه عالی در گوگل اشاره می کنیم. همانطور که همه‌ی ما می‌دانیم، ربات‌های موتورهای جستجو پررنگ‌ترین نقش ممکن برای معرفی کامل یک سایت به موتورهای جستجو را ایفا می‌کنند. گوگل به عنوان بزرگترین مرجع و گسترده‌ترین شبکه در این زمینه، ربات‌های اختصاصی و عمومی زیادی گسترش داده است.

پس از ورود به هاست، می توانید فایل robots.txt را در پوشه اصلی وب سایت خود یا public_html پیدا کنید. چنانچه فایلی با این عنوان مشاهده نکردید مطابق تصویر زیر می-توانید با کلیک راست بر روی گزینه Create new file کلیک کرده و نام robots.txt را برای آن انتخاب کنید. با لیست کردن برخی صفحات خاص و استفاده از Disallow‌ در حقیقت شما به ربات‌های مخرب و هکرها می‌گویید که این صفحات سایت مهم هستند و نباید به آن‌ها دسترسی پیدا کنید و آن‌ها به راحتی این صفحات را پیدا می‌کنند. اما اگر مسیرها و دایرکتوری‌ها را دیس‌آلو کنید این ربات‌ها صرفا می‌توانند صفحه‌ی دایرکتوری را ببینند و امکان دیدن سایر صفحات و وب‌پیج‌ها وجود ندارد.

همونطور که در ابتدای صفحه گفتیمنرم افزار ما با استفاده از ماوس و کیبورد واقعی بجای استفاده از دستورات برنامه نویسی جست وجو و کلیک روی سایت شمارو توی گوگل انجام میدهد. در تصویر بالا گوگل اعلام می کند که چنین صفحه ای وجود دارد، اما اطلاعات آن از دید گوگل قابل مشاهده نیست، چرا که جلوی دسترسی به آن گرفته شده است. برای جلوگیری از چنین مشکلی ابتدا بایست صفحات مورد نظر را با استفاده از متا robots نوایندکس نمود و پس از خارج شدن آن صفحات از ایندکس گوگل، اقدام به بلاک نمودن آدرس ها کرد.