• About
  • Privacy Policy
  • Donate
  • Advertising: sinhmmo.net@gmail.com
  • Contact US
  • KNOWLEDGE MMO
    • Website Traffic
    • Blogging Tips
  • INVEST
    • AI Marketing
    • Insurance HYIP
    • Long-Term Project
    • Top Invest
    • Latest Scams
    • Insurance
    • Refback(RCB)
  • FREE MONEY
    • Google Adsense
    • Auto Make Money
    • Project FREE
    • Airdrop
    • CPM – Traffic Cash
    • Game NFT
  • PI NETWORK
    • Guide to KYC Pi Network
  • SHARE
    • Theme Wordpress
    • Plugin Wordpress
    • SEO Wordpress
    • Tips Wordpress
  • SOFTWARE MMO
No Result
View All Result
Sinh MMO
No Result
View All Result
Home Chia Sẽ

Mẫu file robots.txt chuẩn dành cho website WordPress

Sinh MMO Team by Sinh MMO Team
21/09/2021
in Chia Sẽ, SEO Wordpress
407 17
0
587
SHARES
3.3k
VIEWS
Share on FacebookShare on Twitter
Views: 35

Mẫu file robots.txt chuẩn dành cho website WordPress, có thể áp dụng cho tất cả các website.

Mục lục ẩn
1 File robots.txt là gì?
2 Các quy tắc cơ bản của Robots Exclusion Standard
3 Cách tạo file robots.txt trong WordPress
4 File robots.txt chuẩn cho website WordPress

Related Posts

Wordpress Auto Spinner Free- Plugin lấy bài viết tự động cho Website Wordpress

7 kỹ thuật & chiến lược SEO hiệu quả nhất vẫn hoạt động vào năm 2022

7 phương pháp để tăng tốc trang web WordPress nhanh chóng | Tối ưu hóa tốc độ WordPress

Cách làm đẹp liên kết trên WordPress với Thirsty Affiliates (che dấu link tiếp thị liên kết)

Nếu các bạn chưa biết thì robots.txt là một trong những file có vai trò rất quan trọng đối với việc SEO website. Nó không những quy định cách thức các công cụ tìm kiếm có thể thu thập và lập chỉ mục trên website mà còn có thể ảnh hưởng tới khả năng hiển thị của website (tính thân thiện với thiết bị di động) khi Google Bots truy xuất dữ liệu. Do đó, có một file robots.txt chuẩn là bước đầu tiên mà các bạn cần làm khi tối ưu website cho các công cụ tìm kiếm.

File robots.txt là gì?

Robots Exclusion Standard được phát triển từ năm 1994, nhằm giúp các webmaster có thể “tư vấn” cho các công cụ tìm kiếm cách thu thập thông tin từ website của họ. Nó hoạt động theo cách tương tự như các robot meta tag. Điểm khác biệt chính giữa chúng là các file robots.txt sẽ ngăn cản việc công cụ tìm kiếm truy cập vào một trang hoặc thư mục, trong khi các robot meta tag chỉ kiểm soát việc lúc nào thì trang hoặc thư mục đó được lập chỉ mục (index).

Đặt một file robots.txt trong thư mục gốc của tên miền cho phép bạn ngăn chặn công cụ tìm kiếm lập chỉ mục các tập tin và thư mục nhạy cảm. Ví dụ, bạn có thể ngăn chặn một công cụ tìm kiếm thu thập dữ liệu từ thư mục hình ảnh của bạn hoặc lập chỉ mục một tập tin PDF nằm trong một thư mục bí mật.

Các công cụ tìm kiếm lớn sẽ thực hiện theo các quy tắc mà bạn thiết lập. Tuy nhiên, không phải lúc nào các quy tắc mà bạn xác định trong tập tin robots.txt cũng được thi hành. Trình thu thập dữ liệu của các phần mềm độc hại và các công cụ tìm kiếm nhỏ có thể không tuân thủ các quy tắc và index bất cứ điều gì họ muốn. Rất may, các công cụ tìm kiếm lớn hoạt động theo các tiêu chuẩn này, bao gồm cả Google, Bing, Yandex, Ask và Baidu.

Các bạn có thể tham khảo thêm tài liệu về file robots.txt do chính Google cung cấp tại đây.

Các quy tắc cơ bản của Robots Exclusion Standard

Không mất quá nhiều thời gian để có được một sự hiểu biết đầy đủ về Robots Exclusion Standard. Chỉ có một vài quy tắc mà bạn cần phải tìm hiểu. Những quy tắc này thường được gọi là “chỉ thị”.

Ba chỉ thị chính của Robots Exclusion Standard là:

  • User-agent: xác định các công cụ tìm kiếm mà quy tắc được áp dụng.
  • Disallow: ngăn cản các công cụ tìm kiếm thu thập thông tin và lập chỉ mục.
  • Allow: cho phép các công cụ tìm kiếm thu thập thông tin và lập chỉ mục.

Dấu hoa thị (*) có thể được sử dụng như một ký tự đại diện cho tất cả các công cụ tìm kiếm. Ví dụ, bạn có thể thêm dòng sau vào file robots.txt để ngăn chặn các công cụ tìm kiếm thu thập thông tin trên toàn bộ website của bạn.

User-agent: *
Disallow: /

Các chỉ thị trên là hữu ích nếu bạn đang phát triển một website mới và không muốn các công cụ tìm kiếm lập chỉ mục khi nó chưa được hoàn thiện.

Một số website sử dụng chỉ thị Disallow mà không có dấu gạch chéo (/) để biểu thị một trang web có thể được thu thập dữ liệu. Điều này cho phép các công cụ tìm kiếm có đầy đủ quyền truy cập vào toàn bộ website của bạn.

User-agent: *
Disallow:

Để ngăn chặn việc thu thập dữ liệu với các thư mục hoặc đường dẫn cụ thể, bạn chỉ cần thêm đường dẫn hoặc tên thư mục vào sau chữ Disallow . Trong ví dụ dưới đây, tôi đã quy định các công cụ tìm kiếm không được phép thu thập thông tin của thư mục /images/ và toàn bộ các tập tin cũng như thư mục con chứa trong nó:

User-agent: *
Disallow: /images/

Điều này có được là do robots.txt sử dụng đường dẫn tương đối, không sử dụng đường dẫn tuyệt đối. Các dấu gạch chéo (/) thay thế cho thư mục gốc của tên miền và do đó áp dụng quy tắc cho toàn bộ website của bạn. Đường dẫn là trường hợp nhạy cảm, vì vậy hãy chắc chắn sử dụng đúng trường hợp khi xác định các tập tin, các trang và thư mục.

Cách tạo file robots.txt trong WordPress

Tạo file robots.txt bằng phương pháp thủ công

Một tập tin robots.txt có thể được tạo ra trong vài giây. Tất cả những gì bạn phải làm là mở một trình soạn thảo văn bản (NotePad hoặc NotePad++) và lưu một tập tin trống với tên “robots.txt”.

Sau khi thêm một số quy tắc vào tập tin, hãy lưu nó lại và upload lên thư mục gốc của tên miền, tức là tại địa chỉ https://yourwebsite.com/robots.txt. Hãy đảm bảo bạn đã upload tập tin robots.txt vào thư mục gốc của tên miền, ngay cả khi WordPress được cài đặt trong một thư mục con.

File robots.txt chuẩn cho website WordPress

Đây là một trong những mẫu file robots.txt chuẩn nhất, tối ưu nhất, được nhiều blogger WordPress nổi tiếng tin dùng. Bạn cũng có thể sử dụng nó cho website WordPress của mình. Tuy nhiên, hãy nhớ tùy biến nó cho phù hợp với từng hoàn cảnh cụ thể.

User-agent: *
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /license.txt
Disallow: /?s=*
Allow: /wp-admin/admin-ajax.php
Allow: /wp-admin/images/*
Sitemap: https://sinhmmo.net/sitemap_index.xml

Lưu ý:

  • Thay https://sinhmmo.net/sitemap_index.xml bằng đường link đến XML sitemap của bạn.
  • Không nên chặn Google và các công cụ tìm kiếm khác thu thập dữ liệu trong các thư mục /wp-content/themes/ và /wp-content/plugins/. Điều đó sẽ cản trở việc Google có một cái nhìn chính xác nhất về giao diện website của bạn. Ngoài ra, nó cũng có thể gây ra lỗi website không thân thiện với thiết bị di động.

Bạn đang sử dụng mẫu file robots.txt nào cho website WordPress của mình? Theo bạn, mẫu file robots.txt đó có thực sự tối ưu hay không? Hãy chia sẻ nó với chúng tôi thông qua khung bình luận bên dưới.

Nếu bạn thích bài viết này, hãy theo dõi blog của tôi để thường xuyên cập nhật những bài viết hay nhất, mới nhất nhé. Cảm ơn rất nhiều.

Share235Tweet147Pin53
Sinh MMO Team

Sinh MMO Team

Sinh MMO là blog chia sẻ kiến thức, kĩ năng kiếm tiền online (MMO) & Digital Marketing: Affiliate Marketing, Google Adsense, Youtube, WordPress, SEO,... Cách để bạn có thể kiếm tiền, tạo thu nhập thụ động từ Internet.

0 0 đánh giá
Article Rating
Theo dõi
Đăng nhập
Thông báo của
guest
guest
0 Comments
Phản hồi nội tuyến
Xem tất cả bình luận

Bài Viết Mới Nhất

Pi Network

Pi Network công bố lộ trình Mainnet vào giữa tháng 10

by Sinh MMO Team
21/09/2023
0

Ra mắt Mainnet là sự kiện quan trọng nhất trong quá trình phát triển của bất kỳ dự án tiền...

Read more

Pi Network công bố lộ trình Mainnet vào giữa tháng 10

Pi Coin tích hợp với Tiêu chuẩn 20022 và có thể chuyển đổi sang Tiền tệ Fiat

Vai trò quan trọng của các Node xác minh trong tương lai của Ice Network

Pi Coin xếp thứ nhất trước khi ra mắt Mainnet mở

Nicolas Kokkalis công bố ngày phát hành Pi Network V1 vào giữa tháng 10

Pi Network – Việc ra mắt Mainnet mở sẽ diễn ra sau khi di chuyển 10-20 tỷ Pi Coin

Load More

Bài Viết Quan Tâm

Top 7 App treo máy kiếm tiền uy tín nhất – Kiếm tiền tự động

by Sinh MMO Team
11/09/2022
0

Treo máy kiếm tiền tự động với Getgrass – Kiếm thu nhập thụ động $900/năm

by Sinh MMO Team
02/09/2023
0

Khám phá cơ hội khai thác ICE Network – Giá 100$ cho 1 đồng ICE

by Sinh MMO Team
22/08/2023
0

Treo máy kiếm tiền tự động với Earnapp

by Sinh MMO Team
01/05/2022
1

Pi Network công bố lộ trình Mainnet vào giữa tháng 10

by Sinh MMO Team
21/09/2023
0

Sinh MMO

© 2021 Sinh MMO | Blog MMO | Make Money Online.

Navigate Site

  • About
  • Privacy Policy
  • Donate
  • Advertising: sinhmmo.net@gmail.com
  • Contact US

Follow Us

No Result
View All Result
  • KNOWLEDGE MMO
    • Website Traffic
    • Blogging Tips
  • INVEST
    • AI Marketing
    • Insurance HYIP
    • Long-Term Project
    • Top Invest
    • Latest Scams
    • Insurance
    • Refback(RCB)
  • FREE MONEY
    • Google Adsense
    • Auto Make Money
    • Project FREE
    • Airdrop
    • CPM – Traffic Cash
    • Game NFT
  • PI NETWORK
    • Guide to KYC Pi Network
  • SHARE
    • Theme Wordpress
    • Plugin Wordpress
    • SEO Wordpress
    • Tips Wordpress
  • SOFTWARE MMO

© 2021 Sinh MMO | Blog MMO | Make Money Online.

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms below to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In
wpDiscuz
Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?