Powered by Blogger.
RSS

URL structure : Hyphens or underscores URLs revisited



Trik SEO : Pilih Underscore (_) atau Hyphen (-)

Hampir semua ahli SEO merekomendasikan penggunaan tanda hubung (Hyphens-atau-dashes) dalam URL atau in-pages-URL daripada penggunaan garis bawah (underscores). Ann Smarty over at Search-Engine-Journal mengatakan bahwa kerugian penggunaan garis bawah (_) adalah :
  • Traditionally it isn’t seen by search engines as a word separator (this is slowly changing now)
Pada review situs oleh www.woorank.com untuk blog ini, WOORANK memberi advis :
  • We have detected underscores (these_are_underscores) in this URL and/or in your in-page URLs. You should rather use hyphens (these-are-hyphens) to optimize your SEO. While Google™ treats hyphens as word separators, it does not treat underscores as word separators.
Website Review for website download blog

Prinsipnya adalah seperti yang dianjurkan oleh Matt Cutts (juru bicara Google) berikut ini :
Saran ini rasional. MENGAPA?  Struktur URL website (blog) harus sesederhana mungkin. Pertimbangkan mengatur konten Anda sehingga URL dibangun secara logis dan dengan cara paling dapat dimengerti oleh manusia (bila memungkinkan, PILIH kata-kata yang mudah dibaca daripada nomor ID yang panjang).

Misalnya Anda mencari informasi penerbangan. Anda temukan URL ini http://en.wikipedia.org/wiki/Aviation akan lebih membantu memutuskan apakah Anda akan mengklik link tersebut. Sebaliknya URL seperti ini
http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, tidaklah menarik untuk di-klik karena Anda tidak tahu informasi spesifik apa yang ada di dalamnya.

Pertimbangkan menggunakan tanda baca (punctuation) berupa hyphens atau dashes (-) pada nama URL.

Nama URL http://www.example.com/green-dress.html jauh lebih berguna bagi kita daripada URL ini http://www.example.com/greendress.html. Kami sarankan menggunakan tanda hubung (-) bukan garis bawah (_) untuk nama URL.

Nama URL yang terlalu rumit, terutama yang mengandung beberapa parameter, dapat menyebabkan masalah pada CRAWLER (robot) mesin pencari, dapat menyebabkan URL mengarah ke konten yang identik atau serupa di situs Anda. Dan ini sangat tidak disukai oleh mesin pencari Google, karena akan mengakibatkan Googlebot memakan bandwidth lebih besar dari yang diperlukan, atau mungkin tidak dapat mengindeks semua konten di situs Anda.

Jika Anda punya link-link yang digaris-bawahi, maka mereka sering disalahartikan. Misalnya, sebuah blog berisi link yang sengaja diberi underscore dan diposting di suatu forum. Link tersebut kemungkinan besar akan digarisbawahi karena disesuaikan dengan default styling CSS. Sekarang ketika seseorang melihat link tersebut, mereka tidak mampu membedakan keduanya. Karena underscore yang sengaja dibuat telah berbaur dengan styling underscore sebagai akibat default styling CSS pada link.

Perhatikan link : http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1, (yang sengaja ditambahi garisbawah (_) dan sangat rancu sebagai link setelah diposting di suatu forum).
Lalu apa penyebab masalah yang timbul akibat adanya Underscore (_)?

Berikut ini jawaban yang saya kutip dari referensi Google Webmaster Tools :   


Common causes of Underscores Problem

Unnecessarily high numbers of URLs can be caused by a number of issues. These include :

  • Additive filtering of a set of items Many sites provide different views of the same set of items or search results, often allowing the user to filter this set using defined criteria (for example: show me hotels on the beach). When filters can be combined in a additive manner (for example: hotels on the beach and with a fitness center), the number of URLs (views of data) in the sites explodes. Creating a large number of slightly different lists of hotels is redundant, because Googlebot needs to see only a small number of lists from which it can reach the page for each hotel. For example:
    • Hotel properties at "value rates": http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • Hotel properties at "value rates" on the beach: http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • Hotel properties at "value rates" on the beach and with a fitness center: http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • Dynamic generation of documents. This can result in small changes because of counters, timestamps, or advertisements.
  • Problematic parameters in the URL. Session IDs, for example, can create massive amounts of duplication and a greater number of URLs.
  • Sorting parameters. Some large shopping sites provide multiple ways to sort the same items, resulting in a much greater number of URLs. For example: http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance &search_category=25
  • Irrelevant parameters in the URL, such as referral parameters. For example: http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage= OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • Calendar issues. A dynamically generated calendar might generate links to future and previous dates with no restrictions on start of end dates. For example: http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • Broken relative links. Broken relative links can often cause infinite spaces. Frequently, this problem arises because of repeated path elements. For example: http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/ category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm

Steps to resolve this problem

To avoid potential problems with URL structure, we recommend the following:
  • Consider using a robots.txt file to block Googlebot's access to problematic URLs. Typically, you should consider blocking dynamic URLs, such as URLs that generate search results, or URLs that can create infinite spaces, such as calendars. Using regular expressions in your robots.txt file can allow you to easily block large numbers of URLs.
  • Wherever possible, avoid the use of session IDs in URLs. Consider using cookies instead. Check our Webmaster Guidelines for additional information.
  • Whenever possible, shorten URLs by trimming unnecessary parameters.
  • If your site has an infinite calendar, add a nofollow attribute to links to dynamically created future calendar pages.
  • Check your site for broken relative links.

[Source]

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

0 comments:

Post a Comment