ブログ記事一覧(月別)Archives (Every month)

April 2010 のブログ記事を表示しています。

Nucleus用 robots.txt テンプレ

毎回、正しいかどうかチェックするのがめんどうなのでテンプレ

ファイル名:robots.txt
半角小文字がルール。違うと読まれないらしい。

Sitemap: http://luvsic.net/sitemap.xml

User-agent: *
Disallow: /action.php?*
Disallow: /index.php?*

User-agent: Googlebot
Noindex: /action.php?*
Noindex: /index.php?*

1行目「Sitemap~」は、そのサイトのサイトマップを認識させる。
Sitemaps.org形式のXMLサイトマップ形式であること。

3・4行目「User-agent: *」の部分はすべてのクローラに対して行う指定。
Nucleusの初期ファイルでは「/action.php?*」のみがDisallowとなっている。
URL系(NP_customUrlやfancyurls-2等)の実装時のみ、上記サンプルのように「index.php?*」もDisallowするといい。

6・7行目「User-agent: Googlebot」は、グーグルのクローラにのみ対して行う指定。

  • Disallow・・・アクセスを禁止する
    (他サイトからリンクを張られたりするとインデックスする可能性有)
  • Noindex・・・インデックスを禁止する

Noindexは今日現在、Googleしか対応していない。
よってrobots.txtではUser-agentを個別指定で行う。

robots.txt 番外編

ウェブ魚拓を拒否する

User-agent: Megalodon
Disallow: /

インターネットアーカイブを拒否する

User-agent: ia_archiver
Disallow: /

Cacoo(カクー) が便利かも・・・!

Cacoo お試し

techcrunchで紹介されていた日本発のCacooは複数ユーザーがリアルタイムで協調しながらデザイン作業ができるすぐれものという記事をみて、そのCacooというサービスが気になって。

「Cacoo(カクー)はWeb上で簡単にサイトマップやワイアーフレーム、UML、ネットワーク図などの図が作成できるドローツールです。ご利用は無料です。」とのこと。さっそく使ってみた


[ 続きを読む ]
© 2006 – 2012 by Luvsic. Some rights reserved.