ブログランキング・にほんブログ村へ
ポチッと応援願います
初めての方はこちらへ 

投稿日 2019年7月16日火曜日

W3Cリンクチェッカー、お試し

業務外


Google AdSenseを復活させ、井戸掘りブログへの広告の再掲載を試みています。そのためには記事内のデットリンク(リンク切れ)の見直しが必要です。記事の投稿数が600件を超えているので、人力では無理!!

Google先生に聞いてみましょう。

最初にヒットしたのが、W3Cリンクチェッカーです。代表的なツールで無料、かつインストール不要でオンラインでチェックできます。これを試してみましょう。


対象はデットリンクを確認済みの井戸掘り参考ブログのページです。モバイルバージョンで試してみます。URLを指定して実行します。

248.14秒

1ページで4分強、結構時間が掛かります。ログを見ると井戸掘りダイジェストや、ブログアーカイブのリンクを何十、何百とチェックしています。ガジェット部分のリンクですね。これは無駄。
いったんモバイルバージョンで、これらのガジェットを非表示にしてみます。テーマでHTMLを編集して、以下のガジェットに mobile=′no′ を設定します。

  • 自己紹介
  • ブログ検索
  • コンテンツ
  • ラベル
  • ブログアーカイブ
  • 人気の記事

再実行すると、今度は1/3の時間になりました。リンクチェックするサーバに負荷を掛けないように、各リンクチェックは1秒間隔で実行しているようです。

86.87秒

1分半弱、まーこれでいくか。
以下がリンクチェックの結果のサマリー版です。エラーは15箇所。
サマリーの下に各エラーの詳細が表示されていますが、省略。

CodeOccurr-
ences
What to do
(N/A)6The link was not checked due to robots exclusion rules. Check the link manually, and see also the link checker documentation on robots exclusion.
(N/A)2Accessing links with this URI scheme has been disabled in link checker.
4041The link is broken. Double-check that you have not made any typo, or mistake in copy-pasting. If the link points to a resource that no longer exists, you may want to remove or fix the link.
4051The server does not allow HTTP HEAD requests, which prevents the Link Checker to check the link automatically. Check the link manually.
5005This is a server side problem. Check the URI.

各エラーの詳細をChromeのデベロッパーツールで確認していきます。デベロッパーツールの使い方を覚えて良かった。

1行目の6件『The link was not checked due to…』は
検索ロボットの除外ルールにより、リンクはチェックされなかったとのこと。
Bloggerにログインしてブログのソースをデバッグすると、クイック編集の箇所です。Blogger内部の問題なので無視して良いはず。

2行目の2件『Accessing links with this URI…』は、URLへのアクセスが無効になっているとのこと。
これもBlogger内部の問題なので無視します。

Code404はNot Found、ページが見付からないとのこと。
問題の箇所はブログサービス『Yahoo!ジオシティーズ』の終了で、Sorry Pageが表示されていました。これは修正要です。

Code405はMethod Not Allowed、自動でチェックできないから手動でリンクを確認せよとのこと。
dynamic CSSへのリンクです。アクセスするとCSSは存在するようですが実体は空みたい、良く判らん。これもBlogger内部の問題なので無視します。

Code500はInternal Server Error、6件ありましたがこのURLが見つからず、本当のデットリンクでした。これも修正要です。

エラーではありませんが、3件のリダイレクトを検出していました。2件はhttpからhttpsへのリダイレクト。1件は日本ブログ村の画像でした。これも修正しておきましょう。


試してみましたが、W3Cリンクチェッカーは使えます。
外部リンクにはrel="nofollow" を指定してあります。これはロボット検索への禁止指示ですが、このリンクもチェックしてくれます。
また一番気になっていたブログサービスの終了ですが、告知ページへリダイレクトしているのも、デットリンクとして認識してくれます。


感想と構想


ツールは見つけましたが、実際の井戸掘りブログのチェックはどうやってやりますかね。
1ページずつツールに指定するのは馬鹿らしい。ツールのオプションで
リンクの階層を指定できます。最新記事から600階層強を掘れば全記事のチェックができますが、膨大なリンク数になって現実的でないです。
はてさて…。



W3Cリンクチェッカーの使い方は、以下の記事を参考にさせていただきました。
リンク切れやHTMLなどのクオリティ自動チェックツール8選


0 件のコメント:

コメントを投稿

注目の投稿

2020年、明けましておめでとうございます

井戸報告 2020年となりました。明けましておめでとうございます。 今年は雲が多くて初日の出は無理。辛うじて層間の隙間からお顔を見せてくれました。陽光の煌きは僅か3分ほどでした。 2020年、日の出が始まりました 雲の層間に一瞬煌めく初日の出です。 ...

人気の投稿

︿
blogisMobileRequest=false, blog.local=ja がんばれ日本!!