(むさんあん)、思考が無く.躰が無く.心が無く

トキメキ団塊親父のセカンド・ステージ.退職爺のボケ封じ

ネットのクローラ.学

livedoorブログからFC2ブログに引越しして以来、以前のlivedoorでは寄り付かなかったボット(Botクローラインターネットボット)が来ていることを知るようになった。いずれにも同じアクセス解析を仕込んでいたのだから、探知する機能に変わりは無いはずである。となれば、livedoorではボットが襲来している事をユーザーが知る以前に遮断していたのだろうか。あるいは、livedoorの記事はボットの餌として嫌われていたのだろうか...とも思うが、同じ餌(記事)なのだからそれはあるまい。
理由は兎も角として、FC2ブログではボットの周回サイクルが短いようだ。

21/01/01に引越しして以来「googlebot.com・search.msn.com・search.line-apps.com」の巡回を確認したが、先日から「ap-northeast-1.compute.amazonaws.com」なる物が来始めた。
ボットが回遊する事について是非論があるらしいが、俺的にはサッパリわからない。
ボットにより、サーバーの処理能力がダウンするとかしないとかも聞くが...

いずれにしても、招かざる客は寄り付かないようにした方が望ましかろうと考えた。
ググってみたら、FC2ブログに限定した記事としてもヒットする。また、AMAZONAWS.COMに関する情報も散見できた。
<<巷の参考記事>>

<<FC5ホームページ>>

このボットなる物の行為を無断リンクに近いとして扱うか、それとも無視しておくか。

21/01/09、俺の利用しているIPアドレスが変わった事に気が付いた。

*.googlebot.com
*.search.msn.com
*.search.line-apps.com
*.compute.amazonaws.com
*support.embed.ly
Cincraw Crawler http://cincrawdata.net/bot/
*.ap-northeast-1.compute.amazonaws.com
*.googleusercontent.com
google-proxy-*
*.google.com
.bc.googleusercontent.comはスパム?アクセス禁止方法を解説 | PHPラボ
Googlebot かどうかの確認 | Google 検索セントラル  |  Google Developers
サイトにアクセスしてきたクローラー・botの情報まとめ – Cosmos and Chaos
*.msd.spmode.ne.jp
spモード (sp49-98-133-248.msd.spmode.ne.jp) 49.98.133.248

※21/05/11夕、botのアクセスを感知するように変更する。
※21/05/12夕、前記変更を取り止め、

ICC-Crawler - ユニバーサルコミュニケーション研究所
BingPreview
Googlebot
support.embed.ly
googlebot.com
Googlebot-Image
oBot
HubSpot Crawler
bot

bc.googleusercontent.com
困ったものだ!bc.googleusercontent.com - ムーングレイ/moongray
.bc.googleusercontent.comはスパム?アクセス禁止方法を解説 | PHPラボ
皆声.jp クローラー
122x221x26x236.ap122.ftth.ucom.ne.jp[122.221.26.236] Mozilla/4.0 (compatible; RSSCrawler/1.00; ja; http://minakoe.jp/)

Google Developers Japan: Chrome の User-Agent 文字列削減のオリジン トライアルと今後の計画について(21/09/22)
GooglebotのIPアドレス一覧をGoogleが公開 | 海外SEO情報ブログ(21/11/12)
過去記事:ネットアクセス識別メモ / IPアドレス履歴 / API キー控え /

Bingbotとは - Visitor Analytics
Bingは5つの主要なクローラーを操作します。
  • Bingbot。サイトのクロールとインデックス作成を担当する標準のクローラー
  • MSNBot。Bingbotの前は標準のクローラー
  • MSNBot-メディアBing検索エンジンのクロールされたサイト全体で画像とビデオを処理するクローラー。
  • AdIdxBot。Bing Adsが広告をクロールし、品質管理の目的でそれらの広告からリンクされたWebサイトにフォロースルーするために使用するクローラー
  • BingPreview。ページスナップショットの生成に使用されるクローラー

Google クローラの概要(ユーザー エージェント)  |  Google Developers


URL: https://www.visitor-analytics.io/ja/%E7%94%A8%E8%AA%9E%E9%9B%86/b/%E3%83%93%E3%83%B3%E3%82%B0%E3%83%9C%E3%83%83%E3%83%88/ © Visitor Analytics

Windows 10弄りメモ

23/01/08追記

Bingbotとは - Visitor Analytics
User Agent暗号プロトコル辞典 [Microsoft Bing] - Apache 2.4系でHTTP/2対応サーバを構築してみるテスト。
クローラ巡回拒否対策&検証方法 - Qiita
検索エンジンクローラ一覧(2022年8月時点) - SEMリサーチ/

【2023 年】主要ウェブクローラー11選(+SEOツールのクローラー)(23/02/16)
検索エンジンクローラ一覧(2022年8月時点) - SEMリサーチ

過去記事:本FC2ブログ改装録.新 / ネットのクローラ.学 / 「Firefox」のUA文字列

23/10/01、Applebotの巡回を確認


もしかして

googleusercontent.comとは

関連記事:ネットのクローラ.学 / robots.txt:学 / Applebotの巡回を確認 / ChromeのUA文字列.学 / 生成AIは、対手を知る / ユーザーエージェント / Cookieブロック始まる
関連記事
[Tag] * パソコン * HP作成
最終更新日時 :

コメント

こちらに失礼致します

記事に関係ないのですが、こちらにコメントをさせて頂きます。

>復活する場合は改めて御願いいたしたいと思いますので、その節はよろしくお願いします。
…はい、必要になりましたらお使い下さい。

追記に有りました記事コメントは下記です。
https://sorauta1.blog.fc2.com/blog-entry-284.html#comment2467
それに対して私が「全文表示カスタマイズ後のものには難しい」と返信致しました。
ご確認下さいませ。m(__)m

話は違いますが、そちらの降雪は大丈夫ですか?
2005~2006年の「平成18年豪雪」時に福井市に住んでおり、その際の北陸道でのホワイトアウト現象でとても運転が怖かった覚えが有ります。
頭上(落雪)も足元(転倒)も気を付けてお過ごし下さい。
2021-01-11 02:16
aki https://sorauta1.blog.fc2.com/URL
[ 返信 * 編集 ]

呑兵衛あな

Re: aki 様へ

>ご確認下さいませ。
やはり、その件でしたか。判りました。
その節は御相談しますので、よろしくお願いします。

御心配いただき、ありがとうございます。
石川県は不思議に両隣りの件よりも雪が少ないというのが、10年ほど住んでみた感想です。
石川県の中でも金沢は比較的少なく、当地野々市市は更に少ないと観ています。これは、山並みが影響しているのだろうと思うのですが。
いずれにしても、9-10日は各15cm程度積もりましたが、今朝は掃いた程度に白くなってる状況です。
今日からゼロ℃を抜けるようですから、溶けるかな..と期待しています
2021-01-11 08:52
呑兵衛あな https://nono634.blog.fc2.com/URL
[ 返信 * 編集 ]




トラックバック