統計データのダウンロード

説明

国内の200万サイト以上のTOPページをクロールして単語集計を行ったものとなります。 各サイトで1単語以上あれば1カウントしており、その単語が何サイトで利用されているか知ることができます。

TOPページには「皆の関心事」や「その時代の空気感」が色濃く反映されるため、本データは日本国内のWeb全体における関心の分布や傾向を俯瞰的に把握する一次情報として活用できます。

ブログ本文やニュース記事のような詳細ページではなく、あくまで各サイトの入口であるTOPページのみを対象としているため、個別の一時的な話題や文脈に引きずられにくく、「そのサイトが何を前面に出しているか」「どのようなテーマを掲げているか」が集約された形で反映されています。

集計結果は単語の出現回数ではなく「利用サイト数」を基準としているため、一部の大規模サイトや大量投稿による偏りを抑え、日本全体でどの単語がどれだけ広く使われているかを把握できる点が特徴です。 市場調査、トレンド分析、コンテンツ企画、SEOやメディア研究など、幅広い用途にご利用いただけます。

●agg_csv_1000
TOPページに出現した全単語を対象に、何サイトで使われているかを網羅的に集計した基本データです。 上位1000件のみ
●agg_csv
TOPページに出現した全単語を対象に、何サイトで使われているかを網羅的に集計した基本データです。
●agg_csv_1axis
単語ごとの利用サイト数を、サイト種別やサイトカテゴリ別に比較できる1軸分析用データです。
●agg_csv_2axis_site_category
業種ごとに、サイトタイプ内でどの単語が使われているかを詳しく分解した2軸分析データです。
●agg_csv_2axis_site_type
サイトタイプごとに、業種内でどの単語が使われているかを詳しく分解した2軸分析データです。