データセット(Datasets)の構造化データをマークアップする方法

データセット(Datasets)の構造化データをマークアップする方法

Photo by Igor Ovsyannykov via Unsplash

データセット(Datasets)の構造化データをマークアップする方法を紹介します。

データセット(Datasets)は、科学的なデータや統計データなど、Web上に存在する様々なデータのことです。

データセットには有用なものが多数ありますが、検索エンジンはそれらのデータを正確に理解できるとは限りません。

そこで、それらのデータをデータセット(Datasets)としてマークアップすることで、検索エンジンがより正確に情報を理解する助けになります。

データセットには次のようなものが存在します。

  • データを含む表、またはCSVファイル
  • データを含む独自の形式のファイル
  • 複数のファイルが合わさることで意味を持つデータファイルのセット
  • 特別なツールでの処理に使用するためのデータ
  • データのキャプチャ画像
  • その他のあらゆるデータセット

JSON-LDでマークアップ

データセット(Datasets)の構造化データをJSON-LDでマークアップする方法です。JSON-LDはページのどこに記述しても問題ありませんが、通常は<head>タグ内に記述します。

<script type="application/ld+json">
{
  "@context":"http://schema.org/",
  "@type":"Dataset",
  "name":"NCDC Storm Events Database",
  "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
  "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
  "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
  "keywords":[
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
  ],
  "creator":{
     "@type":"Organization",
     "url": "https://www.ncei.noaa.gov/",
     "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
     "contactPoint":{
        "@type":"ContactPoint",
        "contactType": "customer service",
        "telephone":"+1-828-271-4800",
        "email":"[email protected]"
     }
  },
  "includedInDataCatalog":{
     "@type":"DataCatalog",
     "name":"data.gov"
  },
  "distribution":[
     {
        "@type":"DataDownload",
        "encodingFormat":"CSV",
        "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
     },
     {
        "@type":"DataDownload",
        "encodingFormat":"XML",
        "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
     }
  ],
  "temporalCoverage":"1950-01-01/2013-12-18",
  "spatialCoverage":{
     "@type":"Place",
     "geo":{
        "@type":"GeoShape",
        "box":"18.0 -65.0 72.0 172.0"
     }
  }
}
</script>

属性の解説

データセット(Datasets)の構造化データの属性は次のようになります。

基本的な属性

基本的な属性です。

属性 説明
name データセットの名前
description データセットの短い説明
url データセットを掲載しているページのURL
sameAs データセットにあくせすするために使われるその他のページのURL
version データセットのバージョンナンバー
keywords データセットを要約したキーワード
variableMeasured データセットが測定するもの(気温、気圧など)
creator.name データセットの作成者の名前

カタログの属性

データセットが属するカタログ(複数のデータセットをまとめたもの)を表す属性です。

属性 説明
includedInDataCatalog データセットが属するカタログに関する情報を記載

ダウンロードに関する属性

データセットをダウンロードできる場合、ダウンロードに関する情報を記載します。

属性 必須 説明
distribution ダウンロードに関する情報を記載
distribution.fileFormat 推奨 ファイル形式
distribution.contentUrl 必須 ダウンロードのためのURL

時間に関する属性

そのデータセットがカバーしている時間に関する情報を表す属性です。

属性 説明
temporalCoverage データセットがカバーする時間
例1: "temporalCoverage" : "2016-01-01"
例2: "temporalCoverage" : "2015-11-01/2016-04-01"

場所に関する属性

そのデータセットが計測された場所に関する情報を表す属性です。

属性 説明
spatialCoverage データセットが計測された場所

特定の場所を示す場合は"@type": "GeoCoordinates"を使います。

"spatialCoverage:" {
   "@type": "Place",
   "geo": {
     "@type": "GeoCoordinates",
     "latitude": 39.3280
     "longitude": 120.1633
   }
 }

特定のエリアを示す場合は"@type": "GeoCoordinates"を使います。

"spatialCoverage:" {
     "@type": "Place",
     "geo": {
       "@type": "GeoShape",
       "box": "39.3280 120.1633 40.445 123.7878"
     }
   }

場所の名前を示す場合は次のようになります。

"spatialCoverage:" "Tahoe City, CA"

データセットを使用している出版物に関する属性

データセットを使用している出版物がある場合、引用先として紹介することは役に立つ情報です。

属性 必須 説明
citation データセットについて記述している出版物

ライセンスに関する属性

ライセンス情報がある場合、ライセンスに関する情報を記載します。

属性 必須 説明
license データセットのライセンス

参考