データセット(Datasets)の構造化データをマークアップする方法

データセット(Datasets)の構造化データをマークアップする方法

Photo by Igor Ovsyannykov via Unsplash

データセット(Datasets)の構造化データをマークアップする方法を紹介します。

データセット(Datasets)は、科学的なデータや統計データなど、Web上に存在する様々なデータのことです。

データセットには有用なものが多数ありますが、検索エンジンはそれらのデータを正確に理解できるとは限りません。

そこで、それらのデータをデータセット(Datasets)としてマークアップすることで、検索エンジンがより正確に情報を理解する助けになります。

データセットには次のようなものが存在します。

  • データを含む表、またはCSVファイル
  • データを含む独自の形式のファイル
  • 複数のファイルが合わさることで意味を持つデータファイルのセット
  • 特別なツールでの処理に使用するためのデータ
  • データのキャプチャ画像
  • その他のあらゆるデータセット

JSON-LDでマークアップ

データセット(Datasets)の構造化データをJSON-LDでマークアップする方法です。JSON-LDはページのどこに記述しても問題ありませんが、通常は<head>タグ内に記述します。

<script type="application/ld+json">
{
  "@context":"http://schema.org/",
  "@type":"Dataset",
  "name":"NCDC Storm Events Database",
  "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
  "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
  "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
  "keywords":[
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
     "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
  ],
  "creator":{
     "@type":"Organization",
     "url": "https://www.ncei.noaa.gov/",
     "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
     "contactPoint":{
        "@type":"ContactPoint",
        "contactType": "customer service",
        "telephone":"+1-828-271-4800",
        "email":"[email protected]"
     }
  },
  "includedInDataCatalog":{
     "@type":"DataCatalog",
     "name":"data.gov"
  },
  "distribution":[
     {
        "@type":"DataDownload",
        "encodingFormat":"CSV",
        "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
     },
     {
        "@type":"DataDownload",
        "encodingFormat":"XML",
        "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
     }
  ],
  "temporalCoverage":"1950-01-01/2013-12-18",
  "spatialCoverage":{
     "@type":"Place",
     "geo":{
        "@type":"GeoShape",
        "box":"18.0 -65.0 72.0 172.0"
     }
  }
}
</script>

属性の解説

データセット(Datasets)の構造化データの属性は次のようになります。

基本的な属性

基本的な属性です。

属性説明
nameデータセットの名前
descriptionデータセットの短い説明
urlデータセットを掲載しているページのURL
sameAsデータセットにあくせすするために使われるその他のページのURL
versionデータセットのバージョンナンバー
keywordsデータセットを要約したキーワード
variableMeasuredデータセットが測定するもの(気温、気圧など)
creator.nameデータセットの作成者の名前

カタログの属性

データセットが属するカタログ(複数のデータセットをまとめたもの)を表す属性です。

属性説明
includedInDataCatalogデータセットが属するカタログに関する情報を記載

ダウンロードに関する属性

データセットをダウンロードできる場合、ダウンロードに関する情報を記載します。

属性必須説明
distributionダウンロードに関する情報を記載
distribution.fileFormat推奨ファイル形式
distribution.contentUrl必須ダウンロードのためのURL

時間に関する属性

そのデータセットがカバーしている時間に関する情報を表す属性です。

属性説明
temporalCoverageデータセットがカバーする時間
例1: "temporalCoverage" : "2016-01-01"
例2: "temporalCoverage" : "2015-11-01/2016-04-01"

場所に関する属性

そのデータセットが計測された場所に関する情報を表す属性です。

属性説明
spatialCoverageデータセットが計測された場所

特定の場所を示す場合は"@type": "GeoCoordinates"を使います。

"spatialCoverage:" {
   "@type": "Place",
   "geo": {
     "@type": "GeoCoordinates",
     "latitude": 39.3280
     "longitude": 120.1633
   }
 }

特定のエリアを示す場合は"@type": "GeoCoordinates"を使います。

"spatialCoverage:" {
     "@type": "Place",
     "geo": {
       "@type": "GeoShape",
       "box": "39.3280 120.1633 40.445 123.7878"
     }
   }

場所の名前を示す場合は次のようになります。

"spatialCoverage:" "Tahoe City, CA"

データセットを使用している出版物に関する属性

データセットを使用している出版物がある場合、引用先として紹介することは役に立つ情報です。

属性必須説明
citationデータセットについて記述している出版物

ライセンスに関する属性

ライセンス情報がある場合、ライセンスに関する情報を記載します。

属性必須説明
licenseデータセットのライセンス

参考