データセット(Datasets)の構造化データをマークアップする方法を紹介します。
データセット(Datasets)は、科学的なデータや統計データなど、Web上に存在する様々なデータのことです。
データセットには有用なものが多数ありますが、検索エンジンはそれらのデータを正確に理解できるとは限りません。
そこで、それらのデータをデータセット(Datasets)としてマークアップすることで、検索エンジンがより正確に情報を理解する助けになります。
データセットには次のようなものが存在します。
- データを含む表、またはCSVファイル
- データを含む独自の形式のファイル
- 複数のファイルが合わさることで意味を持つデータファイルのセット
- 特別なツールでの処理に使用するためのデータ
- データのキャプチャ画像
- その他のあらゆるデータセット
JSON-LDでマークアップ
データセット(Datasets)の構造化データをJSON-LDでマークアップする方法です。JSON-LDはページのどこに記述しても問題ありませんが、通常は<head>
タグ内に記述します。
<script type="application/ld+json"> { "@context":"http://schema.org/", "@type":"Dataset", "name":"NCDC Storm Events Database", "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...", "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database", "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510", "keywords":[ "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG", "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE" ], "creator":{ "@type":"Organization", "url": "https://www.ncei.noaa.gov/", "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce", "contactPoint":{ "@type":"ContactPoint", "contactType": "customer service", "telephone":"+1-828-271-4800", "email":"[email protected]" } }, "includedInDataCatalog":{ "@type":"DataCatalog", "name":"data.gov" }, "distribution":[ { "@type":"DataDownload", "encodingFormat":"CSV", "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp" }, { "@type":"DataDownload", "encodingFormat":"XML", "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510" } ], "temporalCoverage":"1950-01-01/2013-12-18", "spatialCoverage":{ "@type":"Place", "geo":{ "@type":"GeoShape", "box":"18.0 -65.0 72.0 172.0" } } } </script>
属性の解説
データセット(Datasets)の構造化データの属性は次のようになります。
基本的な属性
基本的な属性です。
属性 | 説明 |
---|---|
name | データセットの名前 |
description | データセットの短い説明 |
url | データセットを掲載しているページのURL |
sameAs | データセットにあくせすするために使われるその他のページのURL |
version | データセットのバージョンナンバー |
keywords | データセットを要約したキーワード |
variableMeasured | データセットが測定するもの(気温、気圧など) |
creator.name | データセットの作成者の名前 |
カタログの属性
データセットが属するカタログ(複数のデータセットをまとめたもの)を表す属性です。
属性 | 説明 |
---|---|
includedInDataCatalog | データセットが属するカタログに関する情報を記載 |
ダウンロードに関する属性
データセットをダウンロードできる場合、ダウンロードに関する情報を記載します。
属性 | 必須 | 説明 |
---|---|---|
distribution | – | ダウンロードに関する情報を記載 |
distribution.fileFormat | 推奨 | ファイル形式 |
distribution.contentUrl | 必須 | ダウンロードのためのURL |
時間に関する属性
そのデータセットがカバーしている時間に関する情報を表す属性です。
属性 | 説明 |
---|---|
temporalCoverage | データセットがカバーする時間 例1: "temporalCoverage" : "2016-01-01" 例2: "temporalCoverage" : "2015-11-01/2016-04-01" |
場所に関する属性
そのデータセットが計測された場所に関する情報を表す属性です。
属性 | 説明 |
---|---|
spatialCoverage | データセットが計測された場所 |
特定の場所を示す場合は"@type": "GeoCoordinates"
を使います。
"spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoCoordinates", "latitude": 39.3280 "longitude": 120.1633 } }
特定のエリアを示す場合は"@type": "GeoCoordinates"
を使います。
"spatialCoverage:" { "@type": "Place", "geo": { "@type": "GeoShape", "box": "39.3280 120.1633 40.445 123.7878" } }
場所の名前を示す場合は次のようになります。
"spatialCoverage:" "Tahoe City, CA"
データセットを使用している出版物に関する属性
データセットを使用している出版物がある場合、引用先として紹介することは役に立つ情報です。
属性 | 必須 | 説明 |
---|---|---|
citation | – | データセットについて記述している出版物 |
ライセンスに関する属性
ライセンス情報がある場合、ライセンスに関する情報を記載します。
属性 | 必須 | 説明 |
---|---|---|
license | – | データセットのライセンス |