メタデータに活用する・されるためのセマンティックな話を聞いてきた


セマンティックなマーク付けとメタデータ活用~『セマンティックHTML/XHTML』の出版を記念して~
| サイバーガーデンbiz

セミナーに行ってきた。

漠然とマイクロフォーマットのように共通化されたフォーマットの話かなぐらいの感覚で参加。本は買ってない。資料が公開されています。セマンティックHTML?
KISS!

===
2009-07-04 15:00-
@渋谷アジアビル2F
以下@マーク付きの部分はぼくの感想です

●神崎正英

ユニバーサルHTML/XHTMLを書いた理由

セマンティックHTML
「コンピュータに人間を助けることが出来るようにする」

同じHTMLの中に情報を一元化
@RESTfulとかmap.resourceとかみたいなもんか

1
同じ言葉でもことなる文脈で使われる
「コロンビア」コーヒー豆、国の名前
2
固有名詞を与える必要があるのではない
普通名詞を与える必要がある

名前(識別)とタイプ(型)と関係(相互)

URIとRDF
Resource description framework

主語と述語と内容
RDFとRSSはちがうよー

RSSはRDFのボキャブラリー

@JSONみたいなkey-valueじゃだめなの
と思ったらその話が出てきた

暗黙の主語を含めた「トリプル」
CSSのスタイル宣言と同じ

@「自分が何なのか」を知っている という意味で主語が必要というのならわかる

@RSSを書いたことがある人は
→はじめは意味もわからず真似して書く
→意味がわかって書く
→ライブラリに任せる
いままで苦労したとかどうでもよくて、ライブラリに任せるところから高速道路に乗っけるところからやればいいんじゃないの

@「スケーラビリティ」 スケールするかどうかじゃなくて
汎用性可用性の意味か

文書メタデータ
暗黙の主語としての文書

@それ(文書)以外あるの?

メタデータの目的語
メタデータについて、さらにメタデータを持つ場合とそれ以上メタデータを持たない場合
木構造のノードとリーフ
メタデータを持たない場合 リテラル(属性型メタデータ)
メタデータを持つ場合 URI(関係型メタデータ)

RDFa
body要素の中でもメタデータを格納できる

RDFのビジュアルグラフ
まるでかかれたもの URI
しかくでかかれたもの リテラル

余談
クリエィティブコモンズとRDF
licenseは接頭辞無しでできる

@CMSで統一させたりすると、文書のライセンスってサイトで統一した仕様になりそう
このページの内容は明示している部分を除いてcc-byです という涙目展開

ボキャブラリーの分散化

@で、何に使えるのというキラーアプリの不存在
AutoPageRize, LivedoorFullSpeed

メタデータの主語がISBN
@でもISBNってユーザ側からメタデータ引っ張れないよね…
ASINに読み替えてAmazonからメタデータ取るとかしか出来ない

空白ノード
@無名××みたいなもの?

メタデータのチェーン
要素の中に要素があったら外側のプロパティの目的語を内側のプロパティの主語と読み替える

@標準のスケルトンが欲しい

@現在のSEOのように何らかの優遇措置・メリットがないと浸透はしないな
データマイニングにはこれがあれば便利だとは思うけれど、これでないほうのコンテンツのほうが圧倒的多数である以上、それを対応しなければいけない

コンピュータに見せたい内容と中身のデータを分けたいときには
content属性を中身とする

content="2009-07-04"
表示 "7月4日"

インライン要素が黙示的にcontent要素になるが、content要素を明示してやれば、指定が出来る

@→人間と機械に同じものを見せよう それで解釈を分けよう という基本理念と矛盾しない?

@APIでdate型のデータを取り出して、それを変形してやるというようにならなければいけない

@今、サイトのhtmlページ全体を作成する人って大多数なの?
みんなブログやwikiやsnsつかうのでは
ユーザの可編集領域

ドメインのURIをつかってその人のURIとしてしまう その是非というか非

文書URIを利用した間接識別
実際のものとオンライン上のものの区別

@オンライン上のもののURIだって間接識別なんじゃないの?
日付にしても、ファイルの更新日時だったり、
そのURIで表される空間にアクセスできることが可能になった日時だったり、
もっといえば検索に出てこないものは存在しないもの、という概念をとれば
googleがクロールした日時なのかもしれないし、google検索に出てくるようになった日時かもしれない

調理済み編については
明日アップします(神崎)

rel属性は定義済みと名前空間指定のもの以外無視されるので安心
ふやしておk

YahooによるRDFaサポート
なんでもいいから構造化してね いろいろ

GoogleによるRFDaサポート
googleの語彙を使って構造化してね

@RDFaなりなんなりの意味で構造化されたものだけが見られるブラウザがあれば
(あるんだろうけど)、イメージがしやすいように思う
htmlパーサ

●html5
ブラウザを中心としたプラットフォームの標準化
仕様が実装に追いついてくるのであれば好意的・健全にとらえていい

●メタデータが付与されたリソースが増える場所
発見可能にするもの(したいもの)についてメタデータが活用されていく
時間と場所
評判・レコメンデーション
スピーディさがもとめられるもの

●なにがほしい?神崎さん
ネットラジオの番組表

●企業の担当者に納得してもらう方法 説得する方法
たとえばデータがRDBMSにあるならわざわざ出し分けする必要がない
今文字列としてしか扱われていないものを
何らかのルール付けをしてマークアップ→それをマークアップ変換で出力する
文書を作る人が特殊なコストをかけるのは本末転倒

●大きな規模での活用事例
欧米の政府系
RDFに積極的

民間だと、digg, slideshareがそういうのを出してる

サーチエンジンオプティマイズの考え方
商品詳細ページ

●何を何に使う?
カレンダーに取り込んで欲しいとかあるならセマンティックwebの考え方を使おう
マイクロフォーマットで十分ならマイクロフォーマットを使うのがいいよね
ただ、その先を考えたらRDFaだよね

●よりよいメタデータの実装が出てくるか
ふくまれるんじゃね

●「日本のwebは残念」か?
元データに当たってないからわからないけど
「webに日本も外国もない」

文書構造とデータ構造の二重化
@DRYじゃないな

www.kanzaki.comのページ数
アクセスログで確認したら1週間で16000ユニークリソース
@なんだってー

●twitterとセマンティックweb
惜しいのはハッシュタグには文脈がない
セマンティック
===

講演会
Keep
 会場運営ありがとうございました
 そんなにかみ含めて説明しなくてもわかるよ、と思っていてももう一度きくと
 実はわかっていなかったことが残っていて、そのわかっていなかったことがわかったことに気付かされる ふしぎ!
Problem
 懇親会にもっと人呼べばいいのに
Try

じぶん
Keep
 ほぼ時間通りに到着できた ちょっと遅れたけど
 話にちゃんとついていけた(これは講師に依るところが大きいけど)
Problem
 薄い上着を忘れた
 懇親会までいたのに質問しそびれた
 みんな神崎さんの話が聞きたかったと思うのにずっと神崎さんのテーブルにいた ごめんね
Try
 htmlはこわいものじゃない もうちょっとまじめに取り組もうと思った
 と思ってユニバーサルHTML/XHTML読んでる

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中